단순히 activation만 하는것이 아니라 시간적인 흐름을 조절해서 메모리를 잊어버릴지 유지할지 제어하는 네트워크가 심어져 있다.
3gates : ft, it, ot 2 outputs: ht, Ct 4 params: Wi, Wf, Wo, Wh
이미지 참고: colah’s blog
c와 d를 가지고 다음 언어를 예측할 수 있다. 이 때, 단어 예측을 위한 f는 Neural Network를 사용한다.