COMPUTE WARS · BOOTSTRAPPING

Magik LLM
Gathering

Selando o pacto…
Pular para o conteúdo
Deep Learning Era dl-era 1997 architecture

LSTM

Rede recorrente com gates (forget/input/output) que aprende dependências longas em sequências.

RESUMO

Hochreiter & Schmidhuber (1997). Dominou NLP/speech 2014-2017. Substituída pelo Transformer, mas ressurgindo via SSM/Mamba (que são RNNs reformuladas).

Tags: rnn · sequence · memory-cell

VEJA TAMBÉM