COMPUTE WARS · BOOTSTRAPPING

Magik LLM
Gathering

Selando o pacto…
Pular para o conteúdo
Deep Learning Era dl-era 2015 architecture

ResNet

Skip connections permitem treinar redes com 100+ camadas (antes: instável após ~20).

RESUMO

He et al. (Microsoft, 2015). 'Identity shortcut' deixa gradientes fluírem em redes profundas. Praticamente toda CNN moderna usa residuals — incluindo blocos Transformer.

Tags: cnn · residual-connection

VEJA TAMBÉM