ResNet
Skip connections permitem treinar redes com 100+ camadas (antes: instável após ~20).
RESUMO
He et al. (Microsoft, 2015). 'Identity shortcut' deixa gradientes fluírem em redes profundas. Praticamente toda CNN moderna usa residuals — incluindo blocos Transformer.
Tags: cnn · residual-connection
VEJA TAMBÉM