The Founders' Eradl-era1989person

Yann LeCun

Pai das CNNs (LeNet, 1989). Chief AI Scientist da Meta. Nobel de Comp 2018 (Turing Award).

O quê

Yann LeCun (n. 1960) é o francês que ensinou computadores a ver. Cientista-chefe de IA da Meta desde 2013, professor da NYU, co-laureado do Turing Award 2018 junto com Hinton e Bengio, é o arquiteto principal das redes neurais convolucionais (CNNs) — a família de arquiteturas que dominou visão computacional dos anos 1990 até a chegada dos Vision Transformers no fim dos anos 2010.

Três marcos centrais:

LeNet (1989) — primeira CNN treinada com backpropagation, aplicada a reconhecimento de CEPs manuscritos para o U.S. Postal Service.
LeNet-5 (1998) — versão refinada, deployed em sistemas comerciais de leitura automática de cheques pelo grupo NCR/AT&T. No auge, processava ~10% de todos os cheques manuscritos dos EUA [VERIFICAR — número exato].
Pivô intelectual atual — desde ~2022, é a voz pública mais consistente contra o LLM-doomerism, defendendo que linguagem sozinha é insuficiente para inteligência geral. Sua aposta: JEPA (Joint-Embedding Predictive Architecture) e world models como caminho alternativo.

Como funciona

A contribuição de LeCun é elegante. Redes totalmente conectadas (MLPs) tratam cada pixel como input independente — desperdiçando a estrutura local e a invariância translacional das imagens. Um gato no canto superior esquerdo e o mesmo gato no canto inferior direito ativam pesos completamente diferentes; a rede precisa aprender “gato” duas vezes.

CNN resolve com três ideias compostas:

Convolução — em vez de pesos individuais por pixel, um pequeno kernel (ex.: 5×5) desliza por toda a imagem, aplicando os mesmos pesos em cada posição. A rede aprende features (bordas, texturas, padrões) que valem em qualquer lugar da imagem.
Pooling — após convolução, agrupar regiões (ex.: max pooling 2×2) reduz dimensionalidade e dá tolerância a pequenas translações.
Hierarquia profunda — empilhar camadas convolucionais permite que features simples (bordas) virem features compostas (formas) virem objetos. Hoje chamamos isso de representações hierárquicas aprendidas.

LeNet-5 (1998) tinha 7 camadas, ~60.000 parâmetros. Treinada em MNIST (60.000 dígitos manuscritos), atingiu erro de ~0.95% — competitivo com SVMs da época, mas com a vantagem decisiva: escalava. Quando GPUs e dados chegaram em 2012, AlexNet (2012) foi essencialmente uma LeNet inflada.

A inspiração de LeCun veio do trabalho de Hubel e Wiesel (Nobel de Medicina 1981) sobre o córtex visual de gatos — neurônios simples detectam bordas em orientações específicas, neurônios complexos integram. CNN é, declaradamente, uma abstração computacional desse circuito biológico.

Por que importa

CNN definiu a década de visão computacional (2012–2020). AlexNet (2012), VGG (2014), GoogLeNet (2014), ResNet (2015), DenseNet (2017), EfficientNet (2019) — toda a árvore genealógica do reconhecimento de imagem moderno é descendente direta da LeNet. Self-driving cars, diagnóstico por imagem, reconhecimento facial, geração de imagens (Stable Diffusion ainda usa convoluções em partes do UNet) — todos sobre fundações de LeCun.

Persistência durante o segundo inverno. Como Hinton e Bengio, LeCun manteve pesquisa em redes neurais nos anos 1990 e 2000, quando SVMs e métodos kernel dominavam ML. A revanche veio com ImageNet — e o Turing Award 2018 selou o reconhecimento.

Voz dissonante na era LLM. Desde 2022, LeCun argumenta publicamente — em palestras na NYU, ensaios e debates no Twitter/X — que:

LLMs são dead ends para AGI: não têm modelo causal do mundo, não planejam, não persistem memória.
O caminho está em world models treinados em vídeo e interação física, não em texto.
JEPA (LeCun, 2022, “A Path Towards Autonomous Machine Intelligence”) propõe arquitetura que aprende a prever embeddings de estados futuros, não pixels.

Essa posição o colocou em colisão pública com Hinton (existential risk doomer moderado) e com Altman/Amodei (scaling LLMs basta). É um dos três debates estruturais da IA contemporânea.

Cultura open-source na Meta. Sob sua liderança, Meta liberou Llama (2023) e Llama 2/3/4 (2023-2025) como pesos abertos — provavelmente a maior decisão corporativa de open-weights da história. Mudou a economia de inferência, criou ecossistema independente da OpenAI/Anthropic, e ajudou DeepSeek, Mistral e dezenas de outros a treinar modelos derivados.

Estado em 2026

VP & Chief AI Scientist da Meta desde 2013 (Facebook AI Research, depois Meta AI). Conduz Meta FAIR, equipe de ~600 pesquisadores [VERIFICAR — número exato].
Professor na NYU (Courant Institute), Silver Professor of Computer Science.
Llama 4 lançado em ~2025 [VERIFICAR data exata]; estratégia open-weights continua.
JEPA evoluiu para V-JEPA (vídeo, 2024) e está integrado em Project Aria / smart glasses da Meta como modelo de percepção [VERIFICAR — pode ser exagero comercial].
Debate público contínuo com Hinton, Bengio (ex-aliados Turing) sobre risco existencial — LeCun chama de “preocupações infantis sobre superinteligência”.
Em Magik LLM Gathering, LeCun ocupa o arquétipo do Convolver — quem reconhece padrões locais e os compõe em entendimento global; também o cético confiante que duvida do consenso atual.

Tratamento de carta — proposta

LeCun, The Convolver Avatar Lendário · Founders · custo

3/4.

Sliding Kernel: Toda vez que você joga um Modelo com keyword “Vision”, revele o topo do seu deck — se for outro Modelo “Vision”, ponha-o em jogo sem pagar custo.

Open Weights: Modelos seus podem ser copiados por aliados (efeitos de cooperação multijogador). Você não pode bloquear cópias do oponente também.

“You can’t get to intelligence by predicting the next word.”

A primeira mecânica é a convolução: o mesmo kernel deslizando produz cascata de detecções. A segunda é a filosofia open-source transformada em regra de jogo — você não controla quem usa o que você libera.

Veja também

AlexNet (2012) · Geoffrey Hinton · Backpropagation · Perceptron · ImageNet

Feito pela Magik LLM Gathering

Isto que você acabou de ler é o nosso trabalho.

A Magik LLM Gathering constrói produtos de IA de verdade — e escreve sobre eles em português, sem hype. Se quiser conversar sobre o seu, deixe seu contato.

FONTES

LeCun, Y., Boser, B., Denker, J. S., Henderson, D., Howard, R. E., Hubbard, W., Jackel, L. D. (1989). Backpropagation Applied to Handwritten Zip Code Recognition. Neural Computation, 1(4).
LeCun, Y., Bottou, L., Bengio, Y., Haffner, P. (1998). Gradient-based learning applied to document recognition. Proceedings of the IEEE, 86(11).
LeCun, Y., Bengio, Y., Hinton, G. (2015). Deep learning. Nature, 521.
Turing Award citation (2018). ACM.