COMPUTE WARS · BOOTSTRAPPING

Magik LLM
Gathering

Selando o pacto…
Pular para o conteúdo
The Founders' Era dl-era 1989 person

Yann LeCun

Pai das CNNs (LeNet, 1989). Chief AI Scientist da Meta. Nobel de Comp 2018 (Turing Award).

O quê

Yann LeCun (n. 1960) é o francês que ensinou computadores a ver. Cientista-chefe de IA da Meta desde 2013, professor da NYU, co-laureado do Turing Award 2018 junto com Hinton e Bengio, é o arquiteto principal das redes neurais convolucionais (CNNs) — a família de arquiteturas que dominou visão computacional dos anos 1990 até a chegada dos Vision Transformers no fim dos anos 2010.

Três marcos centrais:

  1. LeNet (1989) — primeira CNN treinada com backpropagation, aplicada a reconhecimento de CEPs manuscritos para o U.S. Postal Service.
  2. LeNet-5 (1998) — versão refinada, deployed em sistemas comerciais de leitura automática de cheques pelo grupo NCR/AT&T. No auge, processava ~10% de todos os cheques manuscritos dos EUA [VERIFICAR — número exato].
  3. Pivô intelectual atual — desde ~2022, é a voz pública mais consistente contra o LLM-doomerism, defendendo que linguagem sozinha é insuficiente para inteligência geral. Sua aposta: JEPA (Joint-Embedding Predictive Architecture) e world models como caminho alternativo.

Como funciona

A contribuição de LeCun é elegante. Redes totalmente conectadas (MLPs) tratam cada pixel como input independente — desperdiçando a estrutura local e a invariância translacional das imagens. Um gato no canto superior esquerdo e o mesmo gato no canto inferior direito ativam pesos completamente diferentes; a rede precisa aprender “gato” duas vezes.

CNN resolve com três ideias compostas:

  1. Convolução — em vez de pesos individuais por pixel, um pequeno kernel (ex.: 5×5) desliza por toda a imagem, aplicando os mesmos pesos em cada posição. A rede aprende features (bordas, texturas, padrões) que valem em qualquer lugar da imagem.
  2. Pooling — após convolução, agrupar regiões (ex.: max pooling 2×2) reduz dimensionalidade e dá tolerância a pequenas translações.
  3. Hierarquia profunda — empilhar camadas convolucionais permite que features simples (bordas) virem features compostas (formas) virem objetos. Hoje chamamos isso de representações hierárquicas aprendidas.

LeNet-5 (1998) tinha 7 camadas, ~60.000 parâmetros. Treinada em MNIST (60.000 dígitos manuscritos), atingiu erro de ~0.95% — competitivo com SVMs da época, mas com a vantagem decisiva: escalava. Quando GPUs e dados chegaram em 2012, AlexNet (2012) foi essencialmente uma LeNet inflada.

A inspiração de LeCun veio do trabalho de Hubel e Wiesel (Nobel de Medicina 1981) sobre o córtex visual de gatos — neurônios simples detectam bordas em orientações específicas, neurônios complexos integram. CNN é, declaradamente, uma abstração computacional desse circuito biológico.

Por que importa

CNN definiu a década de visão computacional (2012–2020). AlexNet (2012), VGG (2014), GoogLeNet (2014), ResNet (2015), DenseNet (2017), EfficientNet (2019) — toda a árvore genealógica do reconhecimento de imagem moderno é descendente direta da LeNet. Self-driving cars, diagnóstico por imagem, reconhecimento facial, geração de imagens (Stable Diffusion ainda usa convoluções em partes do UNet) — todos sobre fundações de LeCun.

Persistência durante o segundo inverno. Como Hinton e Bengio, LeCun manteve pesquisa em redes neurais nos anos 1990 e 2000, quando SVMs e métodos kernel dominavam ML. A revanche veio com ImageNet — e o Turing Award 2018 selou o reconhecimento.

Voz dissonante na era LLM. Desde 2022, LeCun argumenta publicamente — em palestras na NYU, ensaios e debates no Twitter/X — que:

  • LLMs são dead ends para AGI: não têm modelo causal do mundo, não planejam, não persistem memória.
  • O caminho está em world models treinados em vídeo e interação física, não em texto.
  • JEPA (LeCun, 2022, “A Path Towards Autonomous Machine Intelligence”) propõe arquitetura que aprende a prever embeddings de estados futuros, não pixels.

Essa posição o colocou em colisão pública com Hinton (existential risk doomer moderado) e com Altman/Amodei (scaling LLMs basta). É um dos três debates estruturais da IA contemporânea.

Cultura open-source na Meta. Sob sua liderança, Meta liberou Llama (2023) e Llama 2/3/4 (2023-2025) como pesos abertos — provavelmente a maior decisão corporativa de open-weights da história. Mudou a economia de inferência, criou ecossistema independente da OpenAI/Anthropic, e ajudou DeepSeek, Mistral e dezenas de outros a treinar modelos derivados.

Estado em 2026

  • VP & Chief AI Scientist da Meta desde 2013 (Facebook AI Research, depois Meta AI). Conduz Meta FAIR, equipe de ~600 pesquisadores [VERIFICAR — número exato].
  • Professor na NYU (Courant Institute), Silver Professor of Computer Science.
  • Llama 4 lançado em ~2025 [VERIFICAR data exata]; estratégia open-weights continua.
  • JEPA evoluiu para V-JEPA (vídeo, 2024) e está integrado em Project Aria / smart glasses da Meta como modelo de percepção [VERIFICAR — pode ser exagero comercial].
  • Debate público contínuo com Hinton, Bengio (ex-aliados Turing) sobre risco existencial — LeCun chama de “preocupações infantis sobre superinteligência”.
  • Em Magik LLM Gathering, LeCun ocupa o arquétipo do Convolver — quem reconhece padrões locais e os compõe em entendimento global; também o cético confiante que duvida do consenso atual.

Tratamento de carta — proposta

LeCun, The Convolver Avatar Lendário · Founders · custo 🟪🟨

3/4.

Sliding Kernel: Toda vez que você joga um Modelo com keyword “Vision”, revele o topo do seu deck — se for outro Modelo “Vision”, ponha-o em jogo sem pagar custo.

Open Weights: Modelos seus podem ser copiados por aliados (efeitos de cooperação multijogador). Você não pode bloquear cópias do oponente também.

“You can’t get to intelligence by predicting the next word.”

A primeira mecânica é a convolução: o mesmo kernel deslizando produz cascata de detecções. A segunda é a filosofia open-source transformada em regra de jogo — você não controla quem usa o que você libera.

Veja também

AlexNet (2012) · Geoffrey Hinton · Backpropagation · Perceptron · ImageNet

VEJA TAMBÉM
FONTES
  • LeCun, Y., Boser, B., Denker, J. S., Henderson, D., Howard, R. E., Hubbard, W., Jackel, L. D. (1989). Backpropagation Applied to Handwritten Zip Code Recognition. Neural Computation, 1(4).
  • LeCun, Y., Bottou, L., Bengio, Y., Haffner, P. (1998). Gradient-based learning applied to document recognition. Proceedings of the IEEE, 86(11).
  • LeCun, Y., Bengio, Y., Hinton, G. (2015). Deep learning. Nature, 521.
  • Turing Award citation (2018). ACM.