COMPUTE WARS · BOOTSTRAPPING

Magik LLM
Gathering

Selando o pacto…
Pular para o conteúdo
TRILHA · COMPUTE WARS

LLM Era

Modelos generativos de linguagem (2017 → presente)

11 conceitos · ordenados cronologicamente


2017
concept ◇ LONG-FORM

Attention Is All You Need (2017)

Paper da Google que introduziu o Transformer — eliminou recorrência, atenção pura. Origin point dos LLMs.

2018
system ◇ LONG-FORM

BERT (2018)

Google, encoder-only Transformer treinado com masked language modeling — virou backbone de toda busca.

2018
system

GPT-1 (2018)

Primeiro 'Generative Pre-trained Transformer' — provou que pre-training + fine-tuning escala.

2019
system

GPT-2 (2019)

1.5B params. OpenAI inicialmente disse 'too dangerous to release' — virou meme histórico.

2020
system

GPT-3 (2020)

175B params. Provou few-shot learning — o modelo não precisa fine-tune, basta dar exemplos no prompt.

2020
phenomenon

In-Context Learning

Capacidade de LLMs aprenderem padrões de novos tasks apenas vendo exemplos no prompt, sem atualizar pesos.

2022
system

ChatGPT (2022)

Nov 30, 2022. Atingiu 100M usuários em 2 meses — produto consumer mais rápido a escalar na história.

2023
system

Claude

Família de LLMs da Anthropic treinada com Constitutional AI, focada em segurança, contexto longo e raciocínio.

2024
system

o1 / o3 (Reasoning Models)

OpenAI, 2024-2025. Treinados via RL para 'pensar antes de responder' — long chain-of-thought interno.

2024
system

Phi-3

Família de SLMs da Microsoft que prova que dados de alta qualidade ("textbooks are all you need") batem escala bruta.

2025
system

DeepSeek R1 (2025)

Janeiro 2025. China replicou o1-level reasoning em open-weights — choque geopolítico imediato.