COMPUTE WARS · BOOTSTRAPPING

Magik LLM
Gathering

Selando o pacto…
Pular para o conteúdo
Training Stack llm-era 2018 technique

Pre-training

Fase 1 do treino: modelo aprende a prever próximo token em terabytes de texto bruto.

RESUMO

Etapa mais cara (~$50-500M para modelo frontier). Aprende gramática, fatos, padrões. Não obedece instruções — só completa texto.

Tags: foundational · expensive

VEJA TAMBÉM