COMPUTE WARS · BOOTSTRAPPING

Magik LLM
Gathering

Selando o pacto…
Pular para o conteúdo
Inference & Tokens agentic-era 2024 phenomenon

Test-Time Compute / Inference Scaling

Modelo gasta MAIS tokens 'pensando' durante inferência → melhor resposta. Lei de escala paralela ao pre-training.

RESUMO

OpenAI o1 (set 2024) demonstrou: mais 'thinking tokens' antes do output final melhora reasoning logaritmicamente. Mudou economia de inferência — modelos de reasoning custam 10-100× por query.

Tags: reasoning · scaling-law · inference

VEJA TAMBÉM