Test-Time Compute / Inference Scaling
Modelo gasta MAIS tokens 'pensando' durante inferência → melhor resposta. Lei de escala paralela ao pre-training.
RESUMO
OpenAI o1 (set 2024) demonstrou: mais 'thinking tokens' antes do output final melhora reasoning logaritmicamente. Mudou economia de inferência — modelos de reasoning custam 10-100× por query.
Tags: reasoning · scaling-law · inference
VEJA TAMBÉM