Chain-of-Thought (CoT)
Adicione 'pense passo a passo' — o modelo escreve raciocínio antes da resposta, melhorando dramaticamente em problemas de lógica/matemática.
RESUMO
Wei et al. (Google, 2022). Emergente em escala — modelos pequenos não se beneficiam. Base do o1/o3 (que internalizam CoT via RL). Influenciou tudo: ReAct, ToT, self-consistency.
Tags: reasoning · watershed · step-by-step
VEJA TAMBÉM