COMPUTE WARS · BOOTSTRAPPING

Magik LLM
Gathering

Selando o pacto…
Pular para o conteúdo
Inference & Tokens agentic-era 2022 concept

Input/Output Token Pricing

Tokens de input e output têm preços diferentes — output custa 2-5× mais. Saber isso muda como você escreve prompts.

RESUMO

Exemplo 2026: Claude Opus 4 ~$15/M input, $75/M output. GPT-4o ~$2.5/M input, $10/M output. Prompts longos com saídas curtas são baratos; agentes (long output) explodem custos. Caching cuts input pricing em ~10×.

Tags: economics · api · cost

VEJA TAMBÉM