思考 token

快速结论

思考 token 是推理模型在给出可见回答之前内部生成的隐藏推理步骤。在大多数提供商那里，即使用户看不到，它们也按输出 token 计费。

推理模型（OpenAI 的 o 系列 / GPT-5.5 Thinking、Anthropic 的 extended thinking、Gemini Thinking、DeepSeek R1）把工作分为两个阶段：内部思维链和最终面向用户的回答。内部思维链会付费但不可见。

这会显著改变"推理"工作负载的成本结构。一个 200 字可见的回答可能因为思考 token 而等价于 1500 字的输出。请始终确认提供商是否将思考按输出计费（多数是），并在建模时纳入考量。

相关术语