输入 token 与输出 token
快速结论
输入 token 是你提示中的 token(系统 + 用户消息 + 检索上下文)。输出 token 是模型生成的 token。提供商几乎总是对输出收费更高,因为生成成本更高。
输入/输出拆分是理解 LLM 定价最重要的概念。典型前沿模型对每百万 token 输出的收费约为输入的 5–10 倍:
- GPT-5.5:$5.00 输入 / $30.00 输出 每百万(输出高 6 倍)。
- Claude Opus 4.8:$5.00 输入 / $25.00 输出 每百万(输出高 5 倍)。
- Gemini 2.5 Pro:$1.25 输入 / $10.00 输出 每百万(输出高 8 倍)。
这意味着产生长响应的工作负载(长文写作、Agent 循环、代码生成)应按输出量来建模,而不仅仅是输入。