最大输出 token

快速结论

最大输出 token 是模型在单次响应中能生成的最大 token 数上限。它通常远小于上下文窗口 —— GPT-5.5 上下文窗口是 100 万 token,但最大输出限制为 128K。

上下文窗口与最大输出 token 是独立的限制。上下文窗口为 100 万的模型,其输出上限可能是 8K、32K 或 128K,取决于具体模型。

  • GPT-5.5 / GPT-5.4:上下文 100 万,最大输出 128K。
  • Claude Opus 4.8 / Sonnet 4.6:上下文 100 万,最大输出 128K。
  • Gemini 3.1 Pro:上下文 100 万,最大输出 64K。

如果你做长内容生成(长文章、大型代码仓库的重构),最大输出往往才是真正的约束。

相关术语