最大输出 token

快速结论

最大输出 token 是模型在单次响应中能生成的最大 token 数上限。它通常远小于上下文窗口 —— GPT-5.5 上下文窗口是 100 万 token，但最大输出限制为 128K。

上下文窗口与最大输出 token 是独立的限制。上下文窗口为 100 万的模型，其输出上限可能是 8K、32K 或 128K，取决于具体模型。

如果你做长内容生成（长文章、大型代码仓库的重构），最大输出往往才是真正的约束。

相关术语