上下文窗口

快速结论

上下文窗口是模型在单次请求中能处理的最大 token 数（输入 + 输出）。截至 2026-06-17，GPT-5.5 和 Claude Opus 4.8 都支持 100 万 token 的上下文窗口。

上下文窗口决定了模型一次能"看到"多少内容：长文档、大型代码库、多轮聊天历史。截至 2026-06-17，前沿文本模型集中在 100 万 token：

GPT-5.5 / GPT-5.4 — 100 万 token（1,048,576）。
Claude Opus 4.8 / Sonnet 4.6 / Haiku 4.5 — 100 万 token（Haiku 4.5 为 200K）。
Gemini 3.1 Pro — 100 万 token。
DeepSeek V4 Pro — 100 万 token。

注意：某些提供商在超过阈值后定价不同。Gemini 2.5 Pro 在提示超过 200K token 后输入价翻倍。对于长上下文工作负载，请务必查看分级定价。

相关术语

最大输出 token

最大输出 token 是模型在单次响应中能生成的最大 token 数上限。它通常远小于上下文窗口 —— GPT-5.5 上下文窗口是 100 万 token，但最大输出限制为 128K。…