上下文窗口

快速结论

上下文窗口是模型在单次请求中能处理的最大 token 数(输入 + 输出)。截至 2026-06-17,GPT-5.5 和 Claude Opus 4.8 都支持 100 万 token 的上下文窗口。

上下文窗口决定了模型一次能"看到"多少内容:长文档、大型代码库、多轮聊天历史。截至 2026-06-17,前沿文本模型集中在 100 万 token

  • GPT-5.5 / GPT-5.4 — 100 万 token(1,048,576)。
  • Claude Opus 4.8 / Sonnet 4.6 / Haiku 4.5 — 100 万 token(Haiku 4.5 为 200K)。
  • Gemini 3.1 Pro — 100 万 token。
  • DeepSeek V4 Pro — 100 万 token。

注意:某些提供商在超过阈值后定价不同。Gemini 2.5 Pro 在提示超过 200K token 后输入价翻倍。对于长上下文工作负载,请务必查看分级定价。

相关术语