上下文窗口
快速结论
上下文窗口是模型在单次请求中能处理的最大 token 数(输入 + 输出)。截至 2026-06-17,GPT-5.5 和 Claude Opus 4.8 都支持 100 万 token 的上下文窗口。
上下文窗口决定了模型一次能"看到"多少内容:长文档、大型代码库、多轮聊天历史。截至 2026-06-17,前沿文本模型集中在 100 万 token:
- GPT-5.5 / GPT-5.4 — 100 万 token(1,048,576)。
- Claude Opus 4.8 / Sonnet 4.6 / Haiku 4.5 — 100 万 token(Haiku 4.5 为 200K)。
- Gemini 3.1 Pro — 100 万 token。
- DeepSeek V4 Pro — 100 万 token。
注意:某些提供商在超过阈值后定价不同。Gemini 2.5 Pro 在提示超过 200K token 后输入价翻倍。对于长上下文工作负载,请务必查看分级定价。