🔌Toolingalso: context window, コンテキスト長
コンテキストウィンドウdefinition and how it works in 2026
- コンテキストウィンドウ
- LLMが一度に処理できるトークン数の最大値 — 入力プロンプト、エージェントの履歴、ツール呼び出し結果すべてを合計した上限。
2026年の主要モデルのコンテキストウィンドウ:Claude 4.x = 1M トークン、Gemini 2 Ultra = 2M、GPT-5 = 400K、Llama 4 = 128K。コンテキストが広いほど、エージェントは長時間セッションで一貫性を保てます。
コンテキストとコストのトレードオフ:トークン消費は線形に増えます。1M トークンを毎ターン送るとコストが急増します。多くのエージェントは「直近 N ターン + 圧縮された履歴サマリー」というハイブリッド方式を使います。
コンテキストウィンドウ vs メモリ:ウィンドウはセッション内の一時的な状態、メモリはセッションをまたいで保持される長期的な状態です。両者を組み合わせるのが2026年の標準アプローチです。
Frequently asked
Does a larger context window always help?+
No. Most models exhibit "lost in the middle" — retrieval accuracy on a fact dips when it's buried in a long context. Use RAG to put the most relevant parts at the top of the window.