aiagentrank.io
🔌Toolingalso: context window, コンテキスト長

コンテキストウィンドウdefinition and how it works in 2026

コンテキストウィンドウ
LLMが一度に処理できるトークン数の最大値 — 入力プロンプト、エージェントの履歴、ツール呼び出し結果すべてを合計した上限。

2026年の主要モデルのコンテキストウィンドウ:Claude 4.x = 1M トークン、Gemini 2 Ultra = 2M、GPT-5 = 400K、Llama 4 = 128K。コンテキストが広いほど、エージェントは長時間セッションで一貫性を保てます。

コンテキストとコストのトレードオフ:トークン消費は線形に増えます。1M トークンを毎ターン送るとコストが急増します。多くのエージェントは「直近 N ターン + 圧縮された履歴サマリー」というハイブリッド方式を使います。

コンテキストウィンドウ vs メモリ:ウィンドウはセッション内の一時的な状態、メモリはセッションをまたいで保持される長期的な状態です。両者を組み合わせるのが2026年の標準アプローチです。

Frequently asked

Does a larger context window always help?+

No. Most models exhibit "lost in the middle" — retrieval accuracy on a fact dips when it's buried in a long context. Use RAG to put the most relevant parts at the top of the window.

Related terms

Further learning

Editor-curated courses
Best courses to learn LLM fundamentals (2026)

The right courses to take if you're going to fine-tune, self-host, or seriously evaluate LLMs.

1+ hand-reviewed courses →
What is コンテキストウィンドウ? · Glossary · AI Agent Rank