🔌Toolingalso: context window, コンテキスト長

コンテキストウィンドウdefinition and how it works in 2026

コンテキストウィンドウ: LLMが一度に処理できるトークン数の最大値 — 入力プロンプト、エージェントの履歴、ツール呼び出し結果すべてを合計した上限。

2026年の主要モデルのコンテキストウィンドウ：Claude 4.x = 1M トークン、Gemini 2 Ultra = 2M、GPT-5 = 400K、Llama 4 = 128K。コンテキストが広いほど、エージェントは長時間セッションで一貫性を保てます。

コンテキストとコストのトレードオフ：トークン消費は線形に増えます。1M トークンを毎ターン送るとコストが急増します。多くのエージェントは「直近 N ターン + 圧縮された履歴サマリー」というハイブリッド方式を使います。

コンテキストウィンドウ vs メモリ：ウィンドウはセッション内の一時的な状態、メモリはセッションをまたいで保持される長期的な状態です。両者を組み合わせるのが2026年の標準アプローチです。

Frequently asked

Does a larger context window always help?+

No. Most models exhibit "lost in the middle" — retrieval accuracy on a fact dips when it's buried in a long context. Use RAG to put the most relevant parts at the top of the window.

コンテキストウィンドウdefinition and how it works in 2026

Frequently asked

Related terms

Further learning