aiagentrank.io
🔌Toolingalso: context window, fenêtre contexte, limite de tokens

Fenêtre de contextedefinition and how it works in 2026

Fenêtre de contexte
Le nombre maximum de tokens (mots/code/fragments de données) qu'un LLM ou agent peut traiter en une seule étape de reasoning.

La fenêtre de contexte est la « durée d'attention » du modèle. Tout ce qui y rentre — system prompt, historique conversationnel, documents récupérés, outputs d'outils — peut être considéré par l'agent en une étape. Tout ce qui dépasse est tronqué ou résumé.

Les modèles de pointe 2026 atteignent 1-2 millions de tokens de contexte (Claude, Gemini), la plupart des agents en production fonctionnent entre 128K et 1M. Cela suffit pour des codebases entières de taille moyenne, des rapports trimestriels complets ou plusieurs heures de transcripts de meeting.

Piège pratique : grande fenêtre de contexte ≠ utilisation efficace. Les modèles souffrent à partir de ~50K tokens de l'effet « lost in the middle » — l'information au début ou à la fin est mieux récupérée que celle au milieu. Un bon design RAG place les snippets les plus pertinents aux extrémités, pas au centre.

Frequently asked

Ai-je toujours besoin de la plus grande fenêtre de contexte disponible ?+

Non. Un contexte plus grand coûte plus (prix-par-token × tokens-en-input) et n'est pas toujours mieux utilisé. Pour la plupart des cas d'usage, 128K-200K suffisent, combinés à un bon RAG. 1M+ est utile pour le reasoning sur codebase entière et l'analyse long-format.

Que se passe-t-il quand je dépasse la fenêtre de contexte ?+

Selon le provider : erreur dure, truncation automatique (les anciens messages d'abord généralement), ou compression automatique. Les agents en production gèrent cela activement — Claude Code d'Anthropic a par exemple une fonction /compact qui compresse explicitement.

Comment la fenêtre de contexte se rapporte-t-elle à RAG ?+

RAG est l'outil pour rester efficacement dans la fenêtre de contexte disponible. Au lieu d'entasser les 500 documents dans le contexte, RAG récupère les 5-10 plus pertinents et les met seuls dans le contexte. Fenêtre de contexte = scène ; RAG = casting.

Related terms

Further learning

Editor-curated courses
Best courses to learn LLM fundamentals (2026)

The right courses to take if you're going to fine-tune, self-host, or seriously evaluate LLMs.

1+ hand-reviewed courses →
What is Fenêtre de contexte? · Glossary · AI Agent Rank