Boucle agentiquedefinition and how it works in 2026
- Boucle agentique
- La boucle centrale d'un agent : planifie → exécute une étape → observe le résultat → décide de continuer ou s'arrêter.
La boucle agentique est le cœur technique de chaque agent. ReAct (Reasoning + Acting), le pattern introduit en 2022, est la forme de base : le modèle pense à voix haute, choisit une action, observe le résultat et itère.
Les boucles modernes sont plus sophistiquées : planification à l'avance (penser plusieurs étapes en avance), self-critique (vérifier son propre reasoning), sélection d'outil avec confidence score (si incertain, utiliser plus d'outils), et conditions d'arrêt (quand l'objectif est atteint ou le budget est épuisé).
En production, la question la plus importante sur la boucle est : quand s'arrête-t-elle ? Les mauvaises boucles oscillent (« essaie A, A échoue, essaie B, B échoue, essaie A à nouveau »). Les bonnes boucles ont des critères d'arrêt durs : max étapes, max budget tokens, max temps wallclock, confidence monotone croissante.
Frequently asked
Quelle est la différence entre ReAct et Plan-and-Execute ?+
ReAct décide par étape ; Plan-and-Execute planifie toutes les étapes à l'avance puis exécute. ReAct est plus flexible, Plan-and-Execute plus efficace pour les tâches prévisibles. La plupart des agents 2026 combinent les deux : plan grossier à l'avance, boucles ReAct pour les détails.
Comment empêcher la boucle de tourner à l'infini ?+
Trois gates durs : nombre max d'étapes, budget tokens, temps wallclock. Plus un soft gate : arrêt si les N dernières étapes n'ont apporté aucune augmentation de confidence. Les frameworks production-ready (LangGraph, SDK Anthropic) ont cela intégré.
Ai-je obligatoirement besoin d'une boucle pour un agent ?+
Fonctionnellement oui — sinon c'est un chatbot. Pratiquement, 2-3 itérations suffisent pour beaucoup de tâches ; seuls Deep Research et long-horizon coding utilisent 20-50 étapes. La majorité des « agents » 2026 tournent en réalité avec des boucles courtes.
