RAGdefinition and how it works in 2026
- RAG
- Retrieval-Augmented Generation — récupérer des documents pertinents au moment de la requête, les injecter dans le prompt, et laisser le LLM répondre. Le pattern derrière tous les agents knowledge utiles.
RAG résout le problème principal des LLM : leur connaissance est figée au cutoff d'entraînement, et ils ne savent rien sur votre entreprise. RAG passe vos documents (wiki, docs, ticket history, base de connaissances) à travers un système de récupération, et n'amène que les snippets pertinents dans le contexte du LLM au moment de la réponse.
Le pipeline standard 2026 : indexer les documents en embeddings vectoriels, stocker dans une base vectorielle (Pinecone, Weaviate, pgvector), récupérer les top-k au query time via similarité cosinus, faire un re-ranking sémantique, puis injecter dans le prompt. Beaucoup ajoutent un BM25/keyword retrieval en parallèle (hybrid search) pour les requêtes exactes.
RAG est devenu plus sophistiqué : Agentic RAG (l'agent itère sur des recherches multiples), Self-RAG (le modèle décide quand récupérer), Corrective RAG (vérification croisée). Pour la plupart des cas d'usage Enterprise, RAG vanille avec hybrid search et re-ranking est suffisant.
This capability in our catalog
See the agents that ship RAG, with side-by-side comparison on price and integrations.
📚Agents with rag →Where this shows up
Frequently asked
Quand utiliser RAG plutôt que fine-tuning ?+
RAG quand vos données changent fréquemment (docs, tickets, knowledge base mise à jour quotidiennement). Fine-tuning quand vous voulez apprendre un style, un format ou un domaine étroit qui ne change pas. La plupart des cas d'usage Enterprise 2026 sont RAG.
Quelle base vectorielle choisir ?+
pgvector si vous avez déjà Postgres (zéro overhead opérationnel). Pinecone si vous voulez du managed simple. Weaviate si vous voulez self-host avec features avancées. Pour < 1M vecteurs, le choix importe peu performance-wise ; pour > 10M, pgvector devient lent.
Comment évaluer la qualité d'un système RAG ?+
Mesurer à deux niveaux : retrieval (les bons docs sont-ils dans le top-k ?) et generation (la réponse cite-t-elle correctement ? hallucine-t-elle ?). Les frameworks comme RAGAS automatisent les deux. Sans évaluation systématique, RAG est un trou noir.
