🧰Capabilitiesalso: RAG, retrieval-augmented generation, récupération augmentée

RAGdefinition and how it works in 2026

RAG: Retrieval-Augmented Generation — récupérer des documents pertinents au moment de la requête, les injecter dans le prompt, et laisser le LLM répondre. Le pattern derrière tous les agents knowledge utiles.

RAG résout le problème principal des LLM : leur connaissance est figée au cutoff d'entraînement, et ils ne savent rien sur votre entreprise. RAG passe vos documents (wiki, docs, ticket history, base de connaissances) à travers un système de récupération, et n'amène que les snippets pertinents dans le contexte du LLM au moment de la réponse.

Le pipeline standard 2026 : indexer les documents en embeddings vectoriels, stocker dans une base vectorielle (Pinecone, Weaviate, pgvector), récupérer les top-k au query time via similarité cosinus, faire un re-ranking sémantique, puis injecter dans le prompt. Beaucoup ajoutent un BM25/keyword retrieval en parallèle (hybrid search) pour les requêtes exactes.

RAG est devenu plus sophistiqué : Agentic RAG (l'agent itère sur des recherches multiples), Self-RAG (le modèle décide quand récupérer), Corrective RAG (vérification croisée). Pour la plupart des cas d'usage Enterprise, RAG vanille avec hybrid search et re-ranking est suffisant.

This capability in our catalog

See the agents that ship RAG, with side-by-side comparison on price and integrations.

📚Agents with rag →

Where this shows up

🔬Recherche agents 🎧Support agents

Frequently asked

Quand utiliser RAG plutôt que fine-tuning ?+

RAG quand vos données changent fréquemment (docs, tickets, knowledge base mise à jour quotidiennement). Fine-tuning quand vous voulez apprendre un style, un format ou un domaine étroit qui ne change pas. La plupart des cas d'usage Enterprise 2026 sont RAG.

Quelle base vectorielle choisir ?+

pgvector si vous avez déjà Postgres (zéro overhead opérationnel). Pinecone si vous voulez du managed simple. Weaviate si vous voulez self-host avec features avancées. Pour < 1M vecteurs, le choix importe peu performance-wise ; pour > 10M, pgvector devient lent.

Comment évaluer la qualité d'un système RAG ?+

Mesurer à deux niveaux : retrieval (les bons docs sont-ils dans le top-k ?) et generation (la réponse cite-t-elle correctement ? hallucine-t-elle ?). Les frameworks comme RAGAS automatisent les deux. Sans évaluation systématique, RAG est un trou noir.

Agents that use rag

Perplexity Labsv2025.4A73

Agent de deep research multi-étapes — passe de la question au rapport sourcé en minutes.

🔬RechercheSemi-autonomeFreemium · à partir de 20 $

Browser UseRAGMemory

132k18 avr. 2025perplexity.ai

Essayer Perplexity Labs

ElicitB65

Agent de revue de littérature pour les chercheurs — extrait et synthétise à partir de plus de 200 millions d'articles.

🔬RechercheAssistantFreemium · à partir de 12 $

RAGMemory

36k28 févr. 2025elicit.com

Essai gratuit d'Elicit

Demo · hover to play

SierraA78

Plateforme d'agents IA Customer Experience pour les enterprises.

🎧SupportAutonomeAbonnement

VoixTool UseMemoryRAG

33k18 févr. 2025sierra.ai

Parler à Sierra

Demo · hover to play

DecagonA73

Agents de support conversationnel qui résolvent les tickets comme vos meilleurs conseillers.

🎧SupportAutonomeAbonnement

Tool UseMemoryRAG

20k25 avr. 2025decagon.ai

Obtenir une démo Decagon

Demo · hover to play

RAGdefinition and how it works in 2026

This capability in our catalog

Where this shows up

Frequently asked

Agents that use rag

Related terms

Further learning