← Formations · Ressource gratuite

C'est quoi le RAG ?

Retrieval Augmented Generation. Une demo interactive pour comprendre comment l'IA cherche dans vos documents avant de répondre. 3 minutes suffisent.

1
Le probleme de l'IA sans contexte

Quand vous posez une question a ChatGPT, il repond avec ce qu'il a appris pendant son entrainement. Mais il n'a jamais lu vos contrats, votre wiki interne, vos emails, vos rapports. S'il ne sait pas, il invente. Et il invente avec confiance.

2
Ce que fait le RAG

RAG veut dire : avant de répondre, l'IA cherche d'abord dans vos documents. Elle trouve les passages pertinents, les lit, puis construit sa reponse a partir de ce qu'elle vient de lire. Elle ne peut plus inventer : elle cite ses sources.

3
Comment elle cherche dans les documents ?

Elle ne cherche pas comme Google avec des mots-cles. Elle convertit chaque passage du document en une liste de nombres (un "vecteur") qui represente le sens du texte. Quand vous posez une question, elle la convertit aussi en vecteur, puis elle cherche les vecteurs les plus proches. Proche = semantiquement similaire.

Pour comprendre les vecteurs

Un vecteur, c'est une liste de nombres qui decrit un mot.

Imaginez que chaque mot a une fiche avec des notes de 0 a 1 sur differents criteres. "Chien" a une note elevee sur "animal" et "domestique". "Voiture" a une note nulle sur ces deux criteres. Deux mots qui parlent de choses similaires auront des fiches similaires.

Dans la pratique, ces fiches ont 768 ou 1536 criteres (pas 2). Mais le principe est le meme : des mots proches semantiquement ont des vecteurs proches mathematiquement.

chien
animal: 0.95
domestique: 0.88
mecanique: 0.02
chat
animal: 0.93
domestique: 0.91
mecanique: 0.01
voiture
animal: 0.03
domestique: 0.05
mecanique: 0.97
velo
animal: 0.02
domestique: 0.04
mecanique: 0.92

Chien et chat sont proches (memes notes). Voiture et velo sont proches entre eux. Et les deux paires sont loin l'une de l'autre. C'est ca, la distance semantique.

La demo ci-dessous montre les 3 étapes du RAG en action. Un document sur Paris est indexe. Vous posez une question, l'IA cherche le bon passage, puis repond en s'appuyant dessus.

Retrieval
Augmented
Generation
01
Retrieval La question est convertie en vecteur. On cherche les passages les plus proches.
02
Augmented Les passages trouves sont ajoutes au message envoye à l'IA. Elle les lit avant de répondre.

          
03
Generation L'IA repond en s'appuyant uniquement sur les passages fournis. Pas d'invention.
Document source indexe (les passages disponibles)

p1Paris est la capitale de la France. Avec environ 2,1 millions d'habitants intra-muros et pres de 12 millions dans la metropole, c'est la ville la plus peuplee du pays.

p2La ville abrite des monuments mondialement connus : la tour Eiffel, le musee du Louvre, la cathedrale Notre-Dame de Paris, l'Arc de Triomphe et le Sacre-Coeur.

p3Paris est la capitale de la France depuis le Xe siecle avec les Capetiens. Son role politique, economique et culturel en fait l'une des villes majeures du monde.

p4Son economie repose sur les services, la finance, la mode, le tourisme et la tech. La region Ile-de-France represente environ 30% du PIB national.

Posez une question...

Ce que vous venez de voir : l'IA n'a pas devine. Elle a cherche dans le document, trouve le bon paragraphe (surligne en orange), l'a lu, puis a formule sa reponse. Si le document n'avait pas contenu la reponse, elle aurait dit "je ne sais pas".

Aller plus loin

Le RAG, c'est un concept qu'on enseigne en formation.

En une journée, vos équipes comprennent ce concept et les autres outils IA qui changent vraiment le quotidien. 500 par jour, en entreprise ou en visio.

Voir les formations Demo Knowledge Graph