RAG : demo interactive | Jarvisagence

Le probleme de l'IA sans contexte

Quand vous posez une question a ChatGPT, il repond avec ce qu'il a appris pendant son entrainement. Mais il n'a jamais lu vos contrats, votre wiki interne, vos emails, vos rapports. S'il ne sait pas, il invente. Et il invente avec confiance.

Ce que fait le RAG

RAG veut dire : avant de répondre, l'IA cherche d'abord dans vos documents. Elle trouve les passages pertinents, les lit, puis construit sa reponse a partir de ce qu'elle vient de lire. Elle ne peut plus inventer : elle cite ses sources.

Comment elle cherche dans les documents ?

Elle ne cherche pas comme Google avec des mots-cles. Elle convertit chaque passage du document en une liste de nombres (un "vecteur") qui represente le sens du texte. Quand vous posez une question, elle la convertit aussi en vecteur, puis elle cherche les vecteurs les plus proches. Proche = semantiquement similaire.

Pour comprendre les vecteurs

Un vecteur, c'est une liste de nombres qui decrit un mot.

Imaginez que chaque mot a une fiche avec des notes de 0 a 1 sur differents criteres. "Chien" a une note elevee sur "animal" et "domestique". "Voiture" a une note nulle sur ces deux criteres. Deux mots qui parlent de choses similaires auront des fiches similaires.

Dans la pratique, ces fiches ont 768 ou 1536 criteres (pas 2). Mais le principe est le meme : des mots proches semantiquement ont des vecteurs proches mathematiquement.

chien

animal: 0.95

domestique: 0.88

mecanique: 0.02

chat

animal: 0.93

domestique: 0.91

mecanique: 0.01

voiture

animal: 0.03

domestique: 0.05

mecanique: 0.97

velo

animal: 0.02

domestique: 0.04

mecanique: 0.92

Chien et chat sont proches (memes notes). Voiture et velo sont proches entre eux. Et les deux paires sont loin l'une de l'autre. C'est ca, la distance semantique.

La demo ci-dessous montre les 3 étapes du RAG en action. Un document sur Paris est indexe. Vous posez une question, l'IA cherche le bon passage, puis repond en s'appuyant dessus.

Retrieval

Augmented

Generation

Document source indexe (les passages disponibles)

p1Paris est la capitale de la France. Avec environ 2,1 millions d'habitants intra-muros et pres de 12 millions dans la metropole, c'est la ville la plus peuplee du pays.

p2La ville abrite des monuments mondialement connus : la tour Eiffel, le musee du Louvre, la cathedrale Notre-Dame de Paris, l'Arc de Triomphe et le Sacre-Coeur.

p3Paris est la capitale de la France depuis le Xe siecle avec les Capetiens. Son role politique, economique et culturel en fait l'une des villes majeures du monde.

p4Son economie repose sur les services, la finance, la mode, le tourisme et la tech. La region Ile-de-France represente environ 30% du PIB national.

Posez une question...

Ce que vous venez de voir : l'IA n'a pas devine. Elle a cherche dans le document, trouve le bon paragraphe (surligne en orange), l'a lu, puis a formule sa reponse. Si le document n'avait pas contenu la reponse, elle aurait dit "je ne sais pas".

C'est quoi le RAG ?

Un vecteur, c'est une liste de nombres qui decrit un mot.

Le RAG, c'est un concept qu'on enseigne en formation.