Retrieval Augmented Generation. Une demo interactive pour comprendre comment l'IA cherche dans vos documents avant de répondre. 3 minutes suffisent.
Quand vous posez une question a ChatGPT, il repond avec ce qu'il a appris pendant son entrainement. Mais il n'a jamais lu vos contrats, votre wiki interne, vos emails, vos rapports. S'il ne sait pas, il invente. Et il invente avec confiance.
RAG veut dire : avant de répondre, l'IA cherche d'abord dans vos documents. Elle trouve les passages pertinents, les lit, puis construit sa reponse a partir de ce qu'elle vient de lire. Elle ne peut plus inventer : elle cite ses sources.
Elle ne cherche pas comme Google avec des mots-cles. Elle convertit chaque passage du document en une liste de nombres (un "vecteur") qui represente le sens du texte. Quand vous posez une question, elle la convertit aussi en vecteur, puis elle cherche les vecteurs les plus proches. Proche = semantiquement similaire.
Imaginez que chaque mot a une fiche avec des notes de 0 a 1 sur differents criteres. "Chien" a une note elevee sur "animal" et "domestique". "Voiture" a une note nulle sur ces deux criteres. Deux mots qui parlent de choses similaires auront des fiches similaires.
Dans la pratique, ces fiches ont 768 ou 1536 criteres (pas 2). Mais le principe est le meme : des mots proches semantiquement ont des vecteurs proches mathematiquement.
Chien et chat sont proches (memes notes). Voiture et velo sont proches entre eux. Et les deux paires sont loin l'une de l'autre. C'est ca, la distance semantique.
La demo ci-dessous montre les 3 étapes du RAG en action. Un document sur Paris est indexe. Vous posez une question, l'IA cherche le bon passage, puis repond en s'appuyant dessus.
p1Paris est la capitale de la France. Avec environ 2,1 millions d'habitants intra-muros et pres de 12 millions dans la metropole, c'est la ville la plus peuplee du pays.
p2La ville abrite des monuments mondialement connus : la tour Eiffel, le musee du Louvre, la cathedrale Notre-Dame de Paris, l'Arc de Triomphe et le Sacre-Coeur.
p3Paris est la capitale de la France depuis le Xe siecle avec les Capetiens. Son role politique, economique et culturel en fait l'une des villes majeures du monde.
p4Son economie repose sur les services, la finance, la mode, le tourisme et la tech. La region Ile-de-France represente environ 30% du PIB national.
Ce que vous venez de voir : l'IA n'a pas devine. Elle a cherche dans le document, trouve le bon paragraphe (surligne en orange), l'a lu, puis a formule sa reponse. Si le document n'avait pas contenu la reponse, elle aurait dit "je ne sais pas".
En une journée, vos équipes comprennent ce concept et les autres outils IA qui changent vraiment le quotidien. 500 par jour, en entreprise ou en visio.