Glossario
RAG (retrieval-augmented generation)
RAG (retrieval-augmented generation) significa che l'AI prima cerca nelle fonti affidabili (i tuoi documenti, un database, il web) e poi scrive la risposta su ciò che ha trovato. Riduce le allucinazioni e mantiene le risposte aggiornate.
Un LLM da solo risponde a memoria: tutto ciò che ha assorbito durante l’addestramento, congelato a una data passata. Il RAG aggiunge il passaggio “a libro aperto”: prima di rispondere, il sistema recupera le pagine rilevanti da una fonte scelta e le consegna al modello insieme alla tua domanda.
Pensa a un farmacista. Su un’interazione rara, quello bravo non recita a memoria: apre la banca dati ufficiale, legge e poi risponde. Stessa competenza, ma ancorata a una fonte aggiornata e verificabile.
Per te significa due cose. Le risposte possono citare documenti che il modello non ha mai visto in addestramento (i tuoi contratti, le notizie di oggi, il manuale di un prodotto). E le allucinazioni calano nettamente, senza sparire: il modello può comunque leggere male ciò che ha recuperato, quindi i link alle fonti restano tuoi amici.
Dove lo incontrerai
Ogni volta che un assistente dice “sto cercando sul web…” prima di rispondere, quello è RAG. E poi: i progetti di ChatGPT e Claude che rispondono dai file caricati, Copilot che pesca dallo SharePoint aziendale, NotebookLM che lavora sulle tue fonti, e i bot di assistenza che citano davvero la politica resi reale.