Glossar

RAG (retrieval-augmented generation)

RAG (retrieval-augmented generation) bedeutet: die KI schlägt zuerst in einer vertrauenswürdigen Quelle nach (deinen Dokumenten, einer Datenbank, dem Web) und formuliert die Antwort dann auf Basis des Gefundenen. Das reduziert Halluzinationen und hält Antworten aktuell.

Ein LLM antwortet allein aus dem Gedächtnis: alles, was es beim Training aufgenommen hat, eingefroren zu einem vergangenen Zeitpunkt. RAG ergänzt einen Schritt mit offenen Unterlagen: Bevor das Modell antwortet, ruft das System die relevanten Inhalte aus einer gewählten Quelle ab und legt sie dem Modell zusammen mit deiner Frage vor.

Stell dir eine Apothekerin vor. Bei einer seltenen Wechselwirkung zitiert eine gute Apothekerin nicht aus dem Kopf, sondern öffnet die offizielle Fachdatenbank, liest nach und antwortet dann. Gleiche Kompetenz, aber verankert in einer aktuellen und nachprüfbaren Quelle.

Für dich bedeutet das zwei Dinge. Antworten können Dokumente zitieren, die das Modell beim Training nie gesehen hat (deine Verträge, aktuelle Nachrichten, ein Produkthandbuch). Und Halluzinationen gehen spürbar zurück, verschwinden aber nicht vollständig: Das Modell kann das Abgerufene immer noch falsch lesen, daher bleiben Quellenlinks dein bestes Werkzeug.

Wo du RAG begegnest

Jedes Mal, wenn ein Assistent „Ich suche kurz nach…“ sagt, bevor er antwortet, ist das RAG. Dazu zählen: ChatGPT- und Claude-Projekte, die aus hochgeladenen Dateien antworten, Copilot, der aus dem SharePoint deines Unternehmens schöpft, NotebookLM, das über deinen eigenen Quellen arbeitet, und Kundenservice-Bots, die tatsächlich die echte Rückgaberichtlinie zitieren.

Im deutschen und europäischen Kontext ist RAG besonders relevant, wenn Unternehmen interne Wissensdatenbanken per KI zugänglich machen. Dabei gelten die Anforderungen der DSGVO: Werden personenbezogene Daten in die Retrievalquelle eingespeist, braucht es eine Rechtsgrundlage nach Art. 6 DSGVO. Zuständige Aufsichtsbehörden sind der BfDI (Bundesbeauftragter für den Datenschutz und die Informationsfreiheit) auf Bundesebene sowie die jeweiligen Landesdatenschutzbehörden (z. B. LfDI Baden-Württemberg, BayLDA in Bayern). Der EU AI Act stuft RAG-Systeme in der Regel als Allzweck-KI ein, mit entsprechenden Transparenzpflichten, sobald das zugrundeliegende Modell eine bestimmte Rechenleiststärke überschreitet.

← Zurück zum Glossar

Wo du RAG begegnest

Verwandte Begriffe