Zum Inhalt springen
Skuto

Glossar

Trainingsdaten

Trainingsdaten sind die riesige Sammlung aus Texten, Bildern und Code, mit der ein KI-Modell trainiert wird. Bei einigen Chatbots kann das, was du eintippst, zu Trainingsmaterial für künftige Modelle werden, sofern du das nicht in den Datenschutzeinstellungen abschaltest.

Ein KI-Modell weiß von Haus aus nichts. Es hat gelernt zu schreiben und zu antworten, indem es riesige Mengen an Text verarbeitet hat: Bücher, Webseiten, Quellcode. Diese Sammlung sind die Trainingsdaten. Der für dich relevante Teil: Manche Anbieter nutzen auch deine Gespräche, um künftige Modelle zu trainieren, abhängig von deinem Tarif und deinen Einstellungen.

Stell dir vor, du bist selbstständig und fügst eine Lieferanten-E-Mail in einen Chatbot ein, um dir die Antwort schreiben zu lassen. Ist die Option „Modell verbessern“ aktiviert, kann genau diese E-Mail, mit Namen, Preisen und allem, in das Training einfließen. Anderen erscheint sie nicht wörtlich, aber sie hat dein Haus verlassen.

Die Lösung ist meist ein einziger Schalter, und es lohnt sich, ihn zu überprüfen, bevor du etwas Vertrauliches einfügst. Unser Datenschutz-Check zeigt dir, wie jeder große Chatbot mit deinen Eingaben umgeht, Tarif für Tarif.

Wo du das begegnest

  • ChatGPT → Einstellungen → Datenschutzkontrollen → „Modell für alle verbessern“
  • Claude → Einstellungen → Datenschutz, dort findest du die Trainingsoptionen
  • Gemini → die Seite „Gemini Apps-Aktivitäten“ in deinem Google-Konto

Datenschutzrechtlich gilt in Deutschland die DSGVO (Datenschutz-Grundverordnung). Zuständige Behörden sind der Bundesbeauftragte für den Datenschutz und die Informationsfreiheit (BfDI) sowie die Landesdatenschutzbehörden. Der EU AI Act regelt zusätzlich, welche Anforderungen an KI-Systeme beim Einsatz von Trainingsdaten gelten. Wenn du unsicher bist, ob dein Unternehmen einen Auftragsverarbeitungsvertrag (AVV) mit dem KI-Anbieter braucht, ist das ein gutes Zeichen dafür, dass du ihn brauchst.

Siehe auch Opt-out und LLM.

Direkt ausprobieren

← Zurück zum Glossar