Ir al contenido
Skuto

Glosario

Datos de entrenamiento

Los datos de entrenamiento son la enorme colección de textos, imágenes y código con la que un modelo de IA aprende. Con algunos chatbots, lo que escribes puede convertirse en material de entrenamiento para modelos futuros, a menos que lo desactives en los ajustes de privacidad.

Un modelo de IA no sabe nada por sí solo. Aprendió a escribir y a responder “digiriendo” cantidades enormes de texto: libros, páginas web, código. Esa colección son los datos de entrenamiento. Lo que más te interesa: algunos proveedores también usan tus conversaciones para entrenar los modelos futuros, dependiendo de tu plan y de tus ajustes.

Imagina al dueño de un bar que pega el correo de un proveedor en un chatbot para que le ayude a redactar la respuesta. Si la opción “mejorar el modelo” está activada, ese correo, con nombres, precios y todo lo demás, puede acabar en el entrenamiento. No va a aparecer palabra por palabra ante otra persona, pero ya ha salido por la puerta.

La solución suele ser un único interruptor, y merece la pena comprobarlo antes de pegar cualquier información delicada. Nuestro comprobador de privacidad te muestra cómo trata cada chatbot lo que escribes, plan por plan.

Dónde te lo vas a encontrar

  • ChatGPT → Ajustes → Controles de datos → “Mejorar el modelo para todos”
  • Claude → Configuración → Privacidad, donde viven las preferencias de entrenamiento
  • Gemini → la página Actividad de las apps de Gemini de tu cuenta de Google

En España, la autoridad de referencia en materia de privacidad es la AEPD (Agencia Española de Protección de Datos), que aplica el RGPD. Si crees que un proveedor está usando tus datos sin base legal, puedes presentar una reclamación en aepd.es.

Consulta también opt-out y LLM.

Ponlo en práctica

← Volver al glosario