Actualidad, AI, Inteligencia Artificial

¿Serán válidos los resultados de la IA si usa datos de Internet?

Un estudio de la Universidad Politécnica de Madrid (UPM) advierte que entrenar inteligencia artificial con datos generados por versiones anteriores vía internet «puede llevar a que un modelo más avanzado produzca resultados absurdos».

El estudio reflexiona sobre el éxito espectacular de la inteligencia artificial generativa, capaz de generar contenidos originales a partir de datos existentes. Advierte que si esta tendencia continúa, el contenido producido de esta manera podría volverse predominante en internet en los próximos años.

Los autores señalan una problemática: estas herramientas se entrenan en muchos casos con grandes conjuntos de datos extraídos de la web, lo que conlleva la posibilidad de errores en los datos de las versiones anteriores.

Impacto de la inteligencia artificial al usar Internet

El estudio explora el impacto de esta retroalimentación en modelos básicos de inteligencia artificial para generar imágenes. Concluyen que a medida que las nuevas versiones trabajan con datos generados por sus predecesoras, la calidad y diversidad de las imágenes obtenidas disminuyen drásticamente.

Observan que un modelo de difusión simple, entrenado con una categoría específica de imágenes como fotografías de pájaros y flores, produce resultados inutilizables tras varias generaciones.

Proponen que una solución aparentemente simple sería descartar los datos previamente generados por la inteligencia artificial. No obstante, señalan que existen métodos para hacerlo, aunque la constante aparición de nuevos modelos los vuelve obsoletos rápidamente.

En consecuencia, sugieren que la interacción entre los modelos de inteligencia artificial generativa y la internet puede tener efectos no deseados y abogan por investigar sus posibles implicaciones en la sociedad.

¿De dónde recopila los datos la IA?

La extracción de datos para entrenar modelos de IA suele implicar la recopilación y procesamiento de información disponible en la red, que puede incluir una amplia gama de fuentes accesibles en internet, como sitios web, redes sociales, bases de datos públicas, repositorios de datos, artículos científicos, entre otros.

Los datos extraídos pueden variar en naturaleza y propósito, desde texto escrito hasta imágenes, audio, video y otros tipos de información. Estos datos se utilizan para enseñar a los modelos de IA a comprender patrones, generar contenido y tomar decisiones basadas en la información que han procesado durante el entrenamiento.

En resumen, la inteligencia artificial utiliza datos recopilados de diversas fuentes disponibles en internet para entrenar y mejorar sus capacidades de generación y comprensión.

Samuel Rodríguez

Periodista a cargo de Ecommerce News desde 2012. Inquieto. En el camino, creé otros medios, como @BigDataMagazine y @CybersecurityNews. Organizador de cientos de eventos profesionales. Ahora con un pie en Portugal y otro en México... Muy del @GetafeCF

TE PUEDE GUSTAR

El 86% de las empresas ya ahorra tiempo con los agentes de IA

Aldana Balmaceda
16/07/2026

Los agentes de IA están demostrado su potencial para mejorar la eficiencia y la competitividad de las organizaciones, con contribuciones como el ahorro de

El 67% de las empresas ya usa asistentes de código con IA, pero muchas siguen sin un modelo de control

Aldana Balmaceda
15/07/2026

La inteligencia artificial ha entrado de lleno en los equipos de desarrollo de software, pero no siempre lo ha hecho acompañada de los controles

La IA Accionable se consolida como el motor de valor empresarial en 2026

Aldana Balmaceda
14/07/2026

La conversación empresarial en torno a la inteligencia artificial ha madurado. Tras una etapa inicial marcada por la experimentación, el mercado ha entrado en

Gemelos digitales basados en IA para mejorar los rendimientos energéticos de los procesos industriales

Aldana Balmaceda
14/07/2026

La presión por reducir costes energéticos, recortar emisiones y optimizar el uso del agua está obligando a muchas industrias a replantearse cómo gestionan sus

BBVA mide con IA la experiencia real del cliente, más allá de las encuestas de satisfacción

Aldana Balmaceda
13/07/2026

Las encuestas de satisfacción ya no son la única vía para entender la relación de los clientes con BBVA. El banco utiliza inteligencia artificial

Ocho de cada diez españoles recurren a la IA para buscar información con mayor rapidez y personalización

Aldana Balmaceda
12/07/2026

Durante años, las redes sociales han sido el gran escaparate digital donde descubrir marcas, productos y tendencias. Sin embargo, en un entorno saturado de

EVENTOS

El 86% de las empresas ya ahorra tiempo con los agentes de IA

AI, Eventos

La IA da el salto a las aplicaciones reales en Alicante

AI, Eventos

Más del 60% de las inversiones corporativas se concentran en inteligencia artificial

AI, Eventos

CDO Day: Madrid acogerá el mayor encuentro nacional de líderes del dato

Actualidad, Eventos

La IA inunda la construcción: desde la inversión hasta la planificación pasando por la digitalización de licencias

AI, Eventos

La IA amplifica los sesgos de género para las jóvenes: más frágiles, dependientes y con vocación a la salud

IA en femenino, Inteligencia Artificial

RECIBE NUESTRA NEWSLETTER

ESCUCHA NUESTRO PODCAST

SÍGUENOS EN RRSS

MÁS COMENTADOS

Cómo la analítica avanzada puede mejorar las operaciones en el sector retail

Actualidad, Business Intelligence, Inteligencia Artificial, Retail

«El Big Data en el entorno de la industria logística va a ser imprescindible y SEUR lo vimos hace años»

Actualidad, Entrevistas

Utilización de Big Data y Machine Learning en la Industria 4.0

Inteligencia Artificial, Internet of Things

El uso de la inteligencia artificial en el diagnóstico precoz del cáncer de piel

Actualidad, Business Intelligence, Cases Studies, Data, Machine Learning, Salud

Detectado el robo de datos a gamers desde la Deep Web

Actualidad

Iluminación IoT gracias a la alianza IoT-Ready

Internet of Things