Actualidad, AI, Inteligencia Artificial

¿Serán válidos los resultados de la IA si usa datos de Internet?

Un estudio de la Universidad Politécnica de Madrid (UPM) advierte que entrenar inteligencia artificial con datos generados por versiones anteriores vía internet «puede llevar a que un modelo más avanzado produzca resultados absurdos».

El estudio reflexiona sobre el éxito espectacular de la inteligencia artificial generativa, capaz de generar contenidos originales a partir de datos existentes. Advierte que si esta tendencia continúa, el contenido producido de esta manera podría volverse predominante en internet en los próximos años.

Los autores señalan una problemática: estas herramientas se entrenan en muchos casos con grandes conjuntos de datos extraídos de la web, lo que conlleva la posibilidad de errores en los datos de las versiones anteriores.

Impacto de la inteligencia artificial al usar Internet

El estudio explora el impacto de esta retroalimentación en modelos básicos de inteligencia artificial para generar imágenes. Concluyen que a medida que las nuevas versiones trabajan con datos generados por sus predecesoras, la calidad y diversidad de las imágenes obtenidas disminuyen drásticamente.

Observan que un modelo de difusión simple, entrenado con una categoría específica de imágenes como fotografías de pájaros y flores, produce resultados inutilizables tras varias generaciones.

Proponen que una solución aparentemente simple sería descartar los datos previamente generados por la inteligencia artificial. No obstante, señalan que existen métodos para hacerlo, aunque la constante aparición de nuevos modelos los vuelve obsoletos rápidamente.

En consecuencia, sugieren que la interacción entre los modelos de inteligencia artificial generativa y la internet puede tener efectos no deseados y abogan por investigar sus posibles implicaciones en la sociedad.

¿De dónde recopila los datos la IA?

La extracción de datos para entrenar modelos de IA suele implicar la recopilación y procesamiento de información disponible en la red, que puede incluir una amplia gama de fuentes accesibles en internet, como sitios web, redes sociales, bases de datos públicas, repositorios de datos, artículos científicos, entre otros.

Los datos extraídos pueden variar en naturaleza y propósito, desde texto escrito hasta imágenes, audio, video y otros tipos de información. Estos datos se utilizan para enseñar a los modelos de IA a comprender patrones, generar contenido y tomar decisiones basadas en la información que han procesado durante el entrenamiento.

En resumen, la inteligencia artificial utiliza datos recopilados de diversas fuentes disponibles en internet para entrenar y mejorar sus capacidades de generación y comprensión.

Samuel Rodríguez

Periodista a cargo de Ecommerce News desde 2012. Inquieto. En el camino, creé otros medios, como @BigDataMagazine y @CybersecurityNews. Organizador de cientos de eventos profesionales. Ahora con un pie en Portugal y otro en México... Muy del @GetafeCF

TE PUEDE GUSTAR

El 77% de las empresas ya invierten en IA para mejorar la experiencia del cliente

Aldana Balmaceda
29/06/2025

La IA Agéntica se consolida como una tecnología clave y transformadora en el ecosistema empresarial. Estas soluciones han evolucionado rápidamente, pasando de bots conversacionales

La inteligencia artificial revoluciona el pentesting: ¿puede igualar la calidad del experto humano?

Aldana Balmaceda
29/06/2025

En plena carrera por automatizar procesos y ganar eficiencia, la ciberseguridad no se queda atrás. El uso de inteligencia artificial (IA) en pentesting, pruebas de

El 54 % de los proveedores sanitarios en España ya usa IA para actualizar historiales médicos

Aldana Balmaceda
26/06/2025

A medida que el sector sanitario español avanza hacia su modernización de la mano de la inteligencia artificial, el nuevo informe de SOTI, El

Cómo la IA generativa resuelve retos y aporta valor

Aldana Balmaceda
19/06/2025

Minsait, compañía de Indra Group, ha mostrado en el AWS Summit Madrid 2025 casos de uso reales donde las capacidades de la IA Generativa

Málaga se proyecta con la IA y computación cuántica a nivel mundial con DES2025

Aldana Balmaceda
19/06/2025

Málaga ha vivido este martes la primera jornada de DES – Digital Enterprise Show 2025, el mayor evento de Europa sobre tecnologías exponenciales, que

Empresas innovan para una IA ética y transparente

Aldana Balmaceda
17/06/2025

La inteligencia artificial, el análisis de datos y la computación en la nube están transformando el panorama empresarial, al mismo tiempo que interactúan con

EVENTOS

Málaga se proyecta con la IA y computación cuántica a nivel mundial con DES2025

AI, Eventos

Sin inversión en tecnología, Europa será una esclava digital de otras potencias

Eventos, Machine Learning

El turismo se reinventa con IA, realidad aumentada e influencers virtuales

AI, Eventos

El ministro destaca el liderazgo tecnológico de España y pide más inversión y una IA con valores

AI, Eventos

El impacto de la IA en los ciberseguros

Eventos

CDO Day 2025: Hacer grandes inversiones de IA, en una fase tan inmadura, puede ser contraproducente

AI, Eventos

RECIBE NUESTRA NEWSLETTER

*Email:

*Nombre:

*Empresa:

Cargo:

Sector:
Acepto recibir la newsletter y comunicaciones de BigData Magazine conforme a la Política de Privacidad

Acepto recibir comunicaciones comerciales de terceros relacionados con el sector del BigData e IA

Please don't insert text in the box below!

ESCUCHA NUESTRO PODCAST

SÍGUENOS EN RRSS

SÍGUENOS EN FACEBOOK

SÍGUENOS EN TWITTER

SÍGUENOS EN LINKEDIN

SÍGUENOS EN YOUTUBE

MÁS COMENTADOS

Cómo la analítica avanzada puede mejorar las operaciones en el sector retail

Actualidad, Business Intelligence, Inteligencia Artificial, Retail

«El Big Data en el entorno de la industria logística va a ser imprescindible y SEUR lo vimos hace años»

Actualidad, Entrevistas

Utilización de Big Data y Machine Learning en la Industria 4.0

Inteligencia Artificial, Internet of Things

El uso de la inteligencia artificial en el diagnóstico precoz del cáncer de piel

Actualidad, Business Intelligence, Cases Studies, Data, Machine Learning, Salud

Detectado el robo de datos a gamers desde la Deep Web

Actualidad

Iluminación IoT gracias a la alianza IoT-Ready

Internet of Things