Actualidad, Data

¿Son tus datos realmente buenos para tus planes de IA?

El desarrollo de la IA es una prioridad para las empresas y los gobiernos de todo el mundo. Sin embargo, hay un aspecto fundamental de la IA que se sigue descuidando: la mala calidad de los datos.

Los algoritmos de IA dependen de datos fiables para generar resultados óptimos; si los datos son sesgados, incompletos, insuficientes e inexactos, se producen consecuencias devastadoras.

Los sistemas de IA que identifican las enfermedades de los pacientes son un excelente ejemplo de cómo la mala calidad de los datos puede conducir a resultados adversos. Cuando se ingieren con datos insuficientes, estos sistemas producen diagnósticos falsos y predicciones inexactas que dan lugar a diagnósticos erróneos y retrasos en los tratamientos. Por ejemplo, un estudio realizado en la Universidad de Cambridge sobre más de 400 herramientas utilizadas para el diagnóstico de Covid-19 descubrió que los informes generados por la IA eran totalmente inutilizables, a causa de conjuntos de datos defectuosos. En otras palabras, sus iniciativas de IA tendrán consecuencias devastadoras en el mundo real si sus datos no son lo suficientemente buenos.

¿Qué significan los datos «suficientemente buenos»?

Existe un gran debate sobre el significado de los datos «suficientemente buenos». Algunos dicen que los datos suficientemente buenos no existen. Otros dicen que la necesidad de datos buenos provoca una parálisis en el análisis, mientras que HBR afirma rotundamente que sus herramientas de aprendizaje automático son inútiles si su información es terrible.

La mayoría de las empresas luchan con la calidad y el gobierno de los datos más de lo que admiten. Además, están abrumadas y bajo una inmensa presión para desplegar iniciativas de IA para seguir siendo competitivas. Lamentablemente, esto significa que problemas como los datos sucios ni siquiera forman parte de las discusiones de la sala de juntas hasta que provocan el fracaso de un proyecto.

¿Cómo afectan los datos deficientes a los sistemas de IA?

Los problemas de calidad de los datos surgen al principio del proceso, cuando el algoritmo se alimenta de datos de entrenamiento para aprender patrones. Por ejemplo, si a un algoritmo de IA se le proporcionan datos de redes sociales sin filtrar, recoge abusos, comentarios racistas y misóginos, como se ha visto con el bot de IA de Microsoft. Recientemente, también se cree que la incapacidad de la IA para detectar a las personas de piel oscura se debe a datos parciales.

¿Cómo se relaciona esto con la calidad de los datos?

La ausencia de gobernanza de los datos, la falta de concienciación sobre la calidad de los datos y las vistas aisladas de los datos (en las que se puede haber notado esa disparidad de género) conducen a resultados deficientes.

Cuando las empresas se dan cuenta de que tienen un problema de calidad de datos, entran en pánico a la hora de contratar. Se contratan ciegamente consultores, ingenieros y analistas para diagnosticar, limpiar los datos y resolver los problemas lo antes posible. Desgraciadamente, pasan meses antes de que se produzca ningún progreso y, a pesar de gastar millones en la plantilla, los problemas no parecen desaparecer. Un enfoque instintivo de un problema de calidad de datos no es muy útil.

Samuel Rodríguez

Periodista a cargo de Ecommerce News desde 2012. Inquieto. En el camino, creé otros medios, como @BigDataMagazine y @CybersecurityNews. Organizador de cientos de eventos profesionales. Ahora con un pie en Portugal y otro en México... Muy del @GetafeCF

TE PUEDE GUSTAR

La IA revoluciona el SEO: caen las visitas web pese a las búsquedas

Aldana Balmaceda
09/07/2025

La revolución de la inteligencia artificial está transformando profundamente el ecosistema digital. Herramientas como ChatGPT y las nuevas funciones de búsqueda de Google están

La IA generará 3 millones de empleos: formarse es vital

Aldana Balmaceda
09/07/2025

La llegada de la Inteligencia Artificial (IA) ha revolucionado la industria a todos los niveles. Tanto para uso cotidiano como para el ámbito profesional,

El sector sanitario es el que más rápidamente está adoptando la GenAI

Aldana Balmaceda
08/07/2025

Nutanix, empresa de computación híbrida multicloud, ha presentado los resultados del estudio anual Enterprise Cloud Index (ECI) para el sector sanitario, analizando el progreso

El 96% de las empresas cree que la IA es una oportunidad de crecimiento para los empleados

Aldana Balmaceda
08/07/2025

La inteligencia artificial (IA) ha comenzado a integrarse como herramienta en las empresas y organizaciones, pero su despliegue aún está lejos de ser integral.

BBVA amplía su alianza con Google Cloud para innovar con IA

Aldana Balmaceda
07/07/2025

BBVA y Google Cloud han anunciado hoy la implantación de Google Workspace con Gemini en todas las operaciones del banco a escala global. Con

Transparencia y ética en la Inteligencia Artificial: un imperativo urgente

Aldana Balmaceda
06/07/2025

En el marco de su conferencia europea de referencia, Kaspersky Horizons, celebrada en Madrid del 30 de junio al 2 de julio de 2025,

EVENTOS

Transparencia y ética en la Inteligencia Artificial: un imperativo urgente

Eventos, Inteligencia Artificial

Bosch apuesta fuertemente por la IA como motor de crecimiento

Eventos, Inteligencia Artificial

Málaga se proyecta con la IA y computación cuántica a nivel mundial con DES2025

AI, Eventos

Sin inversión en tecnología, Europa será una esclava digital de otras potencias

Eventos, Machine Learning

El turismo se reinventa con IA, realidad aumentada e influencers virtuales

AI, Eventos

El ministro destaca el liderazgo tecnológico de España y pide más inversión y una IA con valores

AI, Eventos

RECIBE NUESTRA NEWSLETTER

*Email:

*Nombre:

*Empresa:

Cargo:

Sector:
Acepto recibir la newsletter y comunicaciones de BigData Magazine conforme a la Política de Privacidad

Acepto recibir comunicaciones comerciales de terceros relacionados con el sector del BigData e IA

Please don't insert text in the box below!

ESCUCHA NUESTRO PODCAST

SÍGUENOS EN RRSS

SÍGUENOS EN FACEBOOK

SÍGUENOS EN TWITTER

SÍGUENOS EN LINKEDIN

SÍGUENOS EN YOUTUBE

MÁS COMENTADOS

Cómo la analítica avanzada puede mejorar las operaciones en el sector retail

Actualidad, Business Intelligence, Inteligencia Artificial, Retail

«El Big Data en el entorno de la industria logística va a ser imprescindible y SEUR lo vimos hace años»

Actualidad, Entrevistas

Utilización de Big Data y Machine Learning en la Industria 4.0

Inteligencia Artificial, Internet of Things

El uso de la inteligencia artificial en el diagnóstico precoz del cáncer de piel

Actualidad, Business Intelligence, Cases Studies, Data, Machine Learning, Salud

Detectado el robo de datos a gamers desde la Deep Web

Actualidad

Iluminación IoT gracias a la alianza IoT-Ready

Internet of Things