Actualidad, AI, Chatbots, Inteligencia Artificial

¿Con qué frecuencia inventan datos los chatbots?

Un equipo de científicos de datos liderado por extrabajadores de Google investiga con qué frecuencia los chatbots inventan la información que ofrecen al usuario.

Cuando OpenAI, la startup con sede en San Francisco, lanzó su chatbot en línea ChatGPT a finales de 2022, millones de usuarios quedaron fascinados por su capacidad para responder preguntas, escribir poesía y mantener conversaciones sobre una variedad de temas de manera sorprendentemente humana. Sin embargo, lo que muchos tardaron en percibir es que este tipo de chatbot a menudo crea información de la nada.

Datos sin sentido

Google presentó un chatbot similar unas semanas más tarde, generando datos sin sentido sobre el telescopio espacial James Webb. Al día siguiente, el nuevo chatbot de Bing de Microsoft ofreció información falsa sobre Gap, la vida nocturna mexicana y la cantante Billie Eilish. En marzo, ChatGPT citó casos judiciales falsos al redactar un documento legal de 10 páginas presentado ante un tribunal federal en Manhattan.

Ahora, una nueva startup llamada Vectara, fundada por ex empleados de Google, está investigando con qué frecuencia los chatbots se desvían de la verdad. Según la investigación de la compañía, incluso en situaciones diseñadas para evitar este problema, los chatbots inventan información al menos el 3% de las veces, y hasta un 27% en algunos casos.

Este comportamiento de los chatbots, definido por los expertos como «alucinación», podría no ser un problema para aquellos que interactúan casualmente con chatbots en sus computadoras personales, pero representa un riesgo significativo para quienes utilizan esta tecnología en documentos judiciales, información médica o datos comerciales confidenciales.

Tasas de alucinación de los chatbots

Los investigadores de Vectara solicitaron a los chatbots que realizaran una tarea simple y verificable: resumir artículos de noticias. Aun en estas circunstancias, los chatbots inventaron información de manera persistente.

La investigación también reveló que las tasas de alucinación varían entre las principales empresas de inteligencia artificial. Las tecnologías de OpenAI mostraron la tasa más baja, alrededor del 3 por ciento, mientras que los sistemas de Meta, propietaria de Facebook e Instagram, rondaron el 5 por ciento. El sistema Claude 2 de Anthropic, un competidor de OpenAI, superó el 8 por ciento. Por otro lado, el sistema de Google, Palm chat, tuvo la tasa más alta con un 27 por ciento.

Con esta investigación, los fundadores de Vectara, Simon Hughes y Amr Awadallah, buscan concientizar sobre la necesidad de precaución al utilizar la información generada por chatbots y servicios similares. La empresa espera que sus métodos, que comparten públicamente, impulsen los esfuerzos de la industria para reducir las alucinaciones. Aunque compañías como OpenAI y Google están trabajando en técnicas para minimizar el problema, aún no está claro si podrán eliminarlo por completo.

Los chatbots, como ChatGPT, operan mediante una tecnología conocida como modelo de lenguaje de gran tamaño (LLM, por sus siglas en inglés). Este modelo adquiere sus habilidades mediante el análisis extenso de cantidades masivas de texto digital, que incluyen libros, entradas de Wikipedia y registros de conversaciones en línea. Al detectar patrones en estos datos, un LLM aprende a realizar una tarea específica: prever la siguiente palabra en una secuencia de palabras.

Samuel Rodríguez

Periodista a cargo de Ecommerce News desde 2012. Inquieto. En el camino, creé otros medios, como @BigDataMagazine y @CybersecurityNews. Organizador de cientos de eventos profesionales. Ahora con un pie en Portugal y otro en México... Muy del @GetafeCF

TE PUEDE GUSTAR

Inteligencia artificial vs inteligencia emocional: así se reequilibra el modelo asegurador

Aldana Balmaceda
03/07/2025

La transformación digital en el sector asegurador avanza a una velocidad sin precedentes. Tecnologías como la inteligencia artificial, el aprendizaje automático o la automatización

La IA generativa tendrá un papel crítico en la ciberseguridad en 2030

Aldana Balmaceda
03/07/2025

Hoy en día, la relación directa entre la adopción de nuevas tecnologías y la ciberseguridad en las organizaciones es incuestionable. A medida que las

Cuatro lecciones para crear una empresa nativa de IA

Aldana Balmaceda
02/07/2025

La IA generativa ha redefinido lo que es posible, pero para los líderes empresariales, el reto va más allá de la mera adopción de

Canva integra la generación de videos con voz con IA

Aldana Balmaceda
02/07/2025

Canva acaba de anunciar que ha incorporado generación de video con audio mediante IA, impulsada por el modelo Veo 3 de Google. De hecho,

Solo el 9% usa IA

Aldana Balmaceda
01/07/2025

Semrush, plataforma de gestión de visibilidad online y marketing de contenidos, ha publicado su último informe titulado The Rise of the Full-Stack Marketer, un

Bosch apuesta fuertemente por la IA como motor de crecimiento

Aldana Balmaceda
01/07/2025

Hoy en día, la inteligencia artificial (IA) está presente en todas partes. Bosch reconoció desde muy temprano las oportunidades que ofrecía esta tecnología e

EVENTOS

Bosch apuesta fuertemente por la IA como motor de crecimiento

Eventos, Inteligencia Artificial

Málaga se proyecta con la IA y computación cuántica a nivel mundial con DES2025

AI, Eventos

Sin inversión en tecnología, Europa será una esclava digital de otras potencias

Eventos, Machine Learning

El turismo se reinventa con IA, realidad aumentada e influencers virtuales

AI, Eventos

El ministro destaca el liderazgo tecnológico de España y pide más inversión y una IA con valores

AI, Eventos

El impacto de la IA en los ciberseguros

Eventos

RECIBE NUESTRA NEWSLETTER

*Email:

*Nombre:

*Empresa:

Cargo:

Sector:
Acepto recibir la newsletter y comunicaciones de BigData Magazine conforme a la Política de Privacidad

Acepto recibir comunicaciones comerciales de terceros relacionados con el sector del BigData e IA

Please don't insert text in the box below!

ESCUCHA NUESTRO PODCAST

SÍGUENOS EN RRSS

SÍGUENOS EN FACEBOOK

SÍGUENOS EN TWITTER

SÍGUENOS EN LINKEDIN

SÍGUENOS EN YOUTUBE

MÁS COMENTADOS

Cómo la analítica avanzada puede mejorar las operaciones en el sector retail

Actualidad, Business Intelligence, Inteligencia Artificial, Retail

«El Big Data en el entorno de la industria logística va a ser imprescindible y SEUR lo vimos hace años»

Actualidad, Entrevistas

Utilización de Big Data y Machine Learning en la Industria 4.0

Inteligencia Artificial, Internet of Things

El uso de la inteligencia artificial en el diagnóstico precoz del cáncer de piel

Actualidad, Business Intelligence, Cases Studies, Data, Machine Learning, Salud

Detectado el robo de datos a gamers desde la Deep Web

Actualidad

Iluminación IoT gracias a la alianza IoT-Ready

Internet of Things