¿Cuánto fallan los sistemas de reconocimiento de voz?

9 noviembre, 2020
6 Compartido 940 Visualizaciones

Expertos creen que el reconocimiento preciso oscila entre el 2% y el 3%, pero advierten de que hay muchos usuarios que optan por simplificar sus mensajes al saber que están interactuando con máquinas, lo que favorece el entendimiento.

Algunos sistemas de reconocimiento automático de voz (ASR) pueden ser menos precisos de lo que se suponía en un principio. El hallazgo surge a raíz de una investigación de la Universidad Johns Hopkins, la Universidad de Tecnología de Poznań en Polonia, la Universidad de Ciencia y Tecnología de Wrocław y la startup Avaya.

Investigadores han comparado modelos comerciales de reconocimiento de voz en un conjunto de datos creado internamente. Los coautores del estudio afirman que las tasas de error de palabras han sido significativamente más altas que lo esperado en un principio, por lo que esto podría indicar un problema de mayor alcance a la hora de procesar el lenguaje humano.

Interacción con chatbots

El estudio se basa en el modelo de reconocimiento de voz ASR, a través del cual se puede dictar reuniones y correos electrónicos, y ayudar a administrar dispositivos inteligentes y más. Un punto de referencia completo de modelos ASR es un reconocimiento entre el 2% y el 3% de la voz.

De hecho, indican que la mayoría de las interacciones con los ASR ocurren en el contexto de «interacciones tipo chatbot», donde las personas saben que están conversando con una máquina y, por lo tanto, simplifican su comunicación realizando frases breves y bien estructuradas en lugar de otro tipo de frases.

Los investigadores plantean que se trabaje en modelos acústicos inclusivos que representen un espectro más amplio de dialectos, así como modelos que den cuenta de los avances tecnológicos que influyen en las propiedades físicas de las señales de audio procesadas, ya que consideran que esto podría ser determinante de cara a obtener menos fallos a la hora de procesar mensajes las máquinas.

Advierten que “estos problemas no son insuperables», sino que a través de una colaboración entre ingenieros y las empresas podría conducir a un mejor y más preciso procesamiento de la información por voz.

Te podría interesar

¿Qué es Big Data Marketing? 5 formas en que las Startups lo usan para crecer
Actualidad
8 compartido4,355 visualizaciones
Actualidad
8 compartido4,355 visualizaciones

¿Qué es Big Data Marketing? 5 formas en que las Startups lo usan para crecer

Redacción BDM - 21 octubre, 2019

[caption id="attachment_13236" align="alignright" width="250"] Italo Viale es CEO de Bigseo Marketing.[/caption] La información es un recurso indispensable para el buen funcionamiento de un negocio, más aún si…

Cómo entregar información de valor al CDO
BD Network
14 compartido1,952 visualizaciones
BD Network
14 compartido1,952 visualizaciones

Cómo entregar información de valor al CDO

Mónica Gallego - 28 septiembre, 2018

El lunes 25 de septiembre tuvo lugar el Chief Data Officer (CDO) Day, José Juan Sanchez, de Denodo y Javier Martínez, de Bankia, nos dan las claves…

Las granjas avícolas recurren al Big Data para garantizar el control de la producción
Actualidad
6 compartido876 visualizaciones
Actualidad
6 compartido876 visualizaciones

Las granjas avícolas recurren al Big Data para garantizar el control de la producción

Rocio González - 17 septiembre, 2020

A través de sensores reciben datos sobre las aves y pueden detectar de forma temprana posibles infecciones y enfermedades. Si se quiere ser eficiente en la producción…

Dejar comentario

Su email no será publicado

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.