Actualidad, AI, Data, Inteligencia Artificial

La inteligencia artificial ‘clona’ voces humanas

Expertos en inteligencia artificial estudian cómo las máquinas suplantan las voces humanas y evolucionan para evitar que se identifique si habla un robot o una persona.

La ciencia que hay detrás de hacer que las máquinas hablen como los humanos es muy compleja, porque nuestros patrones de habla tienen muchos matices. «La voz no es fácil de entender», dice Klaus Scherer, profesor emérito de psicología de las emociones en la Universidad de Ginebra. «Para analizar la voz se necesitan muchos conocimientos sobre acústica, mecanismos vocales y aspectos fisiológicos. Así que es necesariamente interdisciplinario, y bastante exigente en cuanto a lo que hay que dominar para hacer algo de importancia».

Así que no es de extrañar que las voces sintéticas hayan tardado más de 200 años en pasar de la primera máquina de hablar, inventada por Wolfgang von Kempelen alrededor de 1800 -un artilugio con forma de caja que utilizaba fuelles, tubos y una boca y nariz de goma para simular unas pocas expresiones humanas reconocibles, como mamá y papá- a un clon de la voz de Samuel L. Jackson que ofrece el informe del tiempo en Alexa.

Las máquinas parlantes como Siri, Google Assistant y Alexa, o la línea automatizada de atención al cliente de un banco, suenan ahora bastante humanas. Gracias a los avances en inteligencia artificial, o IA, hemos llegado a un punto en el que a veces es difícil distinguir las voces sintéticas de las reales.

Quería saber qué implica el proceso en el lado del cliente. Así que me puse en contacto con la empresa de síntesis de lenguaje natural Speech Morphing, con sede en la Bahía de San Francisco, para crear un clon -o «doble digital»- de mi propia voz.

Clonación de la voz de una reportera

Dada la complejidad de la síntesis de voz, resulta bastante sorprendente descubrir lo fácil que es encargar una. Para una construcción conversacional básica, todo lo que el cliente tiene que hacer es grabarse diciendo un montón de líneas con guión durante aproximadamente una hora. Y eso es todo.

«Extraemos de 10 a 15 minutos de grabaciones netas para una construcción básica», dice el fundador y director general de Speech Morphing, Fathy Yassa.

Los cientos de frases que grabo para que Speech Morphing pueda construir mi doble de voz digital parecen muy aleatorios: «Aquí la explosión de alegría lo ahogó». «Eso es lo que hizo Carnegie». «Me gustaría que me enterraran bajo el estadio de los Yankees con JFK». Y así sucesivamente.

Pero no son tan aleatorios como parecen. Yassa dice que la empresa elige expresiones que produzcan una variedad suficientemente amplia de sonidos a través de una gama de emociones -como disculpa, entusiasmo, enfado, etc.- para alimentar un sistema de entrenamiento de IA basado en una red neuronal. Esencialmente, se enseña a sí mismo los patrones específicos del habla de una persona.

Samuel Rodríguez

Periodista a cargo de Ecommerce News desde 2012. Inquieto. En el camino, creé otros medios, como @BigDataMagazine y @CybersecurityNews. Organizador de cientos de eventos profesionales. Ahora con un pie en Portugal y otro en México... Muy del @GetafeCF

TE PUEDE GUSTAR

Inteligencia artificial vs inteligencia emocional: así se reequilibra el modelo asegurador

Aldana Balmaceda
03/07/2025

La transformación digital en el sector asegurador avanza a una velocidad sin precedentes. Tecnologías como la inteligencia artificial, el aprendizaje automático o la automatización

La IA generativa tendrá un papel crítico en la ciberseguridad en 2030

Aldana Balmaceda
03/07/2025

Hoy en día, la relación directa entre la adopción de nuevas tecnologías y la ciberseguridad en las organizaciones es incuestionable. A medida que las

Cuatro lecciones para crear una empresa nativa de IA

Aldana Balmaceda
02/07/2025

La IA generativa ha redefinido lo que es posible, pero para los líderes empresariales, el reto va más allá de la mera adopción de

Canva integra la generación de videos con voz con IA

Aldana Balmaceda
02/07/2025

Canva acaba de anunciar que ha incorporado generación de video con audio mediante IA, impulsada por el modelo Veo 3 de Google. De hecho,

Solo el 9% usa IA

Aldana Balmaceda
01/07/2025

Semrush, plataforma de gestión de visibilidad online y marketing de contenidos, ha publicado su último informe titulado The Rise of the Full-Stack Marketer, un

Bosch apuesta fuertemente por la IA como motor de crecimiento

Aldana Balmaceda
01/07/2025

Hoy en día, la inteligencia artificial (IA) está presente en todas partes. Bosch reconoció desde muy temprano las oportunidades que ofrecía esta tecnología e

EVENTOS

Bosch apuesta fuertemente por la IA como motor de crecimiento

Eventos, Inteligencia Artificial

Málaga se proyecta con la IA y computación cuántica a nivel mundial con DES2025

AI, Eventos

Sin inversión en tecnología, Europa será una esclava digital de otras potencias

Eventos, Machine Learning

El turismo se reinventa con IA, realidad aumentada e influencers virtuales

AI, Eventos

El ministro destaca el liderazgo tecnológico de España y pide más inversión y una IA con valores

AI, Eventos

El impacto de la IA en los ciberseguros

Eventos

RECIBE NUESTRA NEWSLETTER

*Email:

*Nombre:

*Empresa:

Cargo:

Sector:
Acepto recibir la newsletter y comunicaciones de BigData Magazine conforme a la Política de Privacidad

Acepto recibir comunicaciones comerciales de terceros relacionados con el sector del BigData e IA

Please don't insert text in the box below!

ESCUCHA NUESTRO PODCAST

SÍGUENOS EN RRSS

SÍGUENOS EN FACEBOOK

SÍGUENOS EN TWITTER

SÍGUENOS EN LINKEDIN

SÍGUENOS EN YOUTUBE

MÁS COMENTADOS

Cómo la analítica avanzada puede mejorar las operaciones en el sector retail

Actualidad, Business Intelligence, Inteligencia Artificial, Retail

«El Big Data en el entorno de la industria logística va a ser imprescindible y SEUR lo vimos hace años»

Actualidad, Entrevistas

Utilización de Big Data y Machine Learning en la Industria 4.0

Inteligencia Artificial, Internet of Things

El uso de la inteligencia artificial en el diagnóstico precoz del cáncer de piel

Actualidad, Business Intelligence, Cases Studies, Data, Machine Learning, Salud

Detectado el robo de datos a gamers desde la Deep Web

Actualidad

Iluminación IoT gracias a la alianza IoT-Ready

Internet of Things