Netflix utiliza la Inteligencia Artificial para poner subtítulos

La audiencia de Netflix es cada vez más global, ya que la compañía ha logrado llegar a todos los rincones del planeta, bueno a casi todos, ya que no ha conseguido entrar en China, Crimea, Corea del Norte y Siria.

Llegar a tantos países tiene un problema, el idioma. Hasta el momento había conseguido romper la barrera del idioma, pero el desafio radica en asegurarse de que las traducciones son precisas.

Un grupo de investigadores de Machine Learning de Netflix han introducido un nuevo enfoque para abordar este tema, lo han llamado Automatic Pre-Processing or APP. Este proceso, según afirman los investigadores, dará traducciones cercanas al lenguaje nativo al que se esté traducciendo.

Por ejemplo, si una frase en ingles es «The
vice president should feel free to jump in» al traducirse con Google Translate al Hindi aparece como «Vice President should feel free to jump inside». No se obtienen buenos resultados.

Los sistemas de traducción automática (MT) entrenados en conjuntos de entrenamiento más pequeños suelen dar resultados que se desvían del contexto. Por eso, los investigadores para abordar el problema adoptan la noción de que traducir traducciones posteriores es más fácil que traducir oraciones de origen natural.

La evaluación del sistema se ha hecho con un conjunto de datos GIGS, Wikilarge y Open Subtitles. El conjunto de datos FIGS proviene de los subtítulos que aparecen en 12.301 programas de televisión y películas de un proveedor de vídeo bajo demanda de suscripción.

Los investigadores han utilizado arquitecturas de transformación a travñes de la biblioteca tensor2tensor. Todos los experimentos se llevaron a cabo utilizando la arquitectura base del transformador con 6 bloques en el codificador y el decodificador y se ejecutan con 4 GPU NVIDIA V100.

El sistema se centra principalmente en los subtítulos en el ingles, pero puede utilizarse en otros idiomas.

TE PUEDE GUSTAR

EVENTOS

RECIBE NUESTRA NEWSLETTER

*Email:

*Nombre:

*Empresa:

Cargo:

Sector:
     

Please don't insert text in the box below!

ESCUCHA NUESTRO PODCAST

SÍGUENOS EN RRSS

MÁS COMENTADOS

Scroll al inicio