Data Echoing: qué es y cómo acelera el entrenamiento

¿Cuál es la solución para entrenar de forma más rápida redes neuronales profundas? ¿Construir procesadores rápidos? Esta sería una manera, sino fuera porque ahora tenemos GPU y TDU. Si la velocidad no es suficiente, ¿Deberíamos desarrollar procesadores que sean aún más rápidos?

Estas son algunas de las preguntas que surgen cuándo comienzas un proyecto y los investigadores de Google IA tienen clara la respuesta para todas ellas, no. Según sus investigadores, en la actualidad ya se han visto casos en los que los aceleradores están inactivos la mayor parte del tiempo mientras esperan la entrada. Por lo tanto, en lugar de ajustar el hardware, introdujeron un concepto más simple a nivel algorítmico, que llaman data Echoing. Hablan de él en el nuevo artículo publicado en su blog, «Faster Neural Network Training with Data Echoing«.

El Data Echoing, como su nombre indica, es una técnica que reutiliza los datos de salida de los pasos anteriores en lugar de mantener los procesadores esperando datos nuevos.

¿Cómo funciona Data Echoing?

Con Data Echoing lo que ocurre es que una vez que se ha optimiza el lote, este se reutiliza y se realiza un segundo paso antes de que el siguiente lote este listo. En el mejor de los casos, los datos repetidos son tan útiles como los datos nuevos. Pero en realidad, los investigadores han admitido que esta técnica proporciona una aceleración ligeramente menor porque los datos repetidos no son tan útiles como los datos nuevos, pero todavía puede proporcionar una aceleración significativa en comparación con dejar el acelerador inactivo.

Para probar el funcionamiento de la técnica realizaron varios experimentos. Los investigadores probaron los datos que se hacen eco en cinco canalizaciones de entrenamiento de redes neuronales que abarcan 3 tareas diferentes (clasificación de imágenes, modelado de lenguaje y detección de objetos) y midieron el número de nuevos ejemplos necesarios para alcanzar un objetivo de rendimiento determinado.

Encontraron que la Data Echoing puede ayudar a alcanzar el rendimiento de destino con menos ejemplos nuevos, lo que demuestra que la reutilización de datos es útil para reducir la E/S de disco en una variedad de tareas. En algunos casos, los datos repetidos son casi tan útiles como los datos nuevos como los ecos antes del aumento reduce el número de nuevos ejemplos requeridos casi por el factor de repetición ‘e’.

TE PUEDE GUSTAR

EVENTOS

RECIBE NUESTRA NEWSLETTER

*Email:

*Nombre:

*Empresa:

Cargo:

Sector:
     

Please don't insert text in the box below!

ESCUCHA NUESTRO PODCAST

SÍGUENOS EN RRSS

MÁS COMENTADOS

Scroll al inicio
Resumen de privacidad

Las cookies y otras tecnologías similares son una parte esencial de cómo funciona nuestra web. El objetivo principal de las cookies es que tu experiencia de navegación sea más cómoda y eficiente y poder mejorar nuestros servicios y la propia web. Aquí podrás obtener toda la información sobre las cookies que utilizamos y podrás activar y/o desactivar las mismas de acuerdo con tus preferencias, salvo aquellas Cookies que son estrictamente necesarias para el funcionamiento de la web de BigDataMagazine. Ten en cuenta que el bloqueo de algunas cookies puede afectar tu experiencia en la web y el funcionamiento de la misma. Al pulsar “Guardar cambios”, se guardará la selección de cookies que has realizado. Si no has seleccionado ninguna opción, pulsar este botón equivaldrá a rechazar todas las cookies. Para más información puedes visitar nuestra Políticas de Cookies. Podrás cambiar en cualquier momento tus preferencias de cookies pinchando en el enlace “Preferencias de cookies” situado en la parte inferior de nuestra web.