Actualidad, Data

Google DeepMind: los flujos de trabajo con algoritmos RL serán más fáciles de desarrollar

Acme es la nueva librería que permitirá construir algoritmos RL fiables, eficientes y orientados a la investigación.

«Acme: A Research Framework for Distributed Reinforcement Learning» es el nombre del documento publicado por los investigadores de DeepMind donde se prensenta un marco que tiene como objetivo permitir que se ejecuten implementaciones simples de agentes RL en diferentes escalas de ejecución. Resolviendo así uno de los problemas habituales.

Con Acme los investigadores podrán escalar mientras se asegura de que los agentes de RL ofrezcan los resultados deseados. Para ello los desarrolladores de DeepMind han tenido en cuenta, varios principios de diseño que permitirán a los desarrolladores crear, probar y depurar agentes RL fácilmente en escenarios a pequeña escala antes de escalarlos.

Acme también aprovecha Reverb, un sistema de almacenamiento de datos eficiente que fue especialmente diseñado para flujos de trabajo de aprendizaje automático. También, admite otras representaciones de estrucutra de datos como FIFO y colas de prioridad para simplificar su uso para algoritmos dentro y fuera de la directiva.

¿Qué es el aprendizaje por refuerzo?

El aprendizaje por refuerzo es un área de la inteligencia artificial que se centra en maximizar la recompensa. No se le indican las acciones que debe tomar, sino que se le permite experimentar para que el solo obtenga el mejor resultado. Esto no significa que sea lo mismo que el aprendizaje no supervisado.

El aprendizaje por RL se ha utilizado para mapear entradas de sensores, agarrar objetos y controlar movimientos de robots. Esto ha permitido que los robots puedan moverse libremente en grandes distancias, lo que ha hecho posible que se empiecen a utilizar las robots para traer la compra p repartir paquetes.

Explicación más extensa de que han querido hacer con Acme

El equipo de DeepMind ha explicado que diseñaron Acme para permitir que los agentes que se ejecutan tanto en un solo proceso como en régimen altamente distribuidos al proporcionar herramientas y componentes para construir agentes en varios niveles de abstracción, desde los más bajos (p. ej., redes, pérdidas, políticas) hasta los trabajadores (actores, aprendices, memorias intermedias de reproducción), y finalmente agentes completos. Todo esto permite la medición y evaluación de la capacitación, registro y verificación de puntos.

Han descrito Acme como una interfaz RL clásica que conecta a los actores con su entorno. Los actores pueden hacer observaciones y seleccionar acciones que se retroalimentarán en el entorno en consecuencia y luego se utilizarán para actualizar el estado interno del actor. La división interna de actuar y aprender de los datos también permite a los investigadores reutilizar la porción de actuación en muchos agentes diferentes.

Redacción BDM

TE PUEDE GUSTAR

Cuatro lecciones para crear una empresa nativa de IA

Aldana Balmaceda
02/07/2025

La IA generativa ha redefinido lo que es posible, pero para los líderes empresariales, el reto va más allá de la mera adopción de

Canva integra la generación de videos con voz con IA

Aldana Balmaceda
02/07/2025

Canva acaba de anunciar que ha incorporado generación de video con audio mediante IA, impulsada por el modelo Veo 3 de Google. De hecho,

Solo el 9% usa IA

Aldana Balmaceda
01/07/2025

Semrush, plataforma de gestión de visibilidad online y marketing de contenidos, ha publicado su último informe titulado The Rise of the Full-Stack Marketer, un

Bosch apuesta fuertemente por la IA como motor de crecimiento

Aldana Balmaceda
01/07/2025

Hoy en día, la inteligencia artificial (IA) está presente en todas partes. Bosch reconoció desde muy temprano las oportunidades que ofrecía esta tecnología e

La carrera por liderar la Inteligencia Artificial se intensifica

Aldana Balmaceda
30/06/2025

NetApp®, compañía especializada en infraestructura de datos inteligente, ha presentado su nuevo informe The AI Space Race, que analiza qué países están mejor posicionados

La IA dispara un 466 % las estafas de phishing en España

Aldana Balmaceda
30/06/2025

La Inteligencia Artificial se ha convertido en una herramienta esencial para los ciberdelincuentes, permitiéndoles diseñar campañas de phishing cada vez más sofisticadas y rentables.

EVENTOS

Bosch apuesta fuertemente por la IA como motor de crecimiento

Eventos, Inteligencia Artificial

Málaga se proyecta con la IA y computación cuántica a nivel mundial con DES2025

AI, Eventos

Sin inversión en tecnología, Europa será una esclava digital de otras potencias

Eventos, Machine Learning

El turismo se reinventa con IA, realidad aumentada e influencers virtuales

AI, Eventos

El ministro destaca el liderazgo tecnológico de España y pide más inversión y una IA con valores

AI, Eventos

El impacto de la IA en los ciberseguros

Eventos

RECIBE NUESTRA NEWSLETTER

*Email:

*Nombre:

*Empresa:

Cargo:

Sector:
Acepto recibir la newsletter y comunicaciones de BigData Magazine conforme a la Política de Privacidad

Acepto recibir comunicaciones comerciales de terceros relacionados con el sector del BigData e IA

Please don't insert text in the box below!

ESCUCHA NUESTRO PODCAST

SÍGUENOS EN RRSS

SÍGUENOS EN FACEBOOK

SÍGUENOS EN TWITTER

SÍGUENOS EN LINKEDIN

SÍGUENOS EN YOUTUBE

MÁS COMENTADOS

Cómo la analítica avanzada puede mejorar las operaciones en el sector retail

Actualidad, Business Intelligence, Inteligencia Artificial, Retail

«El Big Data en el entorno de la industria logística va a ser imprescindible y SEUR lo vimos hace años»

Actualidad, Entrevistas

Utilización de Big Data y Machine Learning en la Industria 4.0

Inteligencia Artificial, Internet of Things

El uso de la inteligencia artificial en el diagnóstico precoz del cáncer de piel

Actualidad, Business Intelligence, Cases Studies, Data, Machine Learning, Salud

Detectado el robo de datos a gamers desde la Deep Web

Actualidad

Iluminación IoT gracias a la alianza IoT-Ready

Internet of Things