El OpenAI no deja de sorprendernos, tan solo hace unos meses saca su nuevo NPL, el GPT-3, y ahora nos anuncian en su blog el nuevo cambio que le han dado a la antigua versión.
La nueva funcionalidad del GPT-2 le permite crear imagenes, si como lees, el OpenAI lo ha entrenado con pixeles en vez de palabras para generar imágenes y precedir cómo completarlas.
La clasificación de imágenes con sistemas de Inteligencia Artificial no ha tenido exito. Por eso, los investigadores del OpenAI se han centrado en entrenar el GPT-2 en imágenes con largas secuencias de píxeles, que llaman iGTP, descubriendo así que el modelo es capaz de entender lo que aparece en las imágenes en 2D. No es necesario que sean etiquetadas previamente por una persona.
Evaluación
Se ha probado en la web de ImageNet

Este algoritmo de aprendizaje no supervisado, utiliza la misma arquitectura de transformación que el GTP-2 cuándo se utiliza para textos.

