OpenAI ha anunciado la generación de imágenes en ChatGPT, que comenzará a implementarse para los usuarios de ChatGPT Plus, Pro, Team y Free como la herramienta de generación de imágenes predeterminada en el modelo 4o. También estará disponible en Sora. Los niveles ChatGPT Enterprise y Edu tendrán acceso próximamente.
ChatGPT ahora puede generar imágenes de alta calidad basadas en los mensajes del usuario, la conversación y los archivos cargados. Esta función permite tanto la creación de nuevas imágenes como la transformación de imágenes existentes, con mejoras en la representación de texto, el seguimiento de indicaciones y la comprensión del contexto.
Se han ampliado las posibilidades de generación de imágenes al simplificar el proceso en un único modelo. GPT-4o utiliza un enfoque autorregresivo y su conocimiento del mundo real para ofrecer resultados de nivel profesional de manera más intuitiva y útil.
Algunas aplicaciones clave incluyen:
- Generación de imágenes para trabajos donde la precisión es importante: diagramas, infografías, gráficos promocionales para redes sociales con códigos hexadecimales, logotipos, instrucciones complejas.
- Imágenes con alto contenido de texto: carteles de instrucciones, visualización de conceptos de aprendizaje, marcas de texto, tarjetas de presentación.
- Resultados para uso externo con opciones de personalización: fotos de stock personalizadas con fondo transparente para diapositivas.
- Imágenes fotográficas de alta calidad y realismo: capacidad avanzada para el fotorrealismo, incluyendo precisión en la iluminación, sombras y texturas.
- Capacidad de usar una imagen como punto de partida: personalización de una pintura de una mascota, edición de retratos, inspiración para decoración de interiores basada en una imagen de un espacio real.
- Imágenes que aprovechan la conversación y el contexto real: carteles de aves encontradas en Central Park, visualización de una era de la historia del arte discutida previamente en la conversación.