ChatGPT ahora puede generar imágenes realistas

Por

marzo 26, 2025

662

ChatGPT ahora te permitirá generar imágenes realistas y detalladas directamente en la interfaz del chatbot, utilizando el modelo más avanzado de la compañía: GPT-4o.

Más información de esta función

ChatGPT imagen — Imagen de Xataka México

Esta mejora responde a la creciente demanda de herramientas de generación visual con mayor precisión, lo que marca un avance importante respecto a versiones anteriores como DALL·E.

¿Qué hace diferente a GPT-4o en la generación de imágenes?

Mayor precisión y contexto: GPT-4o ha mejorado la manera en que vincula atributos, asegurando que los objetos en la imagen se representen correctamente.
Soporte para múltiples objetos: A diferencia de modelos anteriores que podían manejar entre 5 y 8 elementos, este modelo puede representar hasta 20 objetos diferentes en una sola imagen.
Renderizado mejorado de texto: GPT-4o logra producir palabras legibles dentro de las imágenes, un hito en modelos de IA generativa. Esto es clave para la creación de infografías, ilustraciones científicas y anuncios publicitarios.
Generación multi-turno: Ahora, los usuarios pueden refinar imágenes a través de múltiples iteraciones en una conversación. Esto significa que si creas un personaje o un logotipo, puedes ajustarlo paso a paso sin perder coherencia visual.
Nuevas opciones de edición: GPT-4o permite transformar imágenes que los usuarios suban, así como generar imágenes con fondos transparentes, ideales para logotipos, stickers o diseño gráfico.

¿Cómo funciona la generación de imágenes con GPT-4o?

A diferencia de DALL·E, que usa técnicas de difusión para generar imágenes completas de una vez, GPT-4o emplea un enfoque autoregresivo, similar al procesamiento de texto.

Esto permite:

Mejor renderizado de texto en imágenes
Mayor coherencia visual entre múltiples iteraciones
Mayor precisión en la distribución conjunta de texto e imagen

Gracias a este método de entrenamiento, el modelo no sólo crea imágenes realistas desde cero, sino que también puede transformar imágenes cargadas por los usuarios, permitiendo retoques y modificaciones precisas.

Casos de uso de GPT-4o en la generación de imágenes

Diseño gráfico → Creación de logotipos y stickers con fondo transparente
Ilustraciones científicas → Gráficos con etiquetas precisas
Marketing digital → Infografías y anuncios optimizados para redes sociales
Videojuegos y animación → Diseño de personajes y escenarios con iteraciones refinadas
Contenido educativo → Diagramas y visualizaciones explicativas

Aunque GPT-4o ha mejorado enormemente la generación de imágenes, todavía puede cometer errores, especialmente en la reproducción de texto dentro de las imágenes. Sin embargo, OpenAI continúa trabajando en mejoras constantes.

¿Cómo probar la generación de imágenes en ChatGPT?

OpenAI ha confirmado que la nueva función de imágenes está disponible desde hoy para los suscriptores de:

ChatGPT Plus
ChatGPT Pro
ChatGPT Team
ChatGPT Free

como generador de imágenes predeterminado dentro de ChatGPT. Próximamente, llegará a los planes Enterprise y Edu.

Seguridad y medidas contra el uso indebido

OpenAI ha implementado controles estrictos para evitar abusos en la generación de imágenes. Algunas de las medidas incluyen:

Bloqueo de contenido inapropiado → No permite generar imágenes violentas, deepfakes sexuales o contenido ilegal.
Metadatos C2PA → Todas las imágenes generadas incluirán un identificador que señala que fueron creadas por IA, ayudando a evitar la desinformación.

Con estas herramientas, OpenAI busca equilibrar innovación y responsabilidad, asegurando que la nueva capacidad de generación de imágenes en ChatGPT sea útil y segura para todos los usuarios.