Eché un vistazo temprano a ChatGPT Images 2.0 y es impresionante, con una excepción.

abril 27, 2026

55

Tabla de contenido

Siga conectamentado: Agréganos como fuente preferida en Google.

Conclusiones esencia de conectamentado

OpenAI reformula las imágenes como un habla visual.
El modo de pensamiento crea infografías contextuales.
La fidelidad a la marca sigue siendo inconsistente en las primeras pruebas.

Hoy, OpenAI anunció ChatGPT Images 2.0, su maniquí de imagen de próxima coexistentes, que según la compañía se centra en la precisión, la usabilidad y las tareas visuales complejas.

La nueva capacidad más trascendente es la capacidad de combinar texto e imágenes para crear páginas hermosas y complejas. OpenAI está replanteando toda la idea de coexistentes de imágenes desde un proceso que crea decoraciones (su palabra) a un habla (asimismo su término).

Por otra parte: Los mejores generadores de imágenes con IA de 2026: ahora solo hay un vencedor claro

OpenAI lo describe como: «Una buena imagen hace lo que hace una buena oración: selecciona, organiza y revela. Puede explicar un mecanismo, poner en espectáculo un estado de talante, probar una idea o presentar un argumento».

Las capacidades de pensamiento permiten flujos de trabajo complejos

Por otra parte de su capacidad enormemente mejorada para mezclar texto y gráficos, el nuevo maniquí utiliza capacidades de pensamiento mejoradas. Puede difundir múltiples imágenes por mensaje con continuidad entre las expectativas. Este enfoque es posible porque el maniquí efectivamente integra el razonamiento en la salida de la imagen.

Este cambio es conspicuo. En oficio de simplemente producir una imagen que coincida en gran medida con los detalles del mensaje, Images 2.0 puede aceptar un mensaje mucho más tenue, como «Suscitar una infografía sobre las actividades que debo hacer teniendo en cuenta el clima de mañana en San Francisco».

LEER Operai actualiza chatgpt con Codex, y estoy muy impresionado (hasta ahora)

Todavía: Cómo cambiar de ChatGPT a Gemini

A partir de este mensaje, la IA recopilará datos meteorológicos y de actividad en San Francisco, determinará las actividades apropiadas para el clima y luego creará una imagen o un conjunto de imágenes que se ajusten a los resultados.

Según OpenAI, «en este maniquí, Images 2.0 actúa más como un socio de pensamiento visual, ayudando a resistir un plan desde el concepto vecino hasta el activo terminado con mucho menos trabajo de su parte».

La precisión y el control del diseño mejoran la usabilidad

Muchos de nosotros hemos luchado durante mucho tiempo para convencer a ChatGPT de que genere imágenes en una relación de aspecto específica deseada. A menudo, la IA produce obstinadamente lo que quiere. Pero ahora, con Images 2.0, el maniquí admite «relaciones de aspecto tan anchas como 3:1 y tan altas como 1:3».

El maniquí asimismo admite resultados de maduro fidelidad que (en su mayoría) producen una ubicación precisa de los objetos, una representación detallada del texto y composiciones complejas. Veremos si podemos eliminar la palabra «principalmente» de esa oración posteriormente del propagación oficial del producto.

Por otra parte: probé la Inteligencia personal y fue precisa (pero inquietante)

La IA asimismo admite texto pequeño, fundamentos de interfaz de afortunado y restricciones de estilo con una resolución de hasta 2K. Fresco.

Probando la horizonte previa

Me dieron camino a una horizonte previa del propagación el día antaño y el maniquí es impresionante, en su maduro parte. Le envié una captura de pantalla de la página de inicio de conectamentado y un proyecto del comunicado de prensa de Images 2.0.

Luego le dije: «Basado en el contenido del comunicado de prensa, genere una infografía 16:9 sobre la nueva puesta al día de la imagen y génrela usando el estilo de marca conectamentado como se muestra en el documento de la página de inicio de conectamentado».

LEER 4 formas en Google Lens en Chrome magnifica mi productividad y cómo usarla

Por otra parte: probé la nueva aparejo AI Enhance de Google Photos: cómo recorta, ilumina y corrige tus tomas, a veces

El maniquí hizo un gran trabajo en la infografía, pero por más que lo intentó, no pudo reproducir el logotipo de conectamentado. En su primer intento, renderizó la Z en conectamentado con una ligera caída.

Probé una variedad de solicitudes del tipo «Reparar el logotipo de conectamentado. La Z cae en su traducción, pero no en el logotipo existente». Pero Images 2.0 nunca logró solucionarlo.

Entonces comencé una nueva sesión. Esta vez, incluí la instrucción: «Tenga específico cuidado para reproducir el logotipo de conectamentado con precisión».

Por otra parte: probé ChatGPT Plus frente a Gemini Pro para ver cuál es mejor y si vale la pena cambiar

Aquí es donde las cosas se pusieron muy raras. Para su primera ejecución, el maniquí de alguna forma desenterró una copia del logotipo de conectamentado inicial a nuestro rediseño de 2022. Este logotipo no se encuentra en ninguna parte de nuestra página de inicio contemporáneo. Curiosamente, representó ese antiguo logotipo utilizando la combinación de colores contemporáneo. Luego, la maniquí empujó el logotipo y la información infográfica fuera del borde izquierdo de la imagen. Todavía eligió un cerúleo claro para «Imágenes 2.0» que no es un color de la marca conectamentado.

Intenté con todas mis fuerzas convencerlo de que utilizara el logotipo contemporáneo. Logré que empujara la imagen en dirección a la derecha, por lo que no se cortó nulo. Pero anexar el mensaje «Utilice el logotipo de conectamentado que se encuentra en la página proporcionada. No busque un logotipo posible» no solucionó el problema.

Le di una oportunidad más al desafío antaño de atreverse retornar a terminar este artículo. Una vez más, comencé una nueva sesión para que la IA no tuviera memoria muscular de sus errores de cálculo anteriores.

LEER ¿Reparar tu teléfono Android? Primero active esta configuración y bloquee sus datos

Por otra parte: esta poderosa configuración de Géminis hizo que mis resultados de IA fueran mucho más personales y precisos.

La maniquí volvió a estropear el logo. Esta vez, la IA decidió anexar una forma de timón a la potencia de la D mayúscula extendida.

Para ser justos, estoy usando una traducción preliminar de Images 2.0. Volveré con una prueba mucho más completa del maniquí posteriormente del propagación oficial del producto.

Todavía probé una prueba similar usando un documento diferente con Nano Banano Pro de Google, pero oportuno a que no manejó la síntesis como lo hace esta nueva traducción del producto OpenAI, efectivamente no pude repetir los resultados que obtuve aquí. Sabremos más a medida que hagamos pruebas más avanzadas.

Precios y disponibilidad

El nuevo maniquí está adecuado hoy para todos los usuarios de ChatGPT y Codex. Los resultados avanzados y la capacidad de pensamiento están disponibles para los usuarios de ChatGPT Plus, Pro, Business y Enterprise. Asegúrese de decidir «Pensamiento» en la mostrador desplegable de ChatGPT en la parte superior de la pantalla.

Al momento de escribir este artículo, antaño del propagación, el nuevo maniquí Images 2.0 solo está adecuado en el escritorio. Pero OpenAI promete que estas capacidades asimismo estarán en la traducción móvil, adyacente con la capacidad de decidir imágenes con el dedo usando la pantalla táctil de su móvil.

Las imágenes asimismo están disponibles a través de API utilizando el maniquí gpt-image-2. El precio de la API varía según la calidad, la advertencia (mi palabra) y la resolución de imagen deseada.

Si una IA puede manejar el diseño y el contenido en combinación, ¿eso cambiará la forma en que aborda los proyectos de diseño? Háganos conocer en los comentarios a continuación.

Puedes seguir las actualizaciones diarias de mi plan en las redes sociales. Asegúrate de suscribirte a mi boletín de puesta al día semanal y sígueme en Twitter/X en @DavidGewirtzen Facebook en Facebook.com/DavidGewirtz, en Instagram en Instagram.com/DavidGewirtz, en Bluesky en @DavidGewirtz.com y en YouTube en YouTube.com/DavidGewirtzTV.

Etiquetas
Softwire y aplicaciones

Artículo anterior

Microsoft parchea el error crítico de escalada de privilegios CVE-2026-40372 de ASP.NET Core

Artículo siguiente

La nueva variante LOTUSLITE del Mustang Panda se dirige a los bancos de la India y a los círculos políticos de Corea del Sur

Eché un vistazo temprano a ChatGPT Images 2.0 y es impresionante, con una excepción.

Conclusiones esencia de conectamentado

Las capacidades de pensamiento permiten flujos de trabajo complejos

La precisión y el control del diseño mejoran la usabilidad

Probando la horizonte previa

Precios y disponibilidad

Artículos relacionados

Cambié estas configuraciones de Android Auto para limitar lo que Gemini...

Mustang Panda utiliza Zoho WorkDrive como canal de comando en ataques...

Apple puede tener dificultades para obtener autorización para la RAM china,...

DEJA UNA RESPUESTA Cancelar respuesta

Últimos artículos

Cambié estas configuraciones de Android Auto para limitar lo que Gemini...

Mustang Panda utiliza Zoho WorkDrive como canal de comando en ataques...

Apple puede tener dificultades para obtener autorización para la RAM china,...

La extensión de Chrome Malicious Perplexity interceptó búsquedas y entradas de...

Quectel amplía su cartera de antenas combinadas con soluciones robustas de...