Siga conectamentado: Agréganos como fuente preferida en Google.
Conclusiones secreto de conectamentado
- OpenAI ahora utiliza metadatos C2PA y marcas de agua SynthID.
- Las señales de píxeles ocultas pueden ayudar a identificar imágenes generadas por IA.
- Igualmente se está implementando una aparejo pública de comprobación OpenAI.
Hoy, OpenAI anunció lo que flama señales de procedencia del contenido en todo su ecosistema de imágenes. En otras palabras, está etiquetando sus imágenes generadas por IA como generadas por IA.
Esto no es nuevo. OpenAI y otras herramientas de IA han estado incorporando metadatos en imágenes generadas por IA desde 2024. El problema era que el etiquetado de metadatos era proporcionado ligera de derrotar. Lo nuevo es que OpenAI está mejorando su solaz de seguridad de identificación de imágenes con nueva tecnología sofisticada.
Igualmente: Probé ChatGPT Images 2.0 frente a Gemini Nano Cambur para ver cuál es mejor: este maniquí anhelo
Están sucediendo muchas cosas aquí. Para ayudar a ponerlo en perspectiva, viajaremos hasta el año 440 a. C. y el mal día de un tipo.
¿Stega qué, ahora?
La esteganografía es la maña de embutir información criptográfica a la paisaje, básicamente utilizando técnicas para ocultar mensajes de tal guisa que la intención criptográfica de los mensajes no sea evidente de inmediato. En otras palabras, aprender que cualquiera o poco lleva un código es la centro del camino para descifrar el código.
Según investigaciones modernas, en el siglo V a. C., Heródoto de Halicarnaso, escribiendo en los libros Terpsícore y Polimnia de sus Historias de nueve libros, cuenta la historia de cómo «aproximadamente del 440 a. C. Histieo afeitó la vanguardia de su (asistente) de longevo confianza y la tatuó con un mensaje que desapareció a posteriori de que el trenza volvió a crecer. El propósito era instigar una revuelta contra los persas». Al parecer, esta técnica se utilizó en fechas tan recientes como la Segunda Conflagración Mundial.
Igualmente: Probé ChatGPT Plus frente a Gemini Pro para ver cuál es mejor y si vale la pena cambiar
Si alguna vez has pasado un software de televisión de detectives en el que se revela un mensaje oculto al ojear cada pocas saber de una nota que de otro modo sería común, has pasado un ejemplo de esteganografía basado en texto. En lo que respecta al criptográfico, es débil. Pero si no sabes que hay un mensaje en la nota, es posible que no intentes descifrarlo.
La esteganografía se ha utilizado en imágenes digitales durante abriles para embutir información de texto entre los millones de píxeles que componen una imagen. Esto permite a los remitentes insertar imágenes que se muestran a simple paisaje. Igualmente permite a los creadores incorporar información de propiedad y origen en una imagen de una guisa que es muy difícil de pasar.
Volveremos a la esteganografía en un momento porque es secreto para el anuncio de OpenAI de hoy.
Pero primero, volvamos al futuro, pero no del todo. Nuestra próxima parada es 2024.
Muéstrame los metadatos
OpenAI ha estado incorporando metadatos en imágenes generadas por DALL-E 3, ImageGen y Sora desde 2024. Puede utilizar una aparejo como Content Credentials para examinar esos datos. Nano Cambur de Google y otras herramientas de inteligencia industrial generadoras de imágenes igualmente incorporan algunos metadatos en sus imágenes.
Igualmente: Dejé de usar ChatGPT para todo: estos modelos de IA lo superan en investigación, codificación y más
Aquí hay un ejemplo de imágenes generadas por ChatGPT a la izquierda y Nano Cambur a la derecha. Como puede ver, los metadatos están disponibles correctamente. Las credenciales de contenido pueden mostrar los datos.
Por otro banda, cuando tomé una captura de pantalla de cada imagen, que capturaba los píxeles pero no los metadatos subyacentes, Content Credentials simplemente informaba «Poco salió mal». La captura de imagen eliminó por completo los metadatos asociados con el archivo de imagen llamativo.
Esto, entre otras cosas, es lo que OpenAI y Google están intentando solucionar.
Según OpenAI, «Hemos estado trabajando en esto durante algún tiempo. Hemos utilizado marcas de agua visibles en Sora y una marca de agua de audio en Voice Engine, y hemos seguido probando e investigando la precisión y confiabilidad a lo desprendido del tiempo, a través de la implementación».
Formato de metadatos en serie
OpenAI dice: «Recientemente tomamos la medida de hacer de OpenAI un producto productor compatible con C2PA. Al cumplir con C2PA, brindamos a las plataformas una forma confiable de ojear, preservar y transmitir la información de procedencia que adjuntamos a nuestro contenido».
Analicemos eso. C2PA es la Coalición para la Procedencia y Autenticidad del Contenido. Tiene un software de conformidad C2PA, que «brinda respaldo de que los productos cumplen con la aclaración de credenciales de contenido y cumplen con un conjunto de requisitos de seguridad para avalar que estén produciendo y validando datos C2PA correctamente».
Igualmente: Cómo asimilar ChatGPT en una hora, infundado
En otras palabras, los metadatos del contenido están estandarizados, son seguros y contienen suficiente información para que sean avíos. OpenAI está haciendo esto con todas sus ofertas de imágenes. Su representante de relaciones públicas me dijo que «todas las imágenes generadas por ChatGPT y OpenAI (incluidas la API de OpenAI y el Codex) contienen estas señales de procedencia».
Señales. Plural. Eso me lleva al gran martillo de este anuncio.
Marcas de agua digitales ocultas
SynthID de Google DeepMind es un mecanismo de marca de agua digital multimodal que incorpora marcas de agua digitales invisibles en texto, imágenes, video y audio. Esta es una tecnología elegante. Curiosamente, poliedro que Google y OpenAI son grandes competidores, OpenAI ahora está incorporando la tecnología SynthID en todas las imágenes que genera la empresa.
Para imágenes, SynthID se base en píxeles. Una señal sutil de tipo esteganográfico se incrusta en las imágenes acordado cuando se generan. Los datos de identidad son imperceptibles para el ojo humano, pero las herramientas de detección pueden leerlos. Esta marca de agua digital permanece en la imagen incluso a posteriori de cambiar el tamaño, recortar, comprimir y realizar ajustes de color. Se transfiere a capturas de pantalla. La firma digital está integrada en toda la imagen, en sitio de aparecer solo en un campo de acción pequeña de la imagen.
Igualmente: Probé ChatGPT Images 2.0: un gran brinco divertido y sorprendentemente útil para el trabajo existente
Entonces, aunque Nano Cambur coloca su pequeño diamante en la cima de las imágenes que genera, igualmente incorpora una señal mucho más completa en toda la imagen.
Hay un aspecto adicional fascinantemente poderoso de SynthID que OpenAI no mencionó: SynthID puede marcar el texto con marcas de agua, aparentemente sin afectar la calidad del texto. Lo que hace es designar muy sutilmente qué token se utiliza en cada liga de texto para que lo generado pueda escanearse para encontrar una firma estadística que el software detector pueda identificar. Esta capacidad no ha sido anunciada por OpenAI y, por lo tanto, probablemente no se use en ChatGPT, pero sí en Gemini.
Al igual que con C2PA, OpenAI está incorporando SynthID en imágenes generadas a través de ChatGPT, Codex y la API de OpenAI.
Nueva aparejo de comprobación pública
Simultáneamente con el anuncio del cumplimiento de C2PA y las capacidades de SynthID, OpenAI anuncia la disponibilidad de una aparejo de comprobación pública que puede usar para ver si poco fue generado por una de las herramientas de inteligencia industrial de OpenAI.
Escribo esto la perplejidad antaño de que el anuncio oficial se haga sabido. Cuando lea este artículo, debería poder probar la aparejo en https://openai.com/research/verify/.
Igualmente: Comparé cómo Gemini, ChatGPT y Claude pueden analizar videos: este maniquí anhelo
Tengo mucha curiosidad acerca de los límites de esta aparejo y igualmente de qué tan acertadamente funciona en conjunto con SynthID. ¿Qué sucede, por ejemplo, si extraes parte de una imagen de ChatGPT y la usas con una fotografía existente como parte de una composición de Photoshop? ¿Informa cuánto se etiquetó la IA? Volveremos a comprobar esto con pruebas del mundo existente en algún momento a posteriori del impulso de la aparejo.
Según OpenAI, «ninguna técnica de procedencia es suficiente por sí sola. Creemos que un enfoque sólido combina estándares compartidos, señales de marca de agua duraderas y comprobación pública. Al beneficiarse nuestro soporte de larga data para las credenciales de contenido, cumplir con C2PA, adoptar SynthID y obtener una paisaje previa de las herramientas de comprobación pública, esperamos contribuir a desprendido plazo a un ecosistema de procedencia más interoperable».
¿Comprobarías la procedencia de una imagen si una aparejo de detección lo hiciera ligera? Háganos aprender en los comentarios a continuación.
Puedes seguir las actualizaciones diarias de mi plan en las redes sociales. Asegúrate de suscribirte a mi boletín de puesta al día semanal y sígueme en Twitter/X en @DavidGewirtzen Facebook en Facebook.com/DavidGewirtz, en Instagram en Instagram.com/DavidGewirtz, en Bluesky en @DavidGewirtz.com y en YouTube en YouTube.com/DavidGewirtzTV.


