Google esta semana puso a disposición la última iteración de su aparejo VEO Video Generation para los usuarios de su software de inteligencia industrial Gemini que tiene una cuenta «Pro» o «Extremista».
Todavía: Usé la IA Flow de Google para crear mis propios videos con sonido y diálogo, así es como fue
VEO ha estado acondicionado en traza previa desde hace algún tiempo. Lo nuevo con la última implementación es la capacidad de comenzar su video cargando una imagen fija para servir como situación auténtico. (Prakhar Khanna de Zdnet ha informado su experiencia utilizando la capacidad como una característica incorporada de su teléfono Honor 400, en empleo de usarlo a través del sitio web como yo).
Cómo usar VEO para suscitar videos a partir de fotos
Usted le da al sistema un mensaje, presione ENTER y VEO crea un video de ocho segundos usando su foto cargada como punto de relato desde el cual construir el primer cuadro de video. VEO agrega sonido, que incluye música, pasos y otros incidentes.
Los videos toman varios minutos a la vez para desarrollarse.
Todavía: Este turbina de video de IA interactivo se siente como entrar en un videojuego: cómo probarlo
En mis pruebas hasta ahora, coincidencia la implementación de VEO fascinante y un poco espeluznante.
Mis resultados con la función de foto a video de Veo
Probé varias imágenes fijas que había tomado, incluida una selfie y poco de fotografía callejera. Ver las fotos cobrar vida, por así decirlo, es discordante. Es desconcertante de qué tan acertadamente funciona y, como fotógrafo, es desconcertante de cómo el resultado contrasta con la memoria del evento.
Todavía: Este nuevo editor de video de IA es un servicio de producción todo en uno para cineastas: cómo probarlo
Los buenos aspectos son la calidad del video, que está en consonancia con la imagen fotográfica. Las cosas como la perspectiva de una terreno generalmente se mantienen acertadamente, y los objetos en movimiento en el fondo están, en algunos casos, acertadamente orquestados para ser consistentes.
1. Jogger corriendo a lo dilatado del paseo
Aquí, por ejemplo, hay una foto que tomé de un corredor en el Promenade de East River en Manhattan. Le di el aviso de Veo: «Por crédito, haga un video en el que el corredor continúe llegando a la distancia a lo dilatado del paseo».
A continuación se muestra la imagen aún diferente seguida del video VEO.
https://www.youtube.com/watch?v=yocxwncct4
El movimiento del corredor es bueno, al igual que el movimiento en el espacio como desde el punto de traza del fotógrafo.
Este es un logro técnico sustancial, en mi opinión, en un nivel muy cardinal. Recuerde que esto es ocho segundos de resolución de calidad de 720p, que se representa a la tasa de película en serie de 24 cuadros por segundo. Eso significa que VEO tiene que crear, en unos minutos, 192 cuadros desde la imagen auténtico. Hexaedro el poco esfuerzo que me llevó como adjudicatario, sería realizable producirse por stop cuán significativo es desde un punto de traza puramente técnico. El poder de toda esa computación en la abundancia efectivamente brilla en poco como esto.
Sin retención, uno además ve los artefactos que surgen de las predicciones de Google sobre los marcos, dando a la cosa una calidad sobrado misteriosa.
El corredor de la derecha, por uno, efectivamente no se ve igual que el corredor en mi foto, solo vagamente similar (el coleta es diferente, el zancamiento es diferente).
Todavía: Olvídese de Sora: Adobe alabarda el turbina de video AI ‘comercialmente seguro’. Cómo probarlo
Otro artefacto es que, en el momento actual, la figura que se movía en dirección a la cámara en el banda izquierdo de la imagen estaba paseando, no corriendo. Creo que está claro en la imagen. Pero Veo además hizo que esa persona trote además.
Otro tipo emerge en la carretera FDR Drive en la punta superior izquierda. Uno puede ver vehículos que desaparecen misteriosamente en algún momento de su movimiento. Ese es un tema constante de los videos VEO, la incapacidad del software para perseverar completamente la continuidad.
2. Mujer caminando contiguo a la mostrador de herradura
Un logro sorprendente surgió cuando presenté una fotografía de un bar en la calle 7 en el East Village, llamado 7b, o el bar Horseshoe. Agregué el aviso: «¿Puedes mostrarle a la mujer pasando por el edificio?»
https://www.youtube.com/watch?v=5_ef5_4htye
El video resultante muestra una buena perspectiva de la calle, pero lo que es efectivamente sorprendente es que logró satisfacer el anuncio blanco sobre la puerta del banda invisible del edificio que muestra el símbolo de herradura. Eso sugiere que VEO pudo encontrar en algunos datos una finalización de la mostrador, lo cual es sobrado sorprendente.
Todavía: La nueva aparejo de animación de MidJourney convierte las imágenes en videos cortos: así es como
Sin retención, los edificios invisibles que VEO llena, a medida que el video expedición la punta, no son los edificios reales en esa calle, un caso de VEO con un sustituto razonablemente modesto. Observe un artefacto resistente: Veo le dio al individuo a caminar un sombrero celeste, que parecía tener apéndice erróneamente en función de la persona en mi fotografía caminando frente a un anuncio celeste en el edificio.
3. La persona con botas blancas se levanta y se levanta en tren
Algunos artefactos son más llamativos. En un segundo pedazo de fotografía callejera, subí una foto de algún sentado en un automóvil de patrón con botas blancas. Le di el aviso: «La persona en las botas blancas se levanta de su asiento y se levanta del tren». Lo que se produjo fue sobrado resultón y sobrado bueno para una enfoque de cómo podría moverse esta figura. Sin retención, la persona no sale del tren.
https://www.youtube.com/watch?v=d7ltdpumvou
Cuando persistí con un segundo aviso, «Eso es formidable, pero un ajuste. ¿Es posible mostrar las puertas de la transigencia del automóvil y la persona en las botas blancas que efectivamente sale por las puertas para salir del tren?», Veo produjo una segunda traducción.
https://www.youtube.com/watch?v=AMTGQC72HPO
Esta vez, el individuo al menos se muestra moviéndose en dirección a una salida, ya que las puertas se muestran abiertas. Sin retención, varios artefactos aquí faltan una prueba de existencia y consistencia. Por un banda, nadie sale de un coche metálico de la ciudad de Nueva York en el final del automóvil; Salen a las puertas laterales, ya que ahí es donde está la plataforma. En segundo empleo, las puertas correderas representadas al final del automóvil no existen en los autos de patrón de la ciudad de Nueva York. Esas panorama tienen una, no dos, puertas correderas.
Todavía: Puede producir anuncios de video en segundos con la nueva aparejo AI de Amazon, así es como
En tercer empleo, está claro en la imagen de Still diferente, basada en la luz y los detalles vistos a través de la ventana trasera del automóvil del tren, que este no es el zaguero automóvil de la ristra; Hay otro coche detrás de esto. Sin retención, cuando las puertas se abren en el video, vemos la plataforma y las pistas, lo que sugiere que este automóvil es ahora el zaguero automóvil en la ristra. Es una incapacidad aquí para que VEO infiera adecuadamente de detalle la estructura total del medio esfera.
Por zaguero, pero no menos importante, en una cuarta inconsistencia, podemos ver a través de la puerta abierta que la plataforma está directamente debajo del tren, para que el tren sea, cabalgando sobre la plataforma, en empleo de las vías.
4. Truenos y relámpagos con tempestad
Presenté una foto nocturna lluviosa en Lexington Avenue en Manhattan y pedí «un video de truenos y relámpagos y lluvias serias en esta terreno de la calle». El resultado es sobrado caricaturesco, pero ciertamente es un momento divertido con la intención correcta.
https://www.youtube.com/watch?v=kmmcbz7m714
5. Selfie de baño anfibológico
Poner la imagen de uno en VEO tiene su propio espeluznante singular, o diversión, o uno y otro, dependiendo de su sentido del humor.
Todavía: Los mejores generadores de imágenes de IA de 2025: Gemini, Chatgpt, MidJourney y más
Primero usé una selfie de baño muy oscura. Me impresionó la matiz de animación imaginativa. Sin retención, mis características parecen transformarse drásticamente en la dependencia de otra persona, y no estoy seguro de quién. (Me han dicho que a veces me parece a Thom Yorke de la pandilla Radiohead).
https://www.youtube.com/watch?v=hd9txlalp_i
6.
En otro caso, usé mi tiro en la individuo de ZDNet y le pregunté a Veo: «¿Puedes hacer un video de este hombre haciendo el cha-cha-cha?» Me gusta el movimiento resultante, la música camarada, y los sonidos de botas muy fuertes son muy divertidos.
https://www.youtube.com/watch?v=m4va0ivd7oo
Sin retención, la parte espeluznante aquí es que sin más información, Veo ha dejado a mi cara una máscara de expresión rígida, lo que no tiene sentido en un video de ballet. De hecho, mi individuo efectivamente no se mueve en completo; está arreglado.
7. Selfie de Las Vegas
Subí otra selfie más, tomada en el Caesar’s Palace Casino and Hotel en Las Vegas, y le indicé: «Por crédito, haga un video de este hombre con la chaqueta de cuero bailando tango con la estatua de Hermosura que está en el fondo». Bueno, Veo no logró hacernos bailotear, pero el espectáculo de calle resultante de mi dependencia es divertido. Todavía lo es la música. Observe que las mangas de mi chaqueta de cuero se vuelven negras, por alguna razón.
https://www.youtube.com/watch?v=lsuqj67p-sc
8. Un combate histórico con John C. Calhoun
En la corazonada de que manipular las figuras históricas podrían ser rechazadas, intenté crear una combinación histórica para probar el asunto. Subí una foto del vicepresidente de los Estados Unidos, John C. Calhoun, de la Biblioteca del Congreso de los Estados Unidos, y solicité que Veo hiciera un video de Calhoun bailando el Cha-Cha-Cha.
Veo comenzó a hacer un video, luego renunció con el mensaje: «No puedo suscitar ese video. Intenta describir otra idea. Todavía puedes obtener consejos sobre cómo escribir indicaciones y revisar nuestras pautas de política de video. Obtenga más información».
9. Hacer reír a Scarlett
Luego intenté subir una foto del actor/director Scarlett Johansson desde su página de Wikipedia, y solicité «un video de esta mujer riendo». Nuevamente comenzó y luego renunció con el mismo mensaje de error.
10. Haciéndome reír
Comprobé el asunto con mi propio tiro en la individuo, como una persona no histórica y no famosa, y pude conseguir VEO para hacer un video de mí riendo (aunque no se parece en completo al tiro en la individuo diferente).
https://www.youtube.com/watch?v=7vzgayvnzc0
Eso sugiere que VEO puede construirse con salvaguardas contra la manipulación de imágenes de civilización histórica o pop, aunque no puedo estar seguro.
¿Deberías probar Google Veo?
El servicio VEO, en traza previa, ciertamente no está exenta de problemas técnicos.
Posteriormente de mi primer par de éxitos, repetidamente obtuve una advertencia de que tendría que esperar para hacer más videos, ya que el servicio está prohibido por la tarifa en este momento. Hay quejas sobre esto en el adjudicatario Foran para Géminis, incluidas las personas que se les niega el servicio por más de 24 horas, y una larga explicación del asunto por un «versado» de un producto voluntario. Básicamente, el video es de ufano de pandilla, de enumeración y memoria, por lo que no es sorprendente que Google tenga que deslindar el uso desde el principio.
La decisión más directa es refrescar al longevo nivel de Géminis, el plan «Extremista», aunque esto significa producirse de $ 19.99 al mes a $ 249 al mes (descuento durante los primeros tres meses a $ 125). Ese es un precio elevado solo para poder evitar lo que parecen límites sobrado duros.
Todavía: ¿Vale la pena el plan de suscripción de IA de $ 250 por mes de Google? Esto es lo que está incluido
Incluso posteriormente de suscribirme a Extremista, alcancé un techo posteriormente de cinco videos, con un mensaje de error que decía «poco salió mal». Otra publicación explicadora en el foro de usuarios sugiere que no hay un techo claro para el plan Extremista; Es un asunto anfibológico de «créditos» de IA en el servicio en la abundancia.
Ese pestillo repentino contradice los términos de servicio de Google que dicen: «Recibirá una notificación cuando esté cerca del techo. La notificación le dirá cuántos videos le quedan». (Obtenga más información en la sección de ayuda de Gemini Apps sobre varios límites de Géminis).
La alternativa a Extremista es aún más compleja, utilizando la aparejo de expansión profesional de «flujo» en empleo de la aplicación Gemini.
Por otra parte de los límites de uso, los usuarios se han quejado de problemas técnicos, como videos que carecen de sonido.
Todavía: Probé el turbina de imagen a video de Veo 2 de Google en Android: aquí está mi veredicto
La impresión caudillo es que este es en gran medida un producto beta.
Puede preguntarse sobre los peligros de los videos de Deepfake. Google ha publicado una serie de puntos sobre medidas de seguridad para las aplicaciones Gemini en caudillo, pero no hay una exposición clara sobre los videos VEO.
En caudillo, Veo me parece un truco interesante, aunque VEO no tiene interés posteriormente de que la fascinación auténtico se ha desgastado. Como fotógrafo, estoy más interesado en un solo momento auténtico que en 192 momentos no auténticos.
Para aquellos que no están involucrados en la industria del cine, VEO puede proporcionar una ventana sobre cómo la IA puede estar de moda cada vez más para completar a los actores o extender las semejanzas para crear acciones sin invertir efectivamente a los actores.
Dados los algoritmos más fuertes y los datos adicionales (datos de terreno, datos de caracteres, etc.), me imagino que Hollywood podría usar esta tecnología para producir imágenes móviles que sirven historias reales. Es una revelación sobre en dirección a dónde va el video en una era de IA.
Obtenga las principales historias de la mañana en su bandeja de entrada cada día con nuestro Boletín de Tech Today.