Google lanza Veo 2: su generador de video por texto ya disponible en Gemini

Después del éxito de Imagen 3, el generador de imágenes por texto de Google que fue elegido por ZDNET como el mejor en su categoría —superando incluso a competidores como Midjourney y OpenAI—, la comunidad tecnológica estaba ansiosa por la llegada de Veo 2, el nuevo generador de video de texto a video de la compañía. Finalmente, ha sido lanzado, y viene con varias sorpresas interesantes.

¿Qué es Veo 2?

Veo 2 es el nuevo generador de video de Google que permite crear clips de hasta ocho segundos en resolución 720p, en formato panorámico 16:9, utilizando únicamente un prompt de texto. Según la empresa, esta herramienta ha sido diseñada para comprender mejor la física del mundo real y el movimiento humano, logrando así escenas más realistas y movimientos de personajes más fluidos.

Los usuarios pueden ser tan específicos como deseen al escribir sus prompts, lo que les brinda un gran control creativo sobre los resultados finales.

¿Cómo probar Veo 2?

La función está disponible a través de Gemini, tanto en la web como en dispositivos móviles, pero solo para quienes cuenten con una suscripción al plan Google One AI Premium, que tiene un costo de 20 dólares mensuales. Este plan exclusivo permite el acceso a Gemini Advanced, que es donde se encuentra habilitado Veo 2.

Aunque Google no especifica un límite exacto en la cantidad de videos que se pueden generar por mes, sí aclara que notificará a los usuarios cuando estén cerca de alcanzarlo.

¿Qué incluye el plan Google One AI Premium?

Además de Veo 2, el plan AI Premium incluye:

  • 2 TB de almacenamiento
  • Acceso a NotebookLM Plus, con límites de uso cinco veces mayores y funciones premium
  • Integración de Gemini en Gmail, Docs, Sheets y más
  • La nueva función Whisk Animate

Whisk Animate: animando tus imágenes con IA

Whisk Animate es un experimento reciente de IA generativa que se apoya en la tecnología de Veo 2. A partir de imágenes creadas por texto o imágenes ya existentes, esta herramienta permite animarlas en clips de ocho segundos. Como Veo 2, también está disponible exclusivamente para los usuarios de Gemini Advanced mediante Google Labs.

¿Cómo se compara Veo 2 con Sora de OpenAI?

La competencia más directa de Veo 2 es Sora, el generador de video de OpenAI. Ambos ofrecen capacidades similares: Sora puede crear videos de hasta 10 segundos a 720p mediante ChatGPT Plus (también a 20 dólares al mes), mientras que Veo 2 genera videos de hasta ocho segundos.

Al final, lo que marcará la diferencia será la calidad visual y la fidelidad del movimiento. Por ahora, la decisión entre uno u otro dependerá principalmente del ecosistema de herramientas que prefieras usar:

  • Si eres usuario intensivo de ChatGPT, el plan Plus te da acceso ilimitado a GPT-4o y generación de imágenes, lo cual es muy atractivo.
  • Si usas frecuentemente Gmail, Meet, Slides o Sheets, el plan de Google puede ser más conveniente gracias a la integración de Gemini con esas herramientas.

Veo 2 representa un gran avance en la generación de contenido visual por inteligencia artificial. Al combinar herramientas creativas con integración en plataformas de productividad, Google da un paso firme hacia el futuro del contenido generado por IA. Habrá que esperar las comparativas finales con Sora, pero por ahora, los usuarios de Gemini ya pueden empezar a experimentar con este poderoso generador de video.