Google presenta la Generación de Videos VEO 2 en Gemini avanzado

Después de una vista previa limitada de cuatro meses, Google ha decidido ofrecer a más personas el modelo de generación de videos VEO 2. La compañía ha comenzado a implementar la herramienta avanzada de usuarios de Gemini, que les permite crear clips de hasta 720p y con una duración de hasta ocho segundos. Según Google, «cuanto más detallada sea su descripción, más control tendrá sobre el video final».

En cuanto a las especificaciones técnicas, por ahora Gemini generará imágenes en una orientación de paisaje 16:9, lo que podría limitar un poco la creación de videos para redes sociales. No obstante, Google menciona que es posible cargar los videos directamente en plataformas como TikTok o YouTube a través de la hoja de intercambio de Gemini. Además, cualquier video creado a través de ChatBot se convertirá automáticamente en un archivo MP4. En cuanto a la evolución del modelo, Google afirma que VEO 2 tiene una mejor comprensión de la física del mundo real y del movimiento humano.

Para aquellos interesados en utilizar Gemini para generar videoclips, se requerirá un plan premium de $20 al mes. Una vez que la compañía haya completado el lanzamiento de VEO 2, la generación de videos estará disponible en todos los idiomas compatibles con Gemini, tanto en la versión web como en la móvil. Por otra parte, Google también está presentando la Generación VEO 2 para vencer. Para los no familiarizados, Whisk es una aplicación experimental que la compañía ofrece a través de su plataforma Beta Google Labs. Esta aplicación permite generar imágenes a partir de instrucciones de texto e imagen, y con VEO 2 integrado, se puede utilizar WHIP para animar lo que se cree a través de la aplicación.

Este artículo fue publicado originalmente en Engadget en. 

FUENTE

nuevaprensa.info

Artículos relacionados

Un grupo de investigadores llevó a cabo un experimento «no autorizado» en una de las comunidades de Reddit más populares, utilizando comentarios generados por inteligencia artificial para evaluar la persuasión de los modelos de lenguaje de gran escala. El experimento fue revelado por los moderadores de R/Changemyview, quienes lo describieron como una «manipulación psicológica» hacia los usuarios que no lo autorizaron. Los investigadores utilizaron LLM para crear comentarios en respuesta a las publicaciones de R/Changemyview, una subredditis donde los usuarios comparten opiniones controversiales y solicitan debates. Según los moderadores, los comentarios generados por IA asumieron diferentes identidades durante el experimento, como la de un sobreviviente de un ataque sexual, un consejero de trauma especializado en abuso y un hombre negro en contra del movimiento Black Lives Matter. Los moderadores de R/Changemyview señalaron que los investigadores violaron varias reglas de la comunidad, incluyendo la divulgación de la generación de comentarios por IA y la prohibición de robots. Reddit también tomó medidas, prohibiendo todas las cuentas asociadas con el esfuerzo de investigación y fortaleciendo sus capacidades de detección de contenido no auténtico. Los investigadores de la Universidad de Zurich defendieron su investigación, afirmando que fue aprobada por un comité de ética universitaria y que podría ayudar a proteger a los usuarios en línea de usos maliciosos. Sin embargo, los moderadores de R/Changemyview argumentaron que los usuarios no visitan la comunidad para interactuar con IA y que se sintieron intrusos. La controversia continúa mientras Reddit se comunica con la Universidad de Zurich y el equipo de investigación. Los investigadores defienden su trabajo como beneficioso, mientras que los moderadores insisten en que la comunidad merece un espacio sin intervenciones no autorizadas.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *