Google presenta un nuevo modelo de IA capaz de generar video en «alta definición»

Foto de archivo del logo de Google. EFE/Hannibal Hanschke

 

Mountain View (EE.UU.), 14 may (EFE).- Google presentó este martes Veo, su nuevo modelo de inteligencia artificial (IA) que es capaz de generar videos de un minuto en «alta definición» en una amplia gama de estilos visuales y cinematográficos.

Desde hoy, la herramienta está disponible solo «para creadores seleccionados como vista previa privada dentro de VideoFX», pero Google planea incorporar en el «futuro» algunas capacidades de Veo a YouTube Shorts y otros productos, según anunció en el marco de su conferencia de desarrolladores, Google I/O.

Veo será el principal competidor de Sora, una herramienta similar de OpenAI que ha dejado boquiabiertos a los expertos con la nitidez y similitud a la realidad que alcanzan sus videos y que también está disponible solo para un grupo selecto de creadores.

Según anunció Google desde su sede en Mountain View (California), la nueva herramienta es capaz de generar videos con resolución de 1080p y «crea imágenes consistentes y coherentes: personas, animales y objetos se mueven de manera realista a lo largo de las tomas».

En versiones de sus competidores se han podido ver errores, como humanos con más de dos brazos, por ejemplo.

Hoy Google mostró varias creaciones cortas de sus videos de IA: un vehículo circulando por una ciudad; un velero navegando el océano y un plano corto de una mujer pestañeando, pero la empresa no detalló cuántas veces o cuánto tiempo tuvo que interactuar con la máquina para conseguir ese resultado final.

Asimismo, mostró un video con la reacción del cineasta Donald Glover y su estudio creativo, Gilga, usando esta tecnología en una granja de California.

«El modelo también comprende términos cinematográficos como ‘timelapse’ o ‘tomas aéreas de un paisaje’, lo que proporciona un nivel de control creativo sin precedentes», anota la empresa en un comunicado.

 

Nuevo modelo de IA para generar imágenes

El gigante tecnológico también presentó Imagen 3, su nuevo modelo de conversión de texto a imagen capaz de generar productos «fotorrealistas», aunque la mayor crítica hacia su modelo anterior no fue la falta de calidad, sino las respuestas inexactas y sesgadas.

Por ejemplo, la herramienta generó imágenes de una mujer asiática o un hombre negro tras ser preguntado por ilustrar un «soldado alemán de 1943», cuando el nazismo estaba en auge en el país y la diversidad racial era prácticamente imposible.

Una de las cualidades de Imagen 3 que se resaltó durante el evento fue su capacidad de representar texto, «lo que ha sido un desafío para los modelos de generación de imágenes» hasta el momento.

«Esta capacidad abre posibilidades para generar mensajes de cumpleaños personalizados, diapositivas de títulos en presentaciones y más», destaca la compañía en un comunicado.

A partir de hoy, esta tecnología está disponible para creadores seleccionados como una vista previa privada dentro de ImageFX.

 

 

 

 

 

 

 

 

.

Salir de la versión móvil