Google no para de desarrollar modelos de inteligencia artificial. Google presenta VLOGGER, su nueva Inteligencia Artificial que convierte fotos en vídeos
VLOGGER es el nombre de este desarrollo, que genera que una fotografía pueda hablar, es decir, la imagen estática de una persona se puede convertir en un video en el que mueva su boca, la cabeza, el rostro y las manos, incluso hablando en diferentes idiomas.
Le puede interesar: ¿Cómo identificar una foto hecha con inteligencia artificial?
VLOGGER es el último proyecto de IA desarrollado por Google,
Diseñado para convertir fotos estáticas en vídeos dinámicos con audio. Esta tecnología utiliza algoritmos avanzados de aprendizaje automático para analizar las imágenes y generar fotogramas de vídeo con detalles de movimiento, agregando sonido para crear una experiencia más inmersiva.
Según los detalles revelados por un equipo de investigadores de Google, este sistema se basa en modelos de difusión, una técnica de IA que ha demostrado ser altamente eficaz en la generación de imágenes realistas a partir de descripciones de texto.
Este proyecto ha estado en desarrollo desde hace tiempo y gracias a lo logrado con Bard y Gemini, la empresa ha permitido alcanzar las mejoras necesarias para la implementación de esta tecnología, que puede ser usada en múltiples áreas.
Además, cuenta con la particularidad de no necesitar un entrenamiento específico para generar el contenido de cada fotografía, sino que la creación se da gracias a su base de conocimiento, que surgió tras analizar 2.200 horas de video y 800.000 identidades diversas, géneros, edades y razas, de un conjunto de datos llamado MENTOR.