- Follow-Your-Click toma imágenes combinadas con simples indicaciones de texto y las convierte en cortos videoclips con solo un clic
- Tencent colaboró con investigadores de universidades de Hong Kong y Pekín en medio del creciente entusiasmo por la generación de video con IA
NUESTRA OPINIÓN
A diferencia de ChatGPT, Follow-Your-Click de Tencent combina imágenes con simples indicaciones de texto que se pueden convertir en cortos videoclips con un solo clic.
Mientras que otros modelos requieren que los usuarios describan detalladamente cómo y dónde desean que se mueva la imagen, Follow-Your-Click permite un enfoque más específico en objetos concretos de la imagen.
-Jennifer YU, reportera de BTW
El gigante chino de internet Tencent Holdings presentó el viernes un modelo de inteligencia artificial (IA) de imagen a video en colaboración con socios académicos.
Follow-Your-Click
La herramienta de animación de imágenes llamada Follow-Your-Click se lanzó en el sitio web de código abierto GitHub de Microsoft, en medio del creciente fervor por las herramientas de generación de contenido como ChatGPT de OpenAI.
El proyecto es una colaboración entre el equipo Hunyuan de Tencent, la Universidad de Ciencia y Tecnología de Hong Kong y la Universidad de Tsinghua, una de las dos mejores universidades de China continental en Pekín.
Lea también: El éxodo de juegos de ByteDance: Las conversaciones con Tencent remodelan la industria
Sus características
Follow-Your-Click permite a los usuarios hacer clic en ciertas partes de una imagen con una simple indicación de texto que indica cómo les gustaría que se moviera, para luego transformar una imagen fija en un breve video animado.
Tencent dijo que lanzará el código completo del modelo en abril, pero ya hay una demostración disponible en GitHub.
Los investigadores mostraron algunas de sus capacidades allí, con un resultado que muestra cómo una imagen de una chica de pie al aire libre con la simple palabra “storm” (tormenta) se convirtió en una animación con relámpagos brillando en el fondo.
Según un artículo académico de los investigadores de las tres organizaciones, Follow-Your-Click tiene como objetivo resolver el problema que enfrentan otros modelos de imagen a video en el mercado, que tienden a mover toda la escena en lugar de enfocarse en objetos específicos de la imagen.
Nuestro marco tiene un control de usuario más simple pero preciso y un mejor rendimiento de generación que los métodos anteriores”, dijeron los investigadores en el artículo publicado el miércoles.

