• Follow-Your-Click 将图像与简单的文本提示相结合,只需点击一下即可将其转换为短视频片段
  • 在人们对 AI 视频生成日益兴奋的背景下,腾讯与来自香港和北京多所大学的研究人员展开了合作

我们的观点
与 ChatGPT 不同,腾讯的 Follow-Your-Click 将图像与简单的文本提示相结合,只需一次点击即可转换为短视频片段。
其他模型需要用户详细描述他们希望图像如何移动以及移动到哪里,而 Follow-Your-Click 则允许更具体地关注图像中的特定事物。

-詹妮弗·余,BTW 记者

中国互联网巨头腾讯控股周五与学术伙伴合作推出了一款图像到视频的人工智能(AI)模型。

Follow-Your-Click

这款名为 Follow-Your-Click 的图像动画工具在微软的开源代码网站 GitHub 上发布,正值围绕 OpenAI 的 ChatGPT 等内容生成工具的热潮日益高涨之际。

该项目是腾讯混元团队、香港科技大学和中国大陆顶尖两所大学之一的清华大学之间合作的成果。

相关阅读:字节跳动的游戏撤退:与腾讯的谈判重塑行业

功能特点

Follow-Your-Click 允许用户点击图片的特定部分,并配以简单的文本提示,说明希望其如何移动,从而将静态图像转换为简短的动画视频。

腾讯表示,将于四月发布该模型的完整代码,但 GitHub 上已经提供了一个演示版本。

研究人员在那里展示了它的一些功能,其中一个结果显示,一张女孩在户外的图像,只需简单的单字提示“暴风雨”,就变成了背景中闪电闪烁的动画。

根据这三个组织的研究人员发表的一篇学术论文,Follow-Your-Click 旨在解决市场上其他图像到视频模型所面临的问题,这些模型倾向于移动整个场景,而不是聚焦于图片中的特定对象。”

研究人员在周三发表的论文中表示:“我们的框架具有更简单但精确的用户控制,以及比以往方法更好的生成性能。”