生成式视频竞赛在中国升温

中国一些最大的科技公司一直悄悄加大在文图生成视频领域的布局。2 月 5 日，以游戏帝国和微信闻名的中国互联网巨头腾讯，在 GitHub 上发布了其开源视频生成模型 DynamiCrafter 的新版本。继文本和图像生成后，视频生成将成为 AI 竞赛的下一个焦点。

腾讯在 GitHub 上发布了其开源视频生成模型 DynamiCrafter 的新版本。
本次更新主要专注于赋予自然场景随机动态（如云和流体）或特定领域运动的动画效果。”
在生成文本和图像之后，生成视频有望成为人工智能竞赛的下一个焦点。

中国一些最大的科技公司一直在悄悄地加大力度，力图在文图生成视频领域站稳脚跟。2 月 5 日，以视频游戏帝国和聊天应用微信而闻名的中国互联网巨头腾讯，在 GitHub 上发布了其开源视频生成模型 DynamiCrafter 的新版本。

工作原理

与市场上其他视频生成工具一样，DynamiCrafter 采用扩散方法将说明文字和静态图像转换为几秒钟长的视频。受物理学中自然扩散现象的启发，机器学习中的扩散模型能够将简单数据转换为更复杂、更真实的数据，类似于粒子从高浓度区域向低浓度区域移动的过程。

另请阅读：谷歌 AI 驱动的搜索现在已能生成图像

DynamiCrafter 第二代生成视频的分辨率为 640 x 1024 像素，较之十月份首次发布的 320 x 512 视频有所升级。DynamiCrafter 团队发表的一篇学术论文指出，其技术区别于竞争对手之处在于，它将图像动画技术的适用性扩展到了“更一般的视觉内容”。
“其关键思想是利用文本到视频扩散模型的运动先验，将图像作为引导融入生成过程中，”论文指出。相比之下，“传统”技术“主要专注于赋予随机动态的自然场景（如云和流体）或特定领域运动（如人类头发或身体运动）动画效果。”
在比较 DynamiCrafter、Stable Video Diffusion（11 月发布）以及最近热门的 Pika Labs 的演示中，腾讯模型的结果似乎比其他模型更稳定。不可避免地，所选样本可能会偏向 DynamiCrafter。”

企业间的无硝烟战争

不可否认的是，在生成文本和图像之后，生成视频有望成为人工智能竞赛的下一个焦点。因此，预计初创企业和科技公司将向这一领域投入大量资源。中国也不例外。除了腾讯和 TikTok 母公司字节跳动外，百度和阿里巴巴也发布了自己的视频扩散模型。

字节跳动的 MagicVideo 和百度的 UniVG 都在 GitHub 上发布了演示，但两者似乎都未向公众开放。与腾讯一样，阿里巴巴也开源了其视频生成模型 VGen，这一策略在希望触达全球开发者社区的中国科技公司中越来越受欢迎。

生成式视频竞赛在中国升温

工作原理

企业间的无硝烟战争

信号简报

运营足迹

市场背景

关注事项

深度趋势背景

战略圈

领导联盟

战略圈简报

领导联盟简报