• V4 处理长上下文任务时可处理超过百万 tokens,但不具备图像和视频处理能力
• 训练中使用华为芯片,加强中国国内 AI 计算生态系统
事实
DeepSeek 于周五发布了 V4 模型的预览版,确认在部分训练过程中使用了华为芯片。其 Pro 版本在世界知识基准测试中排名落后于谷歌的 Gemini-Pro-3.1。V4 面向 AI 代理工作负载,支持超过百万 tokens 的上下文,但不包含多模态图像或视频处理功能。
评估
华为参与 V4 训练标志着中国顶级 AI 开发商与国内半导体基础设施之间更紧密的配合,减少了对英伟达的依赖。强大的基准性能与较低的计算需求相结合,也加剧了高效模型设计领域的竞争——尤其是开源替代方案挑战专有前沿系统。
需要关注
基于华为的训练是否会成为中国 AI 开发者的标准,以及 V4 的基准排名在独立企业测试中是否能够保持。
延伸阅读: 华为五年内投入逾百亿美元用于智能驾驶计算
延伸阅读:DeepSeek V4 在华为芯片上运行

