信号简报 / 全球云服务趋势

作者 Tilly Lu 编辑团队

MM1：Apple 的首个多模态 AI 模型

Apple 发布了 MM1，新一代多模态模型，能够无缝地解析和交互图像与文本，为更直观、响应更灵敏的 Siri 和 iMessage 体验奠定了基础。MM1：开创性的多模态 AI Apple 推出了 MM1，一套创新的多…

作者Tilly Lu

阅读时间1 分钟

发布时间2024年3月31日

最后更新2026年7月5日

主要领域市场

内容类型事件

主题市场

地区全球

时间范围下一季度

影响中等

分类全球云服务趋势

MM1：Apple 的首个多模态 AI 模型是这份情报记录的主题。

地区全球

全球是证据中可见的管辖背景。

信号重点市场

市场是当前审视的主要信号。

内容类型事件

主要领域市场

市场构成这份档案的证据框架。

主题市场

Apple 发布了 MM1，新一代多模态模型，能够无缝地解析和交互图像与文本，为更直观、响应更灵敏的 Siri 和 iMessage 体验奠定了基础。MM1：开创性的多模态 AI Apple 推出了 MM1，一套创新的多…

影响中等

MM1：Apple 的首个多模态 AI 模型在这份档案中具有中等影响。

置信度有限置信度 (72%)

由公开证据支撑的多来源推断。

与 Google 的 Gemini 竞争：MM1 广泛的参数范围可与 Google 最初的 AI 模型版本相媲美。
创新的上下文学习：MM1 能够基于当前对话上下文理解并响应新查询。

Apple 发布了 MM1，新一代多模态模型，能够无缝地解析和交互图像与文本，为更直观、响应更灵敏的Siri 和 iMessage体验奠定了基础。

MM1：开创性的多模态 AI

Apple 推出了 MM1，一套创新的多模态 AI 模型，擅长处理视觉图像和文本数据。这些模型拥有高达 300 亿的参数数量，使其与 Google 的 Gemini 模型的最初版本相提并论。

另请阅读：Anthropic 声称其最新 AI 模型优于 GPT-4

MM1 模型具备解析和执行包含视觉和文本元素的指令的能力。例如，AI 可以通过分析菜单上显示的价格信息来计算两种饮料的总价。

MM1 的一个突出特点是其上下文学习能力。这使得模型能够基于当前对话中存在的上下文信息来理解和处理询问，无需针对每个新查询或任务进行特定的重新训练或微调。

这种上下文学习能力可能使模型能够生成图像的详细描述，或回答关于基于照片提示的内容的问题，即使它之前没有接触过类似的内容。

另请阅读：Apple 将在 WWDC 2024 上展示‘visionOS 进展’

提升用户体验

在提升用户体验方面，Apple 可以利用 MM1 的多模态理解能力来提升其语音助手 Siri 的性能。这将使 Siri 能够提供基于视觉数据（例如基于图像的问题）的答案。此外，MM1 可以帮助理解通过 iMessage 共享的图像和文本消息的上下文，从而为用户提供更相关的回复建议。

信号简报

信号: MM1：Apple 的首个多模态 AI 模型
信号类型: 相关主题
地区: 全球
市场类别: 全球云服务趋势

运营足迹

公开来源需要说明受影响方、运营足迹和市场暴露，才能把这张趋势图视为完整。

市场背景

运营相关性: 中等
时间范围: 下一季度

关注事项

关注官方声明、监管更新、客户或合作伙伴暴露，以及后续披露。

会员简报

深度趋势背景

使用对应会员级别登录后，可解锁完整简报和来源说明。

仅限战略圈

战略圈

所有读者均可浏览。加入并登录后可解锁趋势简报。

加入战略圈

仅限领导联盟

领导联盟

面向需要关系证据、失效路径和来源说明的运营者、投资者及政策团队；登录后可解锁。

加入领导联盟

← 返回更多报道: 全球云服务趋势