• 苹果的研究团队目前正在开发一款创新的 AI 模型,名为 ReALM(Reference Resolution As Language Model)。
  • 该模型旨在理解上下文中的语言,并能完全在设备端运行,无需强大的计算能力。
  • 最近的一篇研究论文指出,这种新的 AI 模型可能会增强苹果内置语音助手 Siri 的功能。

苹果公司的研究人员发表了一篇关于名为 ReALM(Reference Resolution As Language Model)的 AI 模型的新论文,该模型据称能够理解上下文语言。

指代消解语言模型

该 AI 模型名为 ReALM,是“Reference Resolution As Language model”(指代消解语言模型)的缩写。论文强调,该模型的主要关注点是执行和完成利用上下文语言线索的任务,这在人类的说话方式中更为常见。

ReALM 专为在智能设备上执行任务而设计。

这些任务分为三个类别——屏幕实体、对话实体和后台实体。

正如研究论文所述,屏幕实体是指设备屏幕上显示的任务,对话实体基于用户请求的内容,后台实体则是在后台运行的任务,例如在应用程序中播放的歌曲。

相关阅读: MM1:苹果的首款多模态 AI 模型

相关阅读: 苹果将在 WWDC 2024 上展示‘visionOS 进展’

与 ChatGPT 对比

论文还声称,尽管在如此受限的环境中运行,该 AI 模型的表现“大幅”超越 OpenAI 的 GPT-3.5 和 GPT-4。它使用的参数量远少于 GPT-3.5 和 GPT-4 等主流大语言模型。

论文进一步阐述,该模型在纯文本基准测试中得分已经高于 GPT-3.5,而在特定领域的用户对话中,其表现优于 GPT-4。

尽管这篇论文很有前景,但尚未经过同行评议,因此其有效性仍不确定。但如果论文获得积极评价,可能会推动苹果将该模型商业化,甚至用它来让 Siri 变得更智能。