• Meta Platforms 发布了其最新大型语言模型 Llama 3 的早期版本,该模型具备新的计算机编码能力和图像命令处理功能。这些模型将被集成到虚拟助手 Meta AI 中,该公司将其宣传为免费使用同类产品中最先进的。
  • 计划在未来几个月发布的 Llama 3 版本还将具备“多模态”能力,即它们可以生成文本和图像,以追赶生成式 AI 市场领导者 OpenAI。
  • Llama 2 模型无法理解基本的上下文,Meta 通过在 Llama 3 中使用“高质量数据”来减少这些问题,使模型能够识别细微差别。对生成式 AI 模型的数据需求已成为该技术开发中的一个主要紧张来源。

Meta Platforms 发布了其最新大型语言模型 Llama 3 的早期版本,该模型具备新的计算机编码能力和图像命令处理功能。配备的图像生成器将在用户输入提示时实时更新图片,以追赶生成式 AI 市场领导者 OpenAI。
观看 CEO 马克·扎克伯格的视频解说。

目标:多模态 AI 模型

Meta 首席产品官 Chris Cox 在接受采访时表示,计划在未来几个月发布的 Llama 3 版本也将具备“多模态”能力,即可以生成文本和图像,尽管目前该模型仅输出文本。

这些模型将被集成到虚拟助手 Meta AI 中,该公司将其宣传为免费使用同类产品中最先进的。更高级的推理能力,例如制定更长多步计划的能力,将在后续版本中推出。

另请阅读:Meta 推出新一代“全能型”MTAI 芯片,速度是前代 3 倍

Chris Cox 表示,将图像纳入 Llama 3 的训练将增强今年即将推出的 Ray-Ban Meta 智能眼镜的更新,该眼镜是与眼镜制造商 依视路陆逊梯卡 合作推出的,使 Meta AI 能够识别佩戴者看到的物体并回答相关问题。

训练 AI 模型面临数据危机

Llama 2 模型无法理解基本的上下文,Meta 通过在 Llama 3 中使用“高质量数据”来减少这些问题,使模型能够识别细微差别。竞争对手谷歌也遇到了类似问题,最近因 Gemini AI 图像生成工具对历史人物描绘不准确而受到批评后,暂停了该工具的使用。

Meta CEO 马克·扎克伯格表示,Llama 3 的最大版本目前正在训练,拥有 4000 亿参数,并且在衡量 AI 模型强度和性能质量的“大规模多任务语言理解”(Massive Multitask Language Understanding)指标上已获得 85 分。

另请阅读:美国议员提出法案,强制 AI 公司披露训练数据

对生成式 AI 模型数据的巨大需求已成为该技术开发中的一个主要紧张来源。Meta 没有详细说明所使用的数据集,尽管它为 Llama 3 提供了比 Llama 2 多七倍的数据,并使用了“合成”或 AI 生成的数据来增强编码和推理等领域。