• Mistral 于 7 月 24 日推出其最新旗舰 AI 模型 Large 2,将其定位为与 OpenAI 和 Meta 的尖端模型相抗衡的强大竞争对手。
  • Mistral Large 2 的发布标志着快速发展的 AI 领域中的一个重要里程碑,突显了当前 AI 开发和竞争的几个关键方面。

OUR TAKE
Mistral 的 Large 2 强势登场,挑战 Meta 和 OpenAI 的巨头。然而,规模并非一切。凭借 1230 亿参数,相较于 Llama 的 4050 亿参数,Large 2 以精准优于蛮力之势令人瞩目。但其闭源性质和昂贵的许可费用可能令部分人望而却步。此外,缺乏多模态功能意味着 OpenAI 在图文集成方面仍领先。Mistral 的迅速崛起,结合其 128K 令牌窗口,展示了其战略方法,每次处理一本厚度的提示,逐步推进。
——Miurio huang,BTW 记者

发生了什么

Mistral AI于 7 月 24 日推出其最新旗舰 AI 模型 Large 2,将其定位为与 OpenAI 和 Meta 的尖端模型相抗衡的强大竞争对手。此次发布距 Meta 推出其先进模型 Llama 3.1 405b 仅一天。Mistral 声称,Large 2 在代码生成、数学和推理等领域表现出色,与竞争对手相比,其性能匹配甚至超越。

Large 2 拥有 1230 亿参数,远低于 Llama 3.1 405B,但据报道,它在特定基准测试中优于 Meta 的模型。在 Large 2 的训练过程中,主要关注点是减少幻觉问题,该模型旨在在缺乏知识时承认,而非编造看似合理的信息。

这家总部位于巴黎的 AI 初创公司 Mistral,最近在由 General Catalyst 领投的 B 轮融资中筹集了 6.4 亿美元,估值达到 60 亿美元。尽管是 AI 行业的新玩家,Mistral 已迅速跻身前列,不断发布高性能 AI 模型。

然而,重要的是要注意,Mistral 的模型与许多其他模型一样,并非传统意义上的开源。将 Large 2 用于商业用途需要付费许可,且部署如此大型模型需要大量专业知识和基础设施。此外,与 Meta 的 Llama 3.1 相似,Large 2 缺乏多模态能力——这一领域目前由 OpenAI 领先,使其能够同时处理图像和文本。

Large 2 具备 128,000 令牌的窗口,允许在单个提示中处理相当于一本 300 页书的数据量。该模型还提供了增强的多语言支持,能理解英语、法语、德语、西班牙语、意大利语、葡萄牙语、阿拉伯语、印地语、俄语、中文、日语和韩语等语言,以及 80 种编程语言。值得注意的是,Mistral 声称 Large 2 的回复比其他 AI 模型更简洁,后者往往冗长。

新模型可在 Google Vertex AI、Amazon Bedrock、Azure AI Studio 和IBM Watsonx等主要平台上使用。此外,用户可以在 Mistral 的平台上以“mistral-large-2407”的名称体验 Large 2,并可在该初创公司的 ChatGPT 竞争对手 Le Chat 上免费测试。

同时阅读: 英国引领欧洲 GenAI 初创企业,Accel 发布报告

同时阅读:对话式 AI 与 GenAI 的区别

为何重要

Mistral Large 2 的发布标志着快速发展的 AI 领域中的一个重要里程碑,突显了当前 AI 开发和竞争的几个关键方面。首先,该模型的性能基准和参数效率凸显了 AI 公司间持续竞相打造更强大、更具成本效益的解决方案。通过以更少的参数超越 Meta 的 Llama 3.1 405B,Mistral 证明了效率与性能可以并存,为 AI 模型树立了新标准。

减少 AI 模型中的幻觉问题是另一项关键进展。能够准确认知自身局限性的 AI 系统,尤其在专业和关键应用中,增强了可靠性和可信度。这种对创建具有辨别力模型的关注,使 Mistral 成为开发更可靠 AI 解决方案的领导者。

可观的 B 轮融资和 60 亿美元的估值反映了投资者对 Mistral 能力和市场潜力的高度信心。这一资金支持很可能推动进一步的创新和扩张,使 Mistral 能够继续挑战如 OpenAI 和 Meta 等已站稳脚跟的 AI 巨头。

然而,Large 2 专有且商业用途需付费许可的性质,凸显了先进 AI 技术货币化的更广泛行业趋势。这种做法可能限制资源不足的小型企业或个人的可及性,可能减缓广泛采用和创新的步伐。

Large 2 缺乏多模态能力,指向了 OpenAI 保持竞争优势的领域。对于需要同时处理多种数据类型(如图像和文本)的应用,多模态 AI 系统愈发重要。随着初创公司努力集成这些功能,竞争可能加剧,推动 AI 技术进一步发展。

Large 2 广泛的多语言支持及在单个提示中处理大量数据的能力,使其成为全球应用的通用工具。这一功能在多样化语言环境和复杂计算任务中尤为宝贵,拓宽了该模型在各行业的适用性。

Mistral 的 Large 2 代表了 AI 发展的重大飞跃,展示了该公司与行业领导者竞争的能力。该模型在性能、可靠性和多语言支持方面的进步,使 Mistral 成为 AI 格局中一股强大的力量,推动创新并为未来 AI 模型树立新标杆。