- Mistral AI 是一家销售人工智能(AI)产品的法国公司。它成立于 2023 年 4 月,由 Meta Platforms 和 Google DeepMind 的前员工创立。
- 两款模型 Mistral 7B 和 Mixtral 8x7B 已发布,并以权重形式提供。还有三款模型 Mistral Small、Mistral Medium 和 Mistral Large 仅通过 API 提供。
- Mistral AI 还推出了一款名为 Le Chat 的聊天机器人,对标 ChatGPT,并与科技巨头微软建立了合作关系。
Perplexity AI 是一家年轻的公司,专注于人工智能和机器学习解决方案。他们致力于开发先进的算法和技术,以解决包括金融、医疗保健和技术在内的各行业的复杂问题。
什么是 Mistral AI?
Mistral AI 是一家销售人工智能的法国公司,由 Meta Platforms 和 Google DeepMind 的前员工于 2023 年 4 月创立。它生产开源大型语言模型(LLM),强调开源软件的基础重要性,并作为对专有模型的回应。
在共同创立 Mistral AI 之前,Arthur Mensch 曾在 Google DeepMind(谷歌的人工智能实验室)工作,而 Guillaume Lample 和 Timothée Lacroix 则在 Meta Platforms 工作。这几位联合创始人在 巴黎综合理工学院(École Polytechnique) 求学时相识。
Mistral 的开源权重模型
两款模型 Mistral 7B 和 Mixtral 8x7B 已发布,并以权重形式提供。
其首个语言处理模型 “Mistral 7B” 于 2023 年 9 月 27 日发布,遵循自由的 Apache 2.0 许可证。该模型拥有 70 亿参数,与竞争对手相比规模较小。
该公司于 2023 年 12 月 11 日发布了 Mixtral 8x7B 模型,该模型拥有 467 亿参数,但得益于混合专家架构,每个 token 仅使用 129 亿参数。该模型精通 5 种语言(法语、西班牙语、意大利语、英语和德语),根据开发者的测试,其性能超越了 Meta 的 “LLama 2 70B” 模型。
另请阅读:法国 AI 初创公司 Mistral 意外发布优于 ChatGPT 的 LLM,震动行业
Mistral 的仅 API 模型
三款模型 Mistral Small、Mistral Medium 和 Mistral Large 仅通过 API 提供,这意味着这些模型是闭源的,只能通过 Mistral 的应用程序编程接口使用。
微软于今年 2 月宣布与该公司建立新的合作伙伴关系,以扩大其在快速发展的 AI 行业中的影响力。根据协议,Mistral 丰富的语言模型将在微软 Azure 云上提供,同时还将推出模仿 ChatGPT 风格的多语言对话助手 “Le Chat”。
在目前可通过 API 访问的所有大型模型中,Mistral Large 排名第二,仅次于 GPT-4,并且是唯一在 MMLU 测试中得分超过 80 分的模型。
随着 Mistral Large 的推出,Mistral AI 也推出了名为 Le Chat 的聊天机器人,对标 ChatGPT,旨在复制 OpenAI 的成功之路。尽管有微软 Azure 计算资源的支持,Le Chat 的服务器仍然拥挤。
另请阅读:法国 Mistral 推出 Le Chat 挑战 ChatGPT
在推理准确度方面,Mistral Large 已超越 Claude 2、Gemini 1.0 Pro、GPT-3.5 等知名大模型,同时支持 32k token 的上下文窗口,支持精确指令,并具备函数调用能力。在推理速度上,Mistral Large 甚至超越了 GPT-4 和谷歌最近推出的 Gemini Pro。
许多开源大模型爱好者担心 Mistral AI 会像 OpenAI 一样从开放走向封闭。根据对 Mistral CEO 的采访,他们未来不仅会继续坚持开源理念,同时还会推出最强大的闭源模型,以在商业上竞争。

