Mistral AI：法国 AI 初创公司凭借开源与商用 LLM 挑战巨头，估值达 50 亿美元

这家法国人工智能初创公司正借助其商用和开源的大语言模型（LLM），将生成式 AI 提升至新高度。
在微软（Microsoft）、安德森·霍洛维茨（Andreessen Horowitz）等知名投资者的强力支持下，Mistral 的估值已达 50 亿美元，在日益拥挤的生成式 AI 市场中定位为一位强有力的竞争者。
通过让自身 LLM 比一些最强大 AI 公司更易获取，Mistral 声称：“通过训练自己的模型、公开发布模型并促进社群贡献，我们可以为新兴的 AI 寡头打造一个可信的替代方案。”

什么是 Mistral AI？

Mistral AI 是一家于 2023 年成立的法国人工智能初创公司。它构建开源和商用 AI 模型，其中一些在多项行业基准测试中达到了顶尖性能。

在微软、安德森·霍洛维茨等知名投资者的强力支持下，Mistral 估值达 50 亿美元，在日益拥挤的生成式 AI 市场中定位为一位强有力的竞争者。该公司顶尖的商用 LLM 在若干行业基准测试中超越了谷歌（Google）和 Anthropic 等老牌企业开发的模型，甚至让常被视为 AI 模型性能金标准的 OpenAI GPT-4 物有所值。

该公司还发布了一系列开源模型，任何人都可免费使用和修改。通过使其 LLM 比一些最强大的 AI 公司更易获取，Mistral 声称：“通过训练自己的模型、公开发布模型并促进社群贡献，我们可以为新兴的 AI 寡头打造一个可信的替代方案。”

Mistral AI 提供什么？

Mistral AI 提供多种大型语言模型（LLM），包括商用版和开源版。每个模型都有其独特的优点和能力。

Mistral 的所有商用模型均为闭源，仅通过其 API 提供。

Mistral Large：Mistral AI 最先进的模型。

适用于合成文本生成和代码生成等复杂任务。

在多项行业基准测试中排名仅次于 GPT-4。

最大上下文窗口为 32k token。

原生支持英语、法语、西班牙语、德语和意大利语，以及代码。

Mistral Small：专注于低延迟工作负载的高效推理。

适用于可批量处理的简单任务，如文本生成和文本分类。

最大上下文窗口为 32k token。

原生支持英语、法语、西班牙语、德语和意大利语，以及代码。

Mistral Embed：将文本转换为数值表示（即“嵌入”），以便计算机能够处理和分析词语。

适用于情感分析和文本分类等任务。

目前仅支持英语。

Mistral 的所有开源模型均基于 Apache 2.0 许可证免费提供，这是一种完全宽松的许可证，允许任何人在任何地方无限制地使用。

Mistral 7B：专为轻松定制和快速部署而设计。

能够更快地处理大量数据，且计算成本最低。

训练数据集包含约 70 亿参数，但其性能优于 Llama 2（130 亿参数），并可与高达 300 亿参数的模型相媲美。

最大上下文窗口为 32k token。

可用于英语和代码。

Mixtral 8x7B：旨在以最小的计算量实现良好性能。

采用混合专家（Mixture of Experts）架构；推理时仅使用其潜在 450 亿参数中的约 120 亿。

在大多数基准测试中，性能优于 Llama 2（700 亿参数）和 GPT-3.5（1750 亿参数）。

最大上下文窗口为 32k token。

原生支持英语、法语、西班牙语、德语和意大利语，以及代码。

Mixtral 8x22B：Mistral AI 最先进的开源模型。

适用于总结大型文档或生成大量文本等任务。

Mixtral 8x7B 的更大版本；推理时仅使用其潜在 1410 亿参数中的约 390 亿。

在成本性能比上优于 Llama 2 70B 以及 Cohere 的 Command R 和 R+。

最大上下文窗口为 64k token。

原生支持英语、法语、西班牙语、德语和意大利语，以及代码。

Le Chat：除了 LLM，Mistral AI 还提供 Le Chat——一款能够生成内容并与用户对话的 AI 聊天机器人，类似于 ChatGPT、Gemini 和 Claude 等平台。Mistral AI 还允许用户选择底层运行的模型——追求更好推理选择 Mistral Large，追求速度和成本效益选择 Mistral Small，或者选择旨在提供简洁答案的原型模型 Mistral Next。

不过，Le Chat 并未实时接入互联网，因此其回答可能并不总是最新的。与任何生成式 AI 工具一样，它可能产生有偏见的回答并出错。但 Mistral 表示，正在努力使其模型“尽可能有用且尽量减少主观意见”。

另请阅读：如何创建大型语言模型（LLM）？

Mistral AI 有哪些用途？

Mistral AI 的所有 LLM 都是基础模型，这意味着它们可以经过微调，用于各种自然语言处理任务，例如：

聊天机器人：使聊天机器人能够理解用户的自然语言查询，并以更准确、更人性化的方式回应。

文本摘要：提取文章和文档的精华，并以简洁的概述总结其关键点。

内容创作：生成自然语言文本，包括电子邮件、社交媒体文案、短篇故事、求职信等。

文本分类：将文本归入不同类别，例如根据内容将邮件标记为垃圾邮件或非垃圾邮件。

代码补全：生成代码片段、优化现有代码并建议错误修复，以加快开发过程。

如何使用 Mistral AI 模型？

Mistral AI 的所有模型均可在其网站上找到。这些模型也可在 Amazon Bedrock、Databricks、Snowflake Cortex 和 Azure AI 等平台上使用。

要直接在 Mistral AI 网站上使用这些模型，请访问其 AI 开发与部署平台 La Plateforme。在那里，您可以根据自身规格设置防护措施并微调模型，然后将其集成到自己的应用程序和项目中。价格范围取决于您使用的模型。例如，Mistral 7B 每百万输入 token 收费 0.25 美元，而 Mistral Large 每百万输出 token 收费 24 美元。

您还可以通过 Mistral 的免费 AI 聊天机器人 Le Chat，与 Mistral 的大型和小型模型进行交互。Mistral AI 的所有模型均可在其网站上找到。这些模型也可在 Amazon Bedrock、Databricks、Snowflake Cortex 和 Azure AI 等平台上使用。

您还可以通过 Mistral 的免费 AI 聊天机器人 Le Chat，与 Mistral 的大型和小型模型进行交互。

什么是 Mistral AI？

什么是 Mistral AI？

Mistral AI 提供什么？

Mistral AI 有哪些用途？

如何使用 Mistral AI 模型？

信号简报

运营面

市场背景

关注事项

深度趋势背景

战略圈

领导联盟

战略圈简报

领导联盟简报