- 这家法国人工智能初创公司正借助其商用和开源的大语言模型(LLM),将生成式 AI 提升至新高度。
- 在微软(Microsoft)、安德森·霍洛维茨(Andreessen Horowitz)等知名投资者的强力支持下,Mistral 的估值已达 50 亿美元,在日益拥挤的生成式 AI 市场中定位为一位强有力的竞争者。
- 通过让自身 LLM 比一些最强大 AI 公司更易获取,Mistral 声称:“通过训练自己的模型、公开发布模型并促进社群贡献,我们可以为新兴的 AI 寡头打造一个可信的替代方案。”
什么是 Mistral AI?
Mistral AI 是一家于 2023 年成立的法国人工智能初创公司。它构建开源和商用 AI 模型,其中一些在多项行业基准测试中达到了顶尖性能。
在微软、安德森·霍洛维茨等知名投资者的强力支持下,Mistral 估值达 50 亿美元,在日益拥挤的生成式 AI 市场中定位为一位强有力的竞争者。该公司顶尖的商用 LLM 在若干行业基准测试中超越了谷歌(Google)和 Anthropic 等老牌企业开发的模型,甚至让常被视为 AI 模型性能金标准的 OpenAI GPT-4 物有所值。
该公司还发布了一系列开源模型,任何人都可免费使用和修改。通过使其 LLM 比一些最强大的 AI 公司更易获取,Mistral 声称:“通过训练自己的模型、公开发布模型并促进社群贡献,我们可以为新兴的 AI 寡头打造一个可信的替代方案。”

Mistral AI 提供什么?
Mistral AI 提供多种大型语言模型(LLM),包括商用版和开源版。每个模型都有其独特的优点和能力。
Mistral 的所有商用模型均为闭源,仅通过其 API 提供。
Mistral Large:Mistral AI 最先进的模型。
适用于合成文本生成和代码生成等复杂任务。
在多项行业基准测试中排名仅次于 GPT-4。
最大上下文窗口为 32k token。
原生支持英语、法语、西班牙语、德语和意大利语,以及代码。
Mistral Small:专注于低延迟工作负载的高效推理。
适用于可批量处理的简单任务,如文本生成和文本分类。
最大上下文窗口为 32k token。
原生支持英语、法语、西班牙语、德语和意大利语,以及代码。
Mistral Embed:将文本转换为数值表示(即“嵌入”),以便计算机能够处理和分析词语。
适用于情感分析和文本分类等任务。
目前仅支持英语。
Mistral 的所有开源模型均基于 Apache 2.0 许可证免费提供,这是一种完全宽松的许可证,允许任何人在任何地方无限制地使用。
Mistral 7B:专为轻松定制和快速部署而设计。
能够更快地处理大量数据,且计算成本最低。
训练数据集包含约 70 亿参数,但其性能优于 Llama 2(130 亿参数),并可与高达 300 亿参数的模型相媲美。
最大上下文窗口为 32k token。
可用于英语和代码。
Mixtral 8x7B:旨在以最小的计算量实现良好性能。
采用混合专家(Mixture of Experts)架构;推理时仅使用其潜在 450 亿参数中的约 120 亿。
在大多数基准测试中,性能优于 Llama 2(700 亿参数)和 GPT-3.5(1750 亿参数)。
最大上下文窗口为 32k token。
原生支持英语、法语、西班牙语、德语和意大利语,以及代码。
Mixtral 8x22B:Mistral AI 最先进的开源模型。
适用于总结大型文档或生成大量文本等任务。
Mixtral 8x7B 的更大版本;推理时仅使用其潜在 1410 亿参数中的约 390 亿。
在成本性能比上优于 Llama 2 70B 以及 Cohere 的 Command R 和 R+。
最大上下文窗口为 64k token。
原生支持英语、法语、西班牙语、德语和意大利语,以及代码。
Le Chat:除了 LLM,Mistral AI 还提供 Le Chat——一款能够生成内容并与用户对话的 AI 聊天机器人,类似于 ChatGPT、Gemini 和 Claude 等平台。Mistral AI 还允许用户选择底层运行的模型——追求更好推理选择 Mistral Large,追求速度和成本效益选择 Mistral Small,或者选择旨在提供简洁答案的原型模型 Mistral Next。
不过,Le Chat 并未实时接入互联网,因此其回答可能并不总是最新的。与任何生成式 AI 工具一样,它可能产生有偏见的回答并出错。但 Mistral 表示,正在努力使其模型“尽可能有用且尽量减少主观意见”。
另请阅读:如何创建大型语言模型(LLM)?
Mistral AI 有哪些用途?
Mistral AI 的所有 LLM 都是基础模型,这意味着它们可以经过微调,用于各种自然语言处理任务,例如:
聊天机器人:使聊天机器人能够理解用户的自然语言查询,并以更准确、更人性化的方式回应。
文本摘要:提取文章和文档的精华,并以简洁的概述总结其关键点。
内容创作:生成自然语言文本,包括电子邮件、社交媒体文案、短篇故事、求职信等。
文本分类:将文本归入不同类别,例如根据内容将邮件标记为垃圾邮件或非垃圾邮件。
代码补全:生成代码片段、优化现有代码并建议错误修复,以加快开发过程。
如何使用 Mistral AI 模型?
Mistral AI 的所有模型均可在其网站上找到。这些模型也可在 Amazon Bedrock、Databricks、Snowflake Cortex 和 Azure AI 等平台上使用。
要直接在 Mistral AI 网站上使用这些模型,请访问其 AI 开发与部署平台 La Plateforme。在那里,您可以根据自身规格设置防护措施并微调模型,然后将其集成到自己的应用程序和项目中。价格范围取决于您使用的模型。例如,Mistral 7B 每百万输入 token 收费 0.25 美元,而 Mistral Large 每百万输出 token 收费 24 美元。
您还可以通过 Mistral 的免费 AI 聊天机器人 Le Chat,与 Mistral 的大型和小型模型进行交互。Mistral AI 的所有模型均可在其网站上找到。这些模型也可在 Amazon Bedrock、Databricks、Snowflake Cortex 和 Azure AI 等平台上使用。
要直接在 Mistral AI 网站上使用这些模型,请访问其 AI 开发与部署平台 La Plateforme。在那里,您可以根据自身规格设置防护措施并微调模型,然后将其集成到自己的应用程序和项目中。价格范围取决于您使用的模型。例如,Mistral 7B 每百万输入 token 收费 0.25 美元,而 Mistral Large 每百万输出 token 收费 24 美元。
您还可以通过 Mistral 的免费 AI 聊天机器人 Le Chat,与 Mistral 的大型和小型模型进行交互。

