• 法国创业公司 Mistral 通过 Torrent 链接出其不意发布 Mixtral 8x7B 模型,令行业震惊。
  • 用户称赞该大语言模型的能力,超越了 OpenAI 的 GPT-3.5 等。
  • Mistral 在人工智能文化战争中的开源承诺使其脱颖而出。

这一出人意料的举动让整个科技界感到惊讶,法国 AI 创业公司Mistral在没有大肆宣传的情况下,将其最新的大语言模型(LLM)倾倒入数字世界,通过流行论坛 X 上的一个不起眼的 Torrent 链接发布。这种非正统的做法与通过媒体发布会和精心编写的博客文章来展示尖端算法的传统做法形成鲜明对比。

Mistral 非传统的发布方式引发网络热议

Mistral 最近在 A 轮融资中获得了令人瞩目的 4.15 亿美元,如今估值约 20 亿美元。该公司的最新作品,名为Mixtral-8x7B,因其卓越的性能迅速引起关注,用户声称它轻松超越了该领域领先的 LLM 之一,OpenAI 的 GPT-3.5。

Mixtral-8x7B
Mixtral 8x7B

通过 Torrent 链接发布模型的决定引发了既好笑又钦佩的反应,尤其是在 X 论坛上,用户欣赏 Mistral 那种看似漫不经心、像黑客一样的态度。论坛上的一位评论者强调了其缺乏常规宣传元素,他说:“没有博客,没有夸张,没有说明——只有一个包含模型文件的种子……Mistral 明白他们的主要受众是工程师,而且清楚他们的文化敏感区。”

Mistral 打破沉默,公布 Mixtral-8x7B 详情

虽然最初的发布让用户猜测 Mistral 的动机,但公司最终在周一跟进了一篇博客文章,提供了关于 Mixtral-8x7B 的更多细节。根据文章中分享的基准测试,Mistral 的算法优于一些美国竞争对手,包括 Meta 的 Llama 2 系列和 OpenAI 著名的 GPT-3.5。

随着市场上越来越多的 AI 产品出现,用户将对这些产品进行比较。Mixtral-8x7B-32kseqlen,简称为 Mixtral。Lulu Cheng Meservey 认为这听起来像是埃隆·马斯克的产物,因为名称只是一个简单的描述(专家混合,8 个模型,70 亿参数,32k 上下文大小)。

没有博客,没有夸张,没有说明——只有一个包含模型文件的种子。就像一块朴素的牛排。

关键是:Mistral 明白他们的主要受众是工程师,而且清楚他们的文化敏感区。与谷歌的发布方式相比,Mistral 的速度、对实质内容的关注、简洁的极简主义以及没有大张旗鼓的“麦克风落地”动作,赢得了这一轮。

Lulu Cheng Meservey,动视暴雪 CCO/EVP;个人账户。前 Substack,TrailRunner 联合创始人。

网络社区纷纷赞扬 Mistral 的新算法

网络社区对此纷纷赞同,称赞 Mistral 新算法的速度和效率。X 论坛上充满了表情包和赞美之词,凸显了 Mixtral-8x7B 显而易见的成功。Mistral 发布策略的一个有趣之处在于该模型是开源的,这与 OpenAI 遭受行业抨击的闭源做法形成鲜明对比。

正如 CEO Arthur Mensch 所述,Mistral 致力于将其所有 AI 软件开源,这与公司更广阔的愿景相符。Mensch 强调了 Mistral 致力于“开放、负责任和去中心化的技术方法”,将公司牢牢定位于 AI 行业日益增长的文化战争之中。

随着 Mistral 颠覆了 AI 模型发布的传统规范,Mixtral-8x7B 的成功及其开源特性对领域内的老牌玩家构成了挑战。Mistral 的非传统方式是否会成为潮流引领者,还是只是一次偶然事件,还有待观察,但该公司迅速崛起和大胆策略无疑已在科技界引起热议。