• 一次处理一百万个 token,让 Gemini 1.5 Pro 在商业应用中拥有更广泛的可能性;
  • 谷歌去年 12 月刚刚发布了 Gemini 1.0,这次突然的更新显然是“有备而来”。

此前,大多数人会认为 OpenAI 的GPT-4 Turbo是地球上最强大的 AI 模型。然而,谷歌突然发布的“下一代 AI 模型”Gemini 1.5 迅速改变了人们的看法,与去年 12 月刚发布的 Gemini 1.0 相比,它在生产力方面的提升非常显著。

多模态通用模型的重大升级

这个新版本的亮点是 Gemini 1.5 Pro 的首次亮相,它是一个多模态通用模型,将稳定上下文处理的上限扩展至 100 万个 token,开启了 AI 模型能够处理文本、代码、图像、语音和视频等多种富媒体类型的时代。

这次重大升级超越了两个月前发布的 Gemini 1.0 Pro 的上下文理解上限(32,000 个 token),以及仅支持 128,000 个 token 的 OpenAI GPT-4 Turbo。简单来说,Gemini 1.5 Pro 可以一次性处理超过 70 万字的文本、3 万行代码、11 小时的音频或 1 小时的视频,这得益于其“多专家模型”(MoE)算法,该算法只运行整体模型的一部分,从而更快、更高效地响应请求。

另请阅读:谷歌的 Bard 聊天机器人获得 Gemini Pro 全球更新

未来的 AI 模型可以一次性处理整部《权力的游戏》系列

谷歌首席执行官孙达尔·皮查伊还透露,谷歌的研究人员已经成功测试了 1000 万个 token 的上下文窗口,这表明未来的 AI 模型可以一次性处理整部“《权力的游戏》”系列(已出版的五本书总计 173 万字)。目前,提供给开发者的 Gemini 1.5 Pro 测试版 token 限制仅为 128,000 个,但 DeepMind 首席执行官德米斯·哈萨比斯直言,稍后将推出解锁 100 万 token 版本的新付费层级。作为比较,目前使用 Google Gemini 1.0 Pro 模型的订阅费为每月 19.99 美元。