• 谷歌已使用 Gemini 1.5 Flash 模型更新其 Gemini AI 聊天机器人,提升了回复质量、速度和图像理解能力,并向所有用户开放。
  • 该模型现在支持 32,000 个 token,可实现更长、更复杂的交互,并将在 230 个国家/地区提供 40 种语言版本,同时还为青少年用户增加了额外的安全措施。

我们的看法
Gemini 1.5 Flash 向所有用户开放,标志着向先进 AI 工具民主化访问迈出的重要一步。免费版中允许文件上传增强了功能和实用性。对回复的引用提高了透明度和信任度,解决了对 AI 准确性和可靠性的担忧。在安全措施下向青少年开放该工具是一项具有前瞻性的举措。
–Vicky Wu,BTW 记者

发生了什么

谷歌发布了其 Gemini AI 聊天机器人的更新,整合了 Gemini 1.5 Flash——一款轻量级大型语言模型,旨在与AnthropicOpenAI等竞争对手展开竞争。该公司已向所有用户开放该模型,无论其订阅级别如何。通过此次更新,用户将享受到 Gemini AI 回复质量和速度的全面提升,以及增强的推理和图像理解能力。

Gemini 1.5 Flash 最初于 2024 年 5 月在 Google I/O 大会上展示,最初仅向部分付费客户提供。现在,该模型正在向 Gemini 移动应用的免费版本和 gemini.google.com 网页界面推出。该模型的容量已显著提升,支持 32,000 个 token,是 5 月推出的原始版本的四倍。这一增强功能使其能够处理更长、更复杂的提示,提供更复杂、更准确的回复。

从周四开始,Gemini 1.5 Flash 将在网页和移动平台上提供,支持 40 种语言,覆盖约 230 个国家/地区。此外,13 岁及以上的青少年现在可以使用 Gemini,并已与儿童安全组织合作实施了安全措施。

相关阅读:Apple Maps 推出网页版,以新功能挑战谷歌

相关阅读:扎克伯格推出新 Llama AI 模型,旨在与 OpenAI、谷歌竞争

为何重要

Gemini 体验工程副总裁 Amar Subramanya 透露,用户很快就能将文件上传到免费的 Gemini AI 聊天机器人版本中,这一功能此前仅限付费层级使用。Subramanya 在一篇博客文章中写道:“你可以上传经济学学习指南,让 Gemini 创建练习题。” “Gemini 还将很快能够为你分析数据文件,让你发现见解并通过图表和图形将其可视化。”

另一项即将推出的功能将使 Gemini 能够分析数据文件,并根据内容生成可视化图表。为解决 AI 幻觉问题——即无意义或不准确的回复——Gemini 现在将为所有回复提供引用,链接到其所使用的源材料。如果模型产生了有问题的回复,用户可以探索引用的来源以验证信息的准确性。这些引用也将在使用 Gmail 扩展时包含在内,允许用户向 Gemini 提出与其电子邮件收件箱相关的问题。