• 谷歌正在将最小的 AI 模型 Gemini Nano 直接集成到 Chrome 桌面客户端中,从 Chrome 126 开始。
  • 谷歌正在让 Chrome 中的众多高级 API 能够利用其 Gemini 模型在浏览器内进行翻译、添加字幕和转录文本。

在周二的 Google I/O 2024 开发者大会上,谷歌宣布正在将最小的 AI 模型Gemini Nano直接集成到 Chrome 桌面客户端中,从 Chrome 126 开始。

Gemini Nano AI 模型集成到桌面版 Chrome

Gemini推出了三种类型:Gemini Ultra、Gemini Pro 和 Gemini Nano,这是谷歌长期承诺的下一代 GenAI 模型家族,由谷歌的 AI 研究实验室 DeepMind 和 Google Research 开发。Gemini Nano 是一个较小的“蒸馏”模型,可在 Pixel 8 Pro 等移动设备上运行。该公司表示,最近在 Chrome 中对 WebGPU 和 WASM 的支持,使得这些模型能够在各种硬件上以合理的速度运行。

在周二公告前的简报会上,谷歌 Chrome 产品管理总监 Jon Dahlke 提到,他们正在与其他浏览器提供商进行讨论,以在各自的浏览器中也实现这一功能或类似功能。

Dahlke 在周二的公告中写道:“我们已经开始与其他浏览器接洽,并将为开发者开放早期预览计划。”“随着 webGPU、WASM 和 Gemini 被集成到 Chrome 中,我们相信网络已经为 AI 做好准备。”

另请阅读:谷歌 Gemini 预计明年将登陆 Android 手机

另请阅读:了解 Alphabet 的 Gemini,旨在挑战 ChatGPT-4 的 AI 模型

写作助手

谷歌正在让 Chrome 中的众多高级 API 能够利用其 Gemini 模型,在浏览器内直接执行翻译、添加字幕和文本转录等任务。据该公司称,这将使开发者能够利用设备端模型实现自己的 AI 功能。谷歌打算利用这一增强功能来支持诸如 Gmail 中 Workspace Lab 当前的“帮我写”工具等功能。

到目前为止,它已在 Pixel 8 Pro、Pixel 8 和 Samsung Galaxy S24 上支持了一些功能,包括录音机中的摘要功能和 Gboard 中的智能回复。录音机应用允许用户只需按下一个按钮即可录制和转录音频,现在该应用提供了基于 Gemini 的摘要功能,可总结你录制的讨论、采访、演示及其他片段。

Dahlke 在 I/O 大会的开发者主题演讲中说:“现在我们希望让大家能够在 Chrome 中访问 Gemini 模型。我们的愿景是,在 Chrome 中提供最强大的 AI 模型,覆盖数十亿用户,而无需担心提示工程、微调、容量和成本。你所需要做的就是调用几个高级 API——翻译、字幕、转录。这是网络的重大转变,我们希望把它做好。”