• Gemini 是谷歌最新的大语言模型,旨在与 OpenAI 的 GPT-4 竞争,它能够理解和互动视频与音频,从而提供多感官体验。
  • 谷歌声称,Gemini 在 32 项基准测试中有 30 项表现优于 GPT-4,其强项在于多模态性。预计它将被集成到各种谷歌产品中,包括搜索引擎、广告产品和 Chrome 浏览器。

Alphabet 发布 Gemini:旨在挑战 GPT-4 的 AI 模型
Alphabet 发布 Gemini:旨在挑战 GPT-4 的 AI 模型


发生了什么?

谷歌 CEO 桑达尔·皮查伊宣布推出 Gemini,这是一种新的大型语言模型,旨在与 OpenAI 的 GPT-4 竞争。Gemini 是一款多功能 AI 模型,预计将对谷歌的众多产品产生重大影响。它推出三个版本:适用于 Android 设备的轻量级模型 Gemini Nano;用于谷歌 AI 服务和 Bard 的更强大版本 Gemini Pro;以及专为数据中心和企业应用设计的 Gemini Ultra。Gemini 以其能够理解和互动视频与音频的能力脱颖而出,提供多感官体验。谷歌声称Gemini 在 32 项基准测试中有 30 项表现优于 GPT-4,其强项在于多模态性。该模型预计将被集成到谷歌的搜索引擎、广告产品、Chrome 浏览器等中。借助 Gemini,谷歌旨在重新夺回其在 AI 领域的地位,并在生成式 AI 方面取得重大进展。

另请阅读:WhatsApp 新的“原始质量”分享功能是好是坏?

人们怎么看?

谷歌 Gemini AI 发布
谷歌 Gemini AI 发布

正面观点:

1. 谷歌的 Gemini 被视为 AI 技术的重大飞跃,预计将对谷歌的所有产品产生重大影响。

2. Gemini 理解和互动视频与音频的能力使其与 OpenAI 的 GPT-4 区别开来,在 32 项基准测试中有 30 项取得优势。

3. 将 Gemini 集成到谷歌的搜索引擎、广告产品和 Chrome 浏览器被视为公司的未来。

4. Gemini 的多模态性,结合文本、图像、视频和音频,被认为是将增强其能力的强大特性。

5. Gemini 提升编程和头脑风暴任务的潜力被视为该模型的杀手级应用。

负面观点:

1. 尽管 Gemini 模型取得了进步,但人们仍担心其可能存在的偏见和问题。

2. Gemini 能力的真正考验将来自日常用户,它在现实场景中的表现还有待观察。

3. 尽管谷歌声称将安全与责任置于首位,但推出最先进的 AI 系统本身就存在风险,这些系统可能存在不可预见的问题或攻击载体。

4. Gemini 的发布方式较为谨慎,这表明仍可能存在不确定性和需要克服的潜在挑战。

5. 目前尚不确定 Gemini 能否赶上 OpenAI 的 ChatGPT,后者已在 AI 行业获得了显著的知名度和认可。

另请阅读:ExpressVPN 发布针对 Apple TV 的新原生 VPN 应用

未来如何?

文章图片
谷歌发布了 ChatGPT 的竞争对手 AI 模型 Gemini,它表示该模型经过训练,行为方式类似于人类。

1. 集成到谷歌生态系统:预计 Gemini 将无缝集成到各种谷歌产品中,包括搜索引擎、广告产品、Chrome 浏览器等。这种集成将提升用户体验,并提供更准确、更多样化的回应。

2. 拓展多语言能力:虽然 Gemini 目前仅支持英语,但谷歌已表示计划在未来扩展语言能力,涵盖其他语言。这将使 Gemini 更易于为全球更广泛的受众所使用。

3. 多模态性的进步:Gemini 理解和互动视频、音频以及其他感官输入的能力预计将随时间提升。谷歌旨在通过整合动作和触觉等其他感官来增强 Gemini 的能力,这可能对机器人技术等相关领域产生影响。

4. 性能与可靠性提升:谷歌承认 Gemini 模型仍存在局限性,包括偏见和偶尔的幻觉。然而,该公司致力于持续研发,以解决这些问题,提升 Gemini 的整体性能和可靠性。

Gemini 的未来对谷歌而言潜力巨大。随着该模型不断演进和完善,预计它将在塑造 AI 驱动的产品与服务方面发挥关键作用,并进一步巩固谷歌在 AI 行业的地位。