- 谷歌推出了三款全新的 Gemma 2 模型,其中包括轻量级的 Gemma 2 2B,该模型以更少的参数量超越了更大的模型。
- 此外,ShieldGemma 充当安全分类器,而 Gemma Scope 提供增强的可解释性。这些模型旨在推动更安全、更高效、更透明的人工智能发展。
我们的观点
谷歌全新的 Gemma 2 模型体现了向更高效、更安全、更透明的 AI 转变的趋势。通过展示较小的模型可以胜过较大的模型,谷歌挑战了现状,并推动了负责任的 AI 开发。对安全性和可解释性的关注值得称赞,促进了信任和更广泛的采用。
–Vicky Wu,BTW 记者
发生了什么
谷歌在其 Gemma 2 生成式 AI 系列中发布了三款新模型,号称比同类产品更小、更安全、更透明。这些新模型——Gemma 2 2B、ShieldGemma 和 Gemma Scope——旨在满足各种应用需求,同时优先考虑安全性和可解释性。
Gemma 2 2B 是一款轻量级的大型语言模型(LLM),针对本地设备操作进行了优化,并获准用于研究和商业用途。尽管参数量仅为 26 亿,但根据独立评估,Gemma 2 2B 的性能超越了 OpenAI 的 GPT-3.5 和 Mistral AI 的 Mistral 8x7B 等更大模型。相反,Gemma 2 2B 展示了先进训练技术、卓越架构和高质量数据的有效性。谷歌希望这将鼓励业界转向优化模型而非一味增大尺寸,并凸显了模型压缩和蒸馏对于降低计算需求、使 AI 更易获取的重要性。
ShieldGemma 是一组安全分类器,可检测仇恨言论和色情材料等有害内容,过滤提示和生成的内容。Gemma Scope 通过允许开发者检查 Gemma 2 模型的特定方面,增强了透明度,使其内部运作更易于解释。
另请阅读:苹果使用谷歌芯片进行人工智能模型训练
另请阅读:英国反垄断机构审查谷歌与 Anthropic 的合作关系
为何重要
这些发布紧随美国商务部支持开放人工智能模型之后,突显了扩大生成式 AI 可及性的好处。新模型表明,通过先进的训练技术和高质量数据,较小的参数量也能实现有竞争力的性能,挑战了更大模型始终表现更佳的固有观念。
谷歌的 Gemma 2 模型通过提供完全开源选项,在 AI 社区中培养了良好声誉,类似于 Meta 的 Llama 模型。随着各组织越来越多地采用 AI 技术,对安全性和可解释性的重视对于确保负责任和合乎道德的部署至关重要。
这些模型的推出标志着向着更易获取和更负责任的 AI 迈出了重要一步,并可能引领行业焦点从单纯的规模转向精细化和优化。

