谷歌发布 Gemma 3n 端侧多模态模型，2GB 内存也能玩转 AI

2025-05-21 14:30:27

谷歌在2025年的I/O开发者大会上发布了一款新的人工智能模型叫Gemma 3n。它能在手机、平板和笔记本电脑上本地运行，支持处理多种数据类型，包括音频、文本、图片和视频。

Gemma 3n的负责人Gus Martins说，这款模型可以在内存少于2GB的设备上运行，而且用的是跟Gemini Nano一样的架构，不过性能更强。他提到：“Gemma 3n为设备端的AI应用提供了很好的支持。”

有文章提到，Gemma 3n的一大亮点是使用了谷歌DeepMind研发的Per-Layer Embeddings（PLE）技术，这让模型所需的内存大幅减少。尽管它的参数量达到5B和8B，但实际占用内存相当于2B和4B的模型。

谷歌方面称，Gemma 3n的内存占用最少为2GB和3GB。借助PLE、KVC共享和高级激活量化等技术，这个模型在移动设备上的运行速度比Gemma 3的4B版本快1.5倍，质量也更好。

Gemma 3n在非英语语言处理上也有进步，特别是在日语、德语、韩语、西班牙语和法语的表现很出色。在多语言测试WMT24++中，该模型得分达50.1%。

用户不需要额外设置，现在就能通过Google AI Studio在浏览器里试用Gemma 3n；开发者也可以通过Google AI Edge集成本地功能，用来理解和生成文本与图像，未来还会有更多功能加入。

此外，网页底部还有关于2025年谷歌I/O开发者大会的相关内容，以及一条广告说明，指出文中的跳转链接是为了提供更多参考信息，方便用户自行选择。

模态模型内存发布 Gemma 端侧谷歌 2GB AI 3n

本文来源：图灵汇文章作者：

美国老牌小报《芝加哥太阳报》闹乌龙，专栏刊登大量 AI 生成虚假内容