谷歌发布 Gemma 3n 端侧多模态模型,2GB 内存也能玩转 AI

图灵汇官网

谷歌在2025年的I/O开发者大会上发布了一款新的人工智能模型叫Gemma 3n。它能在手机、平板和笔记本电脑上本地运行,支持处理多种数据类型,包括音频、文本、图片和视频。

Gemma 3n的负责人Gus Martins说,这款模型可以在内存少于2GB的设备上运行,而且用的是跟Gemini Nano一样的架构,不过性能更强。他提到:“Gemma 3n为设备端的AI应用提供了很好的支持。”

有文章提到,Gemma 3n的一大亮点是使用了谷歌DeepMind研发的Per-Layer Embeddings(PLE)技术,这让模型所需的内存大幅减少。尽管它的参数量达到5B和8B,但实际占用内存相当于2B和4B的模型。

谷歌方面称,Gemma 3n的内存占用最少为2GB和3GB。借助PLE、KVC共享和高级激活量化等技术,这个模型在移动设备上的运行速度比Gemma 3的4B版本快1.5倍,质量也更好。

Gemma 3n在非英语语言处理上也有进步,特别是在日语、德语、韩语、西班牙语和法语的表现很出色。在多语言测试WMT24++中,该模型得分达50.1%。

用户不需要额外设置,现在就能通过Google AI Studio在浏览器里试用Gemma 3n;开发者也可以通过Google AI Edge集成本地功能,用来理解和生成文本与图像,未来还会有更多功能加入。

此外,网页底部还有关于2025年谷歌I/O开发者大会的相关内容,以及一条广告说明,指出文中的跳转链接是为了提供更多参考信息,方便用户自行选择。

本文来源: 图灵汇 文章作者: