维度网讯,谷歌DeepMind发布开放AI模型Gemma 4 12B,该模型拥有120亿参数,可原生处理文本、图像和音频,并能在商用笔记本电脑上运行,仅需16GB工作内存或显存。模型基于Apache-2.0许可证发布,对开发者和企业免费开放,旨在降低本地AI智能体的入门门槛。
相比谷歌自家的设备端AI Gemini Intelligence在Android智能手机上要求较高的硬件配置,Gemma 4 12B有意面向大众市场。该模型采用无需独立编码器的架构,谷歌在博客中解释,Gemma 4 12B完全摆脱了独立的视觉和音频编码器。传统的多模态模型通常使用专门的编码器模块对图像和音频数据进行转换后再由语言模型处理,而Gemma 4 12B的输入数据直接由LLM主干处理。
性能接近两倍大的模型。在Gemma 4系列中,谷歌将12B模型定位在面向智能手机和物联网设备(如Raspberry Pi)的边缘版本E4B与更大的26B混合专家模型(MoE)之间。据谷歌称,在基准测试中该模型性能仅略逊于更强大的模型,不过如果没有专用GPU,推理时间可能会延长。与其他厂商的16GB版本相比,新模型的表现尚无法预见。
在简短的趣味测试中,Gemma 4 12B速度明显优于旧版Deepseek-r1蒸馏版(Qwen3/8B,8GB显存,由LM Studio提供)。测试任务是创建一个带有GeoIP解析和未来7天天气预报的简单网页,两个模型都完成得很好——谷歌模型耗时约10分钟,Deepseek-r1耗时超过1小时。Gemma 4 12B的Token消耗约3000个,而Deepseek-r1蒸馏版约12000个。测试平台是一台64GB内存、搭载AMD Ryzen 7640HS Pro处理器的笔记本电脑,计算能力较为有限。

本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com









