阿里巴巴发布Qwen3.5小型AI模型系列,9B版本性能超越更大规模对手
2026-03-03 10:59
收藏

阿里巴巴的Qwen AI研究团队近日公布了其最新开发的Qwen3.5小型模型系列,包括0.8B、2B、4B和9B四种参数规模的版本。这些模型采用了混合架构设计,结合门控Delta网络和稀疏专家混合技术,旨在提升效率并支持原生多模态处理。

在多项基准测试中,Qwen3.5-9B模型表现出色。在GPQA Diamond基准测试中,该模型获得81.7分,超越了参数规模更大的gpt-oss-120b模型。在MMMU-Pro视觉推理测试中,它取得70.1分,领先于Gemini 2.5 Flash-Lite。此外,在Video-MME视频理解评估中,9B版本得分84.5,4B版本得分83.5。

开发者社区对Qwen3.5小型模型系列的反响积极。Blueshell AI的Paul Couvert表示:“Qwen发布了4个新模型,4B版本几乎与之前的80B A3B一样强大。而9B模型与GPT OSS 120b一样好,但体积小了13倍!”他强调这些模型可以在标准笔记本电脑上运行,0.8B和2B版本适合移动设备。Kargul Studio的Karan Kendre补充道:“这些模型可以免费在我的M1 MacBook Air上本地运行。”

该系列模型已通过Apache 2.0许可证在Hugging Face和ModelScope平台发布,允许商业使用、修改和分发。小型AI模型在当前技术发展中具有重要意义,它们支持边缘计算,可应用于视觉工作流自动化、文档解析和实时分析等场景。企业部署时需考虑内存需求、调试难度等操作因素,并优先选择可验证的任务以确保输出准确性。

本简讯来自全球互联网及战略合作伙伴信息的编译与转载,仅为读者提供交流,有侵权或其它问题请及时告之,本站将予以修改或删除,未经正式授权严禁转载本文。邮箱:news@wedoany.com