阿里巴巴发布Qwen3.5小型AI模型系列，9B版本性能超越更大规模对手

2026-03-03 10:59

关键词:

阿里巴巴的Qwen AI研究团队近日公布了其最新开发的Qwen3.5小型模型系列，包括0.8B、2B、4B和9B四种参数规模的版本。这些模型采用了混合架构设计，结合门控Delta网络和稀疏专家混合技术，旨在提升效率并支持原生多模态处理。

在多项基准测试中，Qwen3.5-9B模型表现出色。在GPQA Diamond基准测试中，该模型获得81.7分，超越了参数规模更大的gpt-oss-120b模型。在MMMU-Pro视觉推理测试中，它取得70.1分，领先于Gemini 2.5 Flash-Lite。此外，在Video-MME视频理解评估中，9B版本得分84.5，4B版本得分83.5。

开发者社区对Qwen3.5小型模型系列的反响积极。Blueshell AI的Paul Couvert表示：“Qwen发布了4个新模型，4B版本几乎与之前的80B A3B一样强大。而9B模型与GPT OSS 120b一样好，但体积小了13倍！”他强调这些模型可以在标准笔记本电脑上运行，0.8B和2B版本适合移动设备。Kargul Studio的Karan Kendre补充道：“这些模型可以免费在我的M1 MacBook Air上本地运行。”

该系列模型已通过Apache 2.0许可证在Hugging Face和ModelScope平台发布，允许商业使用、修改和分发。小型AI模型在当前技术发展中具有重要意义，它们支持边缘计算，可应用于视觉工作流自动化、文档解析和实时分析等场景。企业部署时需考虑内存需求、调试难度等操作因素，并优先选择可验证的任务以确保输出准确性。

中国