阿里巴巴发布Qwen3.5小型AI模型系列,9B版本性能超越更大规模对手
阿里巴巴的Qwen AI研究团队近日公布了其最新开发的Qwen3.5小型模型系列,包括0.8B、2B、4B和9B四种参数规模的版本。这些模型采用了混合架构设计,结合门控Delta网络和稀疏专家混合技术,旨在提升效率并支持原生多模态处理。

在多项基准测试中,Qwen3.5-9B模型表现出色。在GPQA Diamond基准测试中,该模型获得81.7分,超越了参数规模更大的gpt-oss-120b模型。在MMMU-Pro视觉推理测试中,它取得70.1分,领先于Gemini 2.5 Flash-Lite。此外,在Video-MME视频理解评估中,9B版本得分84.5,4B版本得分83.5。
开发者社区对Qwen3.5小型模型系列的反响积极。Blueshell AI的Paul Couvert表示:“Qwen发布了4个新模型,4B版本几乎与之前的80B A3B一样强大。而9B模型与GPT OSS 120b一样好,但体积小了13倍!”他强调这些模型可以在标准笔记本电脑上运行,0.8B和2B版本适合移动设备。Kargul Studio的Karan Kendre补充道:“这些模型可以免费在我的M1 MacBook Air上本地运行。”
该系列模型已通过Apache 2.0许可证在Hugging Face和ModelScope平台发布,允许商业使用、修改和分发。小型AI模型在当前技术发展中具有重要意义,它们支持边缘计算,可应用于视觉工作流自动化、文档解析和实时分析等场景。企业部署时需考虑内存需求、调试难度等操作因素,并优先选择可验证的任务以确保输出准确性。
相关推荐

以色列DriveNets完成4.1亿美元D轮融资,开放以太网网络切入AI数据中心
2026-06-02

卢森堡SES为墨西哥Viva开通多轨道机上卫星互联网,100架空客客机将接入宽带服务
2026-06-02

荷兰、比利时电信资产整合为Ziggo Group,2027年阿姆斯特丹上市
2026-06-02

英国EE将在25场大型活动启用5G+,移动通信网络扩至30多个城镇
2026-06-02

英国伦敦40 Leadenhall部署加拿大Genetec安防平台,超90万平方英尺综合体统一楼宇运营
2026-06-02

美国摩托罗拉在巴西推出moto g47企业手机
2026-06-02

巴西Jucesc借助AI将流程分析时间缩短31%
2026-06-02

德国西门子推出Simcenter PhysicsAI,工程仿真进入AI快速筛选设计变体阶段
2026-06-02

法国Magellan收购Worldline MeTS进军德国,2026年德国营收预计约5000万欧元
2026-06-02

德国Aiconiq.io推出CEO Co-Brain,AI代理从数字分身转向企业决策知识库
2026-06-02
最新简讯