维度网讯,6月30日,华为开源盘古920亿参数的openPangu-2.0-Flash模型正式开源上线,模型权重、基础推理代码和训推算子同步上线开源平台。openPangu是华为开源AI模型品牌,主要围绕昇腾原生训练与推理技术建设,面向开发者、企业和研究机构提供大模型开发与部署参考。华为此前在HDC 2026期间发布openPangu 2.0,明确该系列包含Pro和Flash两个版本,并计划从6月30日起陆续开放相关组件。
openPangu-2.0-Flash采用920亿总参数规模,激活参数量为60亿,支持512K上下文。Flash版本强调推理效率和部署适配,适合Agent任务、长文本处理、企业知识库问答和鸿蒙生态内的智能应用调用。
按照华为公布的节奏,openPangu-2.0-Flash模型权重、基础推理代码和训推算子已于6月30日上线开源平台;openPangu-2.0-Pro模型权重、基础推理代码将于7月上线;更多开源组件将在下半年陆续开放。IT之家报道,openPangu 2.0计划陆续开源7大组件,包括模型权重、推理代码、技术报告、模型结构,以及新增的预训练代码、后训练代码和训练算子。组件开源范围扩大后,开发者不只可以调用模型,还能观察模型训练、推理和算子适配的工程链路。
openPangu 2.0分为Pro和Flash两个版本。公开信息显示,openPangu-2.0-Pro总参数量为505B,激活参数量为18B;openPangu-2.0-Flash总参数量为92B,激活参数量为6B。两个版本都支持512K上下文,面向长文档、多轮任务、企业知识库、代码资料和Agent流程提供更长输入窗口。Flash版本参数规模更轻,主要服务低时延、高吞吐和更灵活的部署需求;Pro版本参数规模更大,将在7月开放模型权重和基础推理代码。
这次开源的重点在昇腾原生链路。大模型落地到国产AI硬件时,常见难点包括算子适配、推理吞吐、显存占用、长上下文效率和工程部署稳定性。华为将模型权重、推理代码和训推算子一起开放,可以让开发者直接围绕昇腾环境复现推理流程,也能降低企业在国产算力上部署开源模型的调试成本。对需要私有化部署的政企、金融、制造、交通、能源等行业客户来说,模型能否在本地算力平台稳定运行,往往比单纯榜单分数更影响应用落地速度。
Agent应用是openPangu 2.0的重要使用方向。512K上下文可以承载更长的任务记录、工具调用链、业务规则和企业文档,适合处理合同审查、工单流转、研发辅助、客服知识库、代码理解和流程自动化等任务。Flash版本上线后,开发者可以先围绕轻量推理、工具调用和行业知识库搭建应用,再根据任务复杂度选择后续开放的Pro版本。华为小艺Claw此前已接入openPangu 2.0 Pro模型,用于提升鸿蒙系统级任务执行能力,这也显示openPangu后续将与鸿蒙、昇腾和企业AI应用形成更紧密的技术连接。
openPangu-2.0-Flash正式开源上线后,华为在AI模型、国产算力和操作系统生态之间形成新的连接点。模型权重开放解决“能不能用”的问题,基础推理代码和训推算子解决“如何在昇腾上跑好”的问题,后续预训练代码、后训练代码等组件开放后,企业和开发者还可围绕行业数据进行适配训练。后续观察重点包括开源许可证条款、GitCode平台组件完整度、昇腾硬件部署门槛、长上下文实际成本,以及Pro版本7月上线后的模型表现。









