中国华为920亿参数openPangu-2.0-Flash模型开源上线

2026-06-30 15:55

关键词:

维度网讯，6月30日，华为开源盘古920亿参数的openPangu-2.0-Flash模型正式开源上线，模型权重、基础推理代码和训推算子同步上线开源平台。openPangu是华为开源AI模型品牌，主要围绕昇腾原生训练与推理技术建设，面向开发者、企业和研究机构提供大模型开发与部署参考。华为此前在HDC 2026期间发布openPangu 2.0，明确该系列包含Pro和Flash两个版本，并计划从6月30日起陆续开放相关组件。

openPangu-2.0-Flash采用920亿总参数规模，激活参数量为60亿，支持512K上下文。Flash版本强调推理效率和部署适配，适合Agent任务、长文本处理、企业知识库问答和鸿蒙生态内的智能应用调用。

按照华为公布的节奏，openPangu-2.0-Flash模型权重、基础推理代码和训推算子已于6月30日上线开源平台;openPangu-2.0-Pro模型权重、基础推理代码将于7月上线;更多开源组件将在下半年陆续开放。IT之家报道，openPangu 2.0计划陆续开源7大组件，包括模型权重、推理代码、技术报告、模型结构，以及新增的预训练代码、后训练代码和训练算子。组件开源范围扩大后，开发者不只可以调用模型，还能观察模型训练、推理和算子适配的工程链路。

openPangu 2.0分为Pro和Flash两个版本。公开信息显示，openPangu-2.0-Pro总参数量为505B，激活参数量为18B;openPangu-2.0-Flash总参数量为92B，激活参数量为6B。两个版本都支持512K上下文，面向长文档、多轮任务、企业知识库、代码资料和Agent流程提供更长输入窗口。Flash版本参数规模更轻，主要服务低时延、高吞吐和更灵活的部署需求;Pro版本参数规模更大，将在7月开放模型权重和基础推理代码。

这次开源的重点在昇腾原生链路。大模型落地到国产AI硬件时，常见难点包括算子适配、推理吞吐、显存占用、长上下文效率和工程部署稳定性。华为将模型权重、推理代码和训推算子一起开放，可以让开发者直接围绕昇腾环境复现推理流程，也能降低企业在国产算力上部署开源模型的调试成本。对需要私有化部署的政企、金融、制造、交通、能源等行业客户来说，模型能否在本地算力平台稳定运行，往往比单纯榜单分数更影响应用落地速度。

Agent应用是openPangu 2.0的重要使用方向。512K上下文可以承载更长的任务记录、工具调用链、业务规则和企业文档，适合处理合同审查、工单流转、研发辅助、客服知识库、代码理解和流程自动化等任务。Flash版本上线后，开发者可以先围绕轻量推理、工具调用和行业知识库搭建应用，再根据任务复杂度选择后续开放的Pro版本。华为小艺Claw此前已接入openPangu 2.0 Pro模型，用于提升鸿蒙系统级任务执行能力，这也显示openPangu后续将与鸿蒙、昇腾和企业AI应用形成更紧密的技术连接。

openPangu-2.0-Flash正式开源上线后，华为在AI模型、国产算力和操作系统生态之间形成新的连接点。模型权重开放解决“能不能用”的问题，基础推理代码和训推算子解决“如何在昇腾上跑好”的问题，后续预训练代码、后训练代码等组件开放后，企业和开发者还可围绕行业数据进行适配训练。后续观察重点包括开源许可证条款、GitCode平台组件完整度、昇腾硬件部署门槛、长上下文实际成本，以及Pro版本7月上线后的模型表现。

中国