美国Mirantis推出AI治理与推理工具,助力GPU云生产部署
2026-05-20 10:35
收藏

维度网讯,云原生基础设施平台提供商Mirantis于5月14日在加利福尼亚州坎贝尔正式宣布,为其k0rdent AI平台新增模型注册表、推理网格与推理运行时三项核心功能,首次将AI模型的安全分发、治理策略执行、推理负载路由与GPU资源高效利用整合为一套覆盖从开发到生产的统一运营平面。这一发布直接回应了当前GPU云运营商和企业AI平台团队在将AI工作负载从实验推向生产时所面临的碎片化困局。

Mirantis产品开发副总裁Kevin Kamel在官方公告中直指问题核心:“随着组织将AI项目从实验阶段转向生产环境,基础设施团队正日益面临模型分发、推理可见性、合规执行以及GPU经济性等方面的运营和治理挑战。企业和GPU运营商不得不拼凑出脆弱的工作流和割裂的工具来运营AI。”他进一步强调,AI模型与容器存在本质区别——模型具有独特的治理、主权、合规性和生命周期要求,不能简单套用云原生时代以容器为中心的运维范式。

k0rdent AI Model Registry专为大型语言模型及其衍生品的存储和分发工作流而优化。该组件提供安全、符合开放容器倡议(OCI)标准的原生注册中心,可管理基础大语言模型、微调变体、量化构建及相关AI制品,覆盖分布式基础设施环境,直接降低安全AI模型分发过程中的操作复杂性和供应链风险。模型版本控制、来源追溯和权限管理被内嵌至注册表中,使企业能够像管理容器镜像一样对AI模型实施一致的CI/CD流程。

k0rdent AI Inference Mesh则承担推理负载的跨集群路由与治理职责。该组件能够跨联合计算资源进行推理请求的智能路由、访问控制和用量计量,将原本由不同团队手工配置的反代、负载均衡和API网关逻辑抽象为统一的策略驱动层。组织借此可将原始的GPU基础设施转化为受治理的AI推理平台,同时获得对模型调用量、延迟分布和消耗成本的集中可见性。对于同时运营多个GPU集群或混合使用自有数据中心与公有云GPU实例的运营商而言,Inference Mesh提供了跨环境的统一控制点。

与Inference Mesh配合发布的k0rdent AI Inference Runtime聚焦于推理工作负载的执行效率。该运行时以最大化每秒每GPU生成的令牌数为设计目标,通过模型量化、批处理优化和动态资源调度,提升GPU基础设施的利用率。在GPU供应持续紧张、算力成本居高不下的市场环境下,推理效率的边际改善可直接转化为运营成本的显著下降,这一诉求在当前AI基础设施市场中尤为迫切。

Mirantis此次发布的三个组件并非独立产品,而是k0rdent AI平台的功能层扩展。k0rdent本身定位为面向AI时代的云原生基础设施管理平台,支持跨裸金属、虚拟机和容器环境的统一编排,底层可兼容NVIDIA GPU、AMD GPU等多种加速器。Mirantis正试图通过这一平台,将其在OpenStack和Kubernetes领域积累的企业级基础设施管理能力延伸到AI工作负载的全生命周期。

Mirantis总部位于美国加利福尼亚州坎贝尔,成立于1999年,前身为长期维护OpenStack的云基础设施公司,目前业务重心已转向为AI/ML工作负载提供云原生基础设施解决方案。公司于今年4月发布的MOSK 26.1版本已为OpenStack平台新增AI助手,利用技术文档和知识库为高性能计算和AI工作负载提供自动化的运营指导。从OpenStack到k0rdent AI,Mirantis的转型路径体现出清晰的战略意图:将传统云基础设施管理能力与AI原生工具链深度耦合,在AI基础设施市场的快速膨胀周期中确立自身定位。

AI治理与推理工具市场正进入加速整合期。企业不再满足于孤立地获取GPU算力,而是要求从模型存储、安全分发、合规治理到推理部署和成本管理的全链路平台化支持。NVIDIA的AI Enterprise套件、谷歌的Vertex AI和AWS的SageMaker均在不同层面推进类似整合。Mirantis选择以基础设施层为切入点,向上延伸至模型治理与推理管理,试图在云厂商和AI平台商之间找到一个差异化位置。随着更多企业将生成式AI嵌入核心业务流程,模型治理的合规性、推理链路的可观测性和GPU资源的经济性将成为决定平台竞争力的三项核心指标。

本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com