F5与英伟达携手推动Kubernetes人工智能工作负载升级
2025-11-01 16:02
收藏

F5公司宣布,其BIG-IP Next for Kubernetes网络和安全解决方案现已采用全新的英伟达BlueField-4数据处理单元(DPU),此举旨在显著增强下一代人工智能工作负载的可扩展性、安全性和性能。这一集成方案专为支持千兆级人工智能工厂而设计,结合了双方的技术优势,提供强大人工智能计算能力、智能控制及高级安全特性,网络速度高达800 Gb/s。

英伟达BlueField-4 DPU代表了人工智能基础设施的前沿技术,它能够助力企业高效管理富含令牌的应用,加速决策流程,并确保数据传输的安全与大规模。基于BlueField-4的F5 BIG-IP Next for Kubernetes,不仅为大规模人工智能工作负载提供了高性能的流量管理和安全保障,还优化了首次令牌生成时间,实现了跨模型的智能路由,并为高要求的智能体和自主人工智能系统构建了零信任架构。

集成后的系统带来了多项变革性功能,包括提升令牌生成能力30%,优化大型语言模型(LLM)推理以降低延迟和提高图形处理器(GPU)利用率,以及通过英伟达NIM微服务实现跨模型的高效工作负载分配。此外,该系统还提供了细粒度的代币治理、可扩展且安全的模型上下文协议、面向虚拟机和裸机环境的零信任安全,以及可定制的应用支持。

本简讯来自全球互联网及战略合作伙伴信息的编译与转载,仅为读者提供交流,有侵权或其它问题请及时告之,本站将予以修改或删除,未经正式授权严禁转载本文。邮箱:news@wedoany.com