维度网讯,美国半导体企业Marvell近日推出Teralynx T100交换芯片,面向AI和云数据中心基础设施提供102.4Tbps交换能力。
这款芯片的核心应用场景是大规模AI集群内部网络。随着GPU和XPU加速器数量快速增加,数据中心的瓶颈正在从单个算力芯片性能,转向集群内部的数据交换效率、网络时延、功耗控制和架构复杂度。Marvell称,Teralynx T100采用先进3纳米工艺,面向AI训练和推理负载重新设计,典型功耗低于1000W,较同类竞争方案最高可降低约25%功耗,并支持512端口横向扩展能力。对超大规模云服务商和AI基础设施运营商而言,交换芯片并不是外部可见度最高的部件,却直接决定数万块加速器能否形成稳定、高效、低延迟的计算集群。传统数据中心交换平台更多围绕企业网络、通用云计算和分层架构设计,当AI训练任务进入万卡、十万卡级别后,网络层级、光互连数量、拥塞控制、尾延迟和功耗都会放大成系统性成本。Teralynx T100试图通过更高带宽、更高端口密度和更扁平的网络结构,减少AI集群内部的交换层级和光链路数量,使数据中心在既有供电约束下部署更多加速器,并降低网络设备对机柜功率、散热和总体拥有成本的压力。
Marvell表示,Teralynx T100将于本季度开始向客户送样,并提供BGA、共封装铜连接和共封装光学等多种封装形态。
AI数据中心正在进入“算力、网络、电力、散热”共同约束的新阶段。过去几年,市场更多关注GPU供给、先进封装和HBM内存,网络基础设施在大规模训练集群中的作用正在迅速上升。一个AI集群如果网络效率不足,昂贵的加速器会出现等待通信、任务同步变慢、训练收敛时间延长等问题,最终把硬件采购成本转化为利用率损失。交换芯片因此从传统数据中心网络部件,变成AI基础设施能否规模化扩容的关键半导体。Teralynx T100支持横向扩展和纵向扩展两类部署,兼容新兴AI以太网架构和Ultra Ethernet Consortium相关要求,并集成遥测、AI原生拥塞控制和低时延流量管理能力。这意味着数据中心运营商未来在规划AI集群时,可以围绕更高端口密度、更少网络层级、更低功耗和更灵活的互连形态进行架构设计。随着GPU机柜功率逐步接近甚至超过传统机房设计边界,网络芯片功耗下降不再只是设备参数优化,而会影响整座数据中心的供电冗余、液冷比例、机柜密度和扩建节奏。对于云服务商、互联网企业和AI算力运营商而言,网络基础设施的效率提升将直接关系到训练成本、推理延迟和算力交付能力。
这次发布也显示,AI基础设施竞争正在从单一算力芯片延伸到交换芯片、光互连、SerDes、网络操作系统和集群调度等底层环节。后续变量集中在客户送样验证、规模量产节奏、与不同AI以太网生态的兼容性,以及共封装光学方案在大型数据中心中的实际部署成本。若相关技术进入主流云厂商集群,AI数据中心网络将成为先进半导体和云基础设施投资的新重点。
本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com









