近期美国发生了一次大规模网络中断事件,最初怀疑是云服务故障,但最终确认根源在于电信运营商Verizon的网络问题。这起事件凸显了当前电信行业在技术转型过程中面临的可靠性挑战。

电信行业正加速从传统硬件架构转向软件优先模式,人工智能、云原生网络功能、Kubernetes、开放式无线接入网和5G-Advanced网络切片等技术成为主导。这些技术虽然能够降低运营成本并提升效率,但也带来了前所未有的系统复杂性。
Verizon此次中断持续约10小时,具体原因尚未完全公开,仅确认为软件相关问题。行业分析指出,问题可能涉及5G独立核心网的代码库。该核心网由多家供应商共同提供,包括Casa Systems、爱立信、诺基亚、甲骨文和红帽等,这种多供应商环境增加了故障排查难度。
电信运营商通常追求五个九(99.999%)的可靠性标准,即每年停机时间不超过5.26分钟。但此次长时间中断使实际可用性大幅下降。随着网络向工业4.0等关键领域延伸,任何可靠性下降都可能带来更广泛的经济影响。
与此同时,云服务商开始将大语言模型等人工智能技术整合到网络管理中,作为概率推理和编排层。这种混合模式在提升效率的同时,也引入了新的不确定性因素。
面对这些挑战,行业内部出现了新的思考。有观点认为,随着电信网络复杂性的增加,传统五个九标准可能难以维持。而通常以三个九可靠性运行的云服务商,若能借鉴电信行业的运营经验,或许能使整体网络可用性达到四个九的水平。
谷歌光纤网络负责人约翰·凯布在近期采访中表示:“老实说,我不知道我们是否真能达到五级自治。”这种对完全自动化持谨慎态度的观点,反映出在关键基础设施领域,人工监督仍然具有重要价值。
电信网络的可靠性标准正在经历重新评估。在技术快速演进和系统日益复杂的背景下,四个九的可用性可能成为更现实的目标,但这需要电信运营商与云服务商在运营标准上找到新的平衡点。









