维度网讯,中国腾讯云近日与美国旧金山语音AI企业Soniox达成战略合作,将Soniox语音转写技术接入腾讯云实时音视频TRTC全球基础设施,面向智能客服、语音助手、实时翻译和会议转写等企业场景,提供多语言、低时延的实时语音应用开发能力。
这项合作落在“语言处理+实时通信”交叉环节,核心目标是降低企业部署全球语音AI应用的门槛。Soniox主要提供高精度、低时延语音识别能力,支持60多种语言,并可处理同一句话中不同语言切换的场景;腾讯云TRTC则提供企业级实时通信网络,覆盖超过3200个全球节点,具备全球低于300毫秒时延、AI降噪和弱网抗性等能力。两者结合后,开发者可以直接在腾讯云控制台集成Soniox语音转写接口,用于构建跨市场语音AI应用。对于跨境电商、在线教育、远程会议、企业协作、游戏社交、金融客服和国际化SaaS企业而言,语音应用过去往往面临三类问题:一是不同国家网络质量差异大,实时语音传输容易出现延迟和丢包;二是多语言识别需要分别适配不同模型和接口,开发与运维成本高;三是客服、翻译、会议纪要等场景对准确率和响应速度要求较高,单独依靠语音识别模型或单独依靠通信链路都难以形成稳定体验。腾讯云与Soniox此次把实时通信网络和语音转写技术放在同一交付链路中,有助于企业把语音输入、传输、识别、文本输出和后续AI处理整合为更完整的实时语音基础设施,而不再分别拼接通信服务、语音识别服务和多语言处理模块。
此次合作支持企业面向英语市场以及阿拉伯语、印地语、马来语等多语言市场开发语音应用,应用方向包括智能客服、语音助手、实时翻译和会议转写。
企业语音AI正在从单点功能进入生产级部署阶段。过去,语音转写更多被用于会议记录、字幕生成或客服录音整理,处理方式以离线转写和单语言识别为主;随着生成式AI、实时客服机器人、跨境协作和智能硬件普及,语音正在成为企业应用的重要入口。真正影响落地效果的,不只是识别模型能否听懂一句话,还包括语音从用户端传到云端的链路质量、识别结果返回速度、弱网环境下的稳定性、不同语言混用场景下的连续识别能力,以及后续能否与大模型、知识库、工单系统和翻译系统顺畅连接。腾讯云TRTC在实时音视频传输层提供全球节点和低时延能力,Soniox在语音转写层提供多语言识别和同句切换处理能力,二者结合后,企业可以更快把语音入口嵌入客服中心、在线会议、跨境直播、远程培训和移动应用中。对信息通信产业而言,这类合作也说明实时通信平台正在从音视频通话工具,升级为语音AI、翻译、协作和自动化服务的底层通道。未来,谁能把通信链路、语音识别、多语言处理和AI应用编排成统一平台,谁就更容易服务企业全球化部署和多语言用户运营需求。
这项合作的后续变量集中在企业客户采用速度、多语言识别在真实噪声环境下的稳定性、与大模型应用的接口协同,以及不同国家和地区的数据合规要求。随着更多企业把客服、会议、培训和营销活动推向全球市场,实时语音转写将不再只是辅助功能,而会成为跨语言沟通、自动化服务和智能运营的重要基础能力。腾讯云与Soniox的合作,为中国云服务商和美国语音AI企业在全球企业通信市场提供了一个新的产品组合样本。
本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com









