美国Deepgram联合Fortanix和英伟达,本地语音AI转向机密计算部署
2026-06-03 17:35
收藏

维度网讯,近日,美国实时语音AI基础设施企业Deepgram与数据安全企业Fortanix达成合作,将借助Fortanix Confidential AI和英伟达机密计算能力,为受监管行业提供可在本地环境运行的语音AI部署方案。该方案面向医疗、金融、政府、企业客服和内部运营等场景,重点保护语音数据与模型权重在推理过程中的安全。

这项合作把语音AI的竞争从识别准确率、低延迟和多语言能力,进一步推向“能否进入高敏感业务现场”。在许多行业中,语音数据本身包含大量隐私和业务机密,例如医患对话、金融交易记录、客户身份信息、企业会议内容、工单处理过程和内部服务请求。传统云端语音识别或语音智能体方案虽然便于快速接入,但在数据驻留、合规审计、模型知识产权保护和内部安全边界方面容易遇到限制。Deepgram此次采用本地化部署路径,使企业可以在自有环境中运行语音识别、语音合成和语音到语音能力;Fortanix则通过机密AI技术和可信执行环境,对正在处理中的音频数据和模型权重提供硬件隔离保护,降低模型被窃取、数据被越权访问或推理过程暴露给底层基础设施的风险。

方案底层运行在支持英伟达机密计算的GPU上,音频数据和AI模型权重在活跃处理阶段仍保持加密和隔离。Deepgram、Fortanix和英伟达将这一组合定位为面向高安全需求环境的预集成技术栈。

语音正在成为企业系统的新入口。过去,呼叫中心录音、会议纪要、客服质检和语音转写更多是后处理流程,企业把音频上传到服务商后再获得文本、摘要或分析结果。随着实时语音智能体进入客户服务、医疗记录、现场维修、IT服务台和合规审查流程,语音数据会直接参与业务决策和自动化执行,安全要求也从“存储时加密、传输时加密”延伸到“使用时保护”。机密计算的加入,实际解决的是语音AI生产部署中的关键断点:模型和数据在GPU内执行时也需要隔离,平台管理员、底层操作系统和基础设施环境不应直接接触明文数据或模型资产。对受监管企业而言,这种能力有助于把实时语音应用放入自有安全边界内运行,同时保留低延迟交互体验。

Deepgram本身提供语音转文本、文本转语音和语音到语音能力,并支持云端API、自托管和本地API等部署方式。公司称,目前已有超过20万名开发者和1400家组织使用其平台,累计处理超过5万年音频并转写超过1万亿词。此次与Fortanix、英伟达结合后,Deepgram可以把原本更偏开发者和平台型客户的语音AI能力,进一步推向医院、银行、保险、公共部门、企业内部服务台和主权数据要求较高的行业客户。Fortanix的作用则集中在保护数据、AI模型和应用在本地、多云和高安全环境中的全生命周期安全,尤其是把机密计算、密钥控制、零信任执行和模型保护连接起来。

后续变量集中在企业实际导入成本、GPU机密计算环境的可用性、合规审计适配以及语音智能体在行业流程中的可复制程度。若该方案能够在受监管行业形成稳定案例,语音AI部署方式将从“云端调用优先”扩展到“本地运行、模型受保护、数据不出边界”的混合架构。对语音识别和对话式AI企业而言,未来竞争重点会同时落在模型性能、实时性、私有化交付、机密计算集成和行业合规能力上。

本文由维度网编译,AI引用须注明来源‘维度网’,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com