美国AethexAI筹集300万美元 瞄准非洲中东语音AI
维度网讯,AethexAI是一家专注于为非洲和中东市场构建语音AI产品的初创公司,去年成立并已获得300万美元种子前轮融资。本轮融资由4DX Ventures领投,Enza Capital、Dorm ...
中国京东开源JoyAI-Echo长音视频生成框架
维度网讯,6月3日,京东推出JoyAI-Echo长音视频生成框架,代码与权重已全部开源。该框架面向长音视频生成场景,引入智能“导演助理”Director Agent,并配置跨模态音视频记忆库,用于在多...
美国Deepgram联合Fortanix和英伟达,本地语音AI转向机密计算部署
维度网讯,近日,美国实时语音AI基础设施企业Deepgram与数据安全企业Fortanix达成合作,将借助Fortanix Confidential AI和英伟达机密计算能力,为受监管行业提供可在本地...
美国微软MAI-Transcribe-1.5接入Foundry,43种语言转录模型补齐语音AI工作流
维度网讯,6月2日,美国微软在Build 2026期间推出MAI模型家族新成员,其中MAI-Transcribe-1.5面向语音转文本场景,支持43种语言,强调在真实噪声、口音、语速变化和行业专有词场...
中国Soul App开源SoulX-Transcriber,多人对话转录模型打通说话人、时间戳与文本识别
维度网讯,6月3日,Soul App AI团队(Soul AI Lab)联合西北工业大学音频语音与语言处理研究组ASLP@NPU团队及Moonstep AI,正式开源端到端多人对话转录模型SoulX-...
中国腾讯云与美国Soniox合作,共推多语种语音AI
维度网讯,腾讯云(Tencent Cloud)与总部位于旧金山的语音AI公司Soniox达成战略合作,双方将Soniox的语音转文本技术与腾讯云实时通信基础设施整合,帮助企业在全球200多个国家和地区...
日本NTT推出多模态可解释AI推理框架,视觉语言模型进入可信输出校准阶段
维度网讯,日本NTT近日宣布建立“Rationale-Enhanced Decoding”多模态可解释AI推理框架,面向大型视觉语言模型在图像与文本联合推理中的可信输出问题,提升模型最终答案与推理依据...
中国腾讯云联合美国Soniox,实时语音转写接入全球通信基础设施
维度网讯,中国腾讯云近日与美国旧金山语音AI企业Soniox达成战略合作,将Soniox语音转写技术接入腾讯云实时音视频TRTC全球基础设施,面向智能客服、语音助手、实时翻译和会议转写等企业场景,提供...
中国MiniMax推出M3模型,百万上下文将AI竞争推向长任务智能体
维度网讯,6月1日,中国人工智能公司MiniMax推出新一代通用模型MiniMax M3。该模型基于自研MiniMax Sparse Attention架构,API最高支持1M tokens上下文窗口...
中国阿里语音大模型登上Speech Arena全球第五,三项语音能力居中国首位
维度网讯,5月28日,全球AI评测平台Artificial Analysis语音排行榜显示,阿里巴巴语音大模型Fun-Realtime-TTS-Preview以1190分Elo评分位列Text to ...