语言处理新闻_每日热点

分类: 语言处理

中国电研牵头3项IEEE智能语音国际标准发布

维度网讯，在万物智联时代，语音交互正成为智能家电的“基础能力”之一。近日，国机集团下属企业中国电研（CEST）牵头推动的3项IEEE智能语音国际标准正式发布，标准涵盖研发、测试和安全防护等核心环节，构...

2026-06-13

韩国威伯斯布雷恩与韩国外国语大学合作开发多语AI导师

维度网讯，AI教育企业威伯斯布雷恩（위버스브레인，代表赵世元、李容国）与韩国外国语大学知识出版内容院（院长朴正植）合作开发“多语AI导师”，该系统将用于大学外语课程。系统整合韩国外国语大学的语言数据与...

2026-06-13

尼日利亚Bluechip收购尼日利亚AI初创公司YarnGPT

维度网讯，非洲科技公司Bluechip Technologies收购了尼日利亚人工智能初创公司YarnGPT，该交易被视为当地创新的一个重要标志，并凸显了非洲AI生态系统日益增长的潜力。此次收购由B...

2026-06-13

中国nnAIO在法国推出AI录音笔

维度网讯，InnAIO 推出 TransNote AI 录音笔和 Vinabot 智能相框两款产品。TransNote 定位为多语言工作伴侣，支持录音、实时翻译、辅助写作、分享电子名片及声音克隆，售价...

2026-06-12

法国OVH集团拟收购语音AI公司Gladia

维度网讯，OVH集团（OVH Groupe）宣布进入独家谈判，拟收购语音转文本技术公司Gladia，旨在增强其在多模态和智能体生成式AI领域的专业能力。Gladia成立于2022年，总部位于巴黎，专注...

2026-06-12

美国谷歌推出Gemini 3.5实时语音翻译模型

维度网讯，6月9日，美国谷歌宣布推出Gemini 3.5 Live Translate实时语音翻译模型。该模型面向实时语音到语音翻译场景，可自动检测70多种语言，生成更自然流畅的翻译语音，并尽量保留说...

2026-06-10

美国微软推出Windows端侧语音识别API和Aion小语言模型

维度网讯，6月2日至3日，美国微软在Build 2026期间发布Windows AI APIs更新，新增端侧语音识别API，并推出Aion 1.0 Instruct和Aion 1.0 Plan两类面向...

2026-06-04

美国谷歌为安卓推出虚假来电检测功能可识别AI语音克隆诈骗

维度网讯，谷歌公司为安卓系统推出虚假来电检测功能，以应对冒充诈骗。当通话双方均在Android 12或更高版本上使用谷歌电话（Phone by Google）应用时，该功能可检测并标记疑似伪造的来电。...

2026-06-04

美国AethexAI筹集300万美元瞄准非洲中东语音AI

维度网讯，AethexAI是一家专注于为非洲和中东市场构建语音AI产品的初创公司，去年成立并已获得300万美元种子前轮融资。本轮融资由4DX Ventures领投，Enza Capital、Dorm ...

2026-06-04

中国京东开源JoyAI-Echo长音视频生成框架

维度网讯，6月3日，京东推出JoyAI-Echo长音视频生成框架，代码与权重已全部开源。该框架面向长音视频生成场景，引入智能“导演助理”Director Agent，并配置跨模态音视频记忆库，用于在多...

2026-06-04

美国Deepgram联合Fortanix和英伟达，本地语音AI转向机密计算部署

维度网讯，近日，美国实时语音AI基础设施企业Deepgram与数据安全企业Fortanix达成合作，将借助Fortanix Confidential AI和英伟达机密计算能力，为受监管行业提供可在本地...

2026-06-03

美国微软MAI-Transcribe-1.5接入Foundry，43种语言转录模型补齐语音AI工作流

维度网讯，6月2日，美国微软在Build 2026期间推出MAI模型家族新成员，其中MAI-Transcribe-1.5面向语音转文本场景，支持43种语言，强调在真实噪声、口音、语速变化和行业专有词场...

2026-06-03

中国Soul App开源SoulX-Transcriber，多人对话转录模型打通说话人、时间戳与文本识别

维度网讯，6月3日，Soul App AI团队(Soul AI Lab)联合西北工业大学音频语音与语言处理研究组ASLP@NPU团队及Moonstep AI，正式开源端到端多人对话转录模型SoulX-...

2026-06-03

中国腾讯云与美国Soniox合作，共推多语种语音AI

维度网讯，腾讯云（Tencent Cloud）与总部位于旧金山的语音AI公司Soniox达成战略合作，双方将Soniox的语音转文本技术与腾讯云实时通信基础设施整合，帮助企业在全球200多个国家和地区...

2026-06-03

日本NTT推出多模态可解释AI推理框架，视觉语言模型进入可信输出校准阶段

维度网讯，日本NTT近日宣布建立“Rationale-Enhanced Decoding”多模态可解释AI推理框架，面向大型视觉语言模型在图像与文本联合推理中的可信输出问题，提升模型最终答案与推理依据...

2026-06-02

中国腾讯云联合美国Soniox，实时语音转写接入全球通信基础设施

维度网讯，中国腾讯云近日与美国旧金山语音AI企业Soniox达成战略合作，将Soniox语音转写技术接入腾讯云实时音视频TRTC全球基础设施，面向智能客服、语音助手、实时翻译和会议转写等企业场景，提供...

2026-06-02

中国MiniMax推出M3模型，百万上下文将AI竞争推向长任务智能体

维度网讯，6月1日，中国人工智能公司MiniMax推出新一代通用模型MiniMax M3。该模型基于自研MiniMax Sparse Attention架构，API最高支持1M tokens上下文窗口...

2026-06-02

中国阿里语音大模型登上Speech Arena全球第五，三项语音能力居中国首位

维度网讯，5月28日，全球AI评测平台Artificial Analysis语音排行榜显示，阿里巴巴语音大模型Fun-Realtime-TTS-Preview以1190分Elo评分位列Text to ...

2026-05-28

美国Meta推出AI聊天机器人订阅服务，最低月费7.99美元

维度网讯，近日，Meta开始面向消费者推出Meta AI聊天机器人订阅服务。新服务分为Meta One Plus和Meta One Premium两档，其中Meta One Plus月费7.99美元，...

2026-05-28

美国T-Mobile推出网络集成AI实时翻译服务，迈向智能连接

维度网讯，T-Mobile US为其无线网络基础设施推出了一项重要升级，发布了名为“实时翻译”的测试版服务，该服务将人工智能直接嵌入网络核心层，而并非作为独立功能存在。此举标志着电信行业战略的广泛...

2026-05-26

中国DeepSeek-V4-Pro API调至原定价1/4，长期低价策略压低大模型调用成本

维度网讯，5月22日，DeepSeek官方价格页面显示，DeepSeek-V4-Pro模型API价格将于北京时间2026年5月31日23时59分结束2.5折优惠活动后，正式调整为原定价的1/4。这意味...

2026-05-23

德国DFKI携RPTU研究力量推出Privacy Guardrail 0.2.0，用本地匿名化守住AI聊天敏感数据

维度网讯，德国人工智能研究中心(DFKI)将AI聊天中的敏感数据保护前移到浏览器本地。5月21日，DFKI发布Privacy Guardrail，这是一款面向Google Chrome桌面端的开源扩展...

2026-05-22

美国Anthropic迎OpenAI创始成员安德烈·卡帕西加盟，重返大模型研发前线

维度网讯，当地时间5月19日，OpenAI创始成员安德烈·卡帕西(Andrej Karpathy)发布个人状态更新，宣布正式加入美国人工智能公司Anthropic。这位拥有斯洛伐克裔加拿大双重国籍的A...

2026-05-20

美国xAI全平台推出Skills功能，Grok获得永久跨对话记忆能力向自动化工作空间演进

维度网讯，马斯克旗下AI公司xAI于当地时间5月18日宣布在网页端、iOS和Android平台同步上线“Skills”功能，赋予AI助手Grok跨对话的持久记忆能力。这一更新标志着Grok从传统的单次...

2026-05-19

美国Coupa收购英国Rossum强化AI文档处理，T-LLM取代传统OCR覆盖端到端支出管理

维度网讯，自主支出管理平台Coupa在拉斯维加斯举行的Inspire 2026大会上正式宣布，已收购AI智能文档处理市场领导者Rossum。双方自2024年起建立合作关系，此前Rossum的文档处理工...

2026-05-16

中国腾讯元宝再升级，新增微信聊天记录智能总结与分析

维度网讯，腾讯旗下AI助手元宝于5月13日宣布完成功能升级，正式支持对微信聊天记录进行智能总结与分析。用户将微信和元宝App升级至最新版本后，在微信中选中任意私聊或群聊记录，通过“转发到其他应用”选择...

2026-05-15

美国OpenAI推出GPT-Realtime系列三款音频模型，首次将GPT-5级推理融入语音交互

维度网讯，美国OpenAI正式推出GPT-Realtime系列三款实时音频模型，分别命名为GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whis...

2026-05-13

美国Twilio旧金山SIGNAL大会发布四项对话层新能力，构建客户互动持久记忆与跨渠道编排

维度网讯，2026年5月6日，美国云通信平台Twilio在旧金山举行的SIGNAL 2026年度用户大会上正式发布四项全新平台能力，包括Conversation Memory(对话记忆)、Conver...

2026-05-09

中国阿里千问PC端上线AI语音输入，跨应用智能助手功能全面开放

维度网讯，阿里巴巴旗下大模型产品“阿里千问”于2026年5月7日在PC端正式上线AI语音输入功能，目前已向所有用户免费开放。该功能深度整合了自然语言处理与大模型能力，通过快捷键即可在各类桌面应用中直接...

2026-05-07

挪威奥斯陆大学与挪威国防研究所研究：结构化工作流可将大语言模型安全检测准确率从0%提升至93%

维度网讯，2026年5月4日，挪威奥斯陆大学与挪威国防研究所的研究团队发布一项研究，系统验证了结构化工作流对大语言模型安全检测准确率的决定性影响。在预设的攻击检测任务中，四款主流大语言模型在未配备工作...

2026-05-05

确认

中国电研牵头3项IEEE智能语音国际标准发布

韩国威伯斯布雷恩与韩国外国语大学合作开发多语AI导师

尼日利亚Bluechip收购尼日利亚AI初创公司YarnGPT

中国nnAIO在法国推出AI录音笔

法国OVH集团拟收购语音AI公司Gladia

美国谷歌推出Gemini 3.5实时语音翻译模型

美国微软推出Windows端侧语音识别API和Aion小语言模型

美国谷歌为安卓推出虚假来电检测功能 可识别AI语音克隆诈骗

美国AethexAI筹集300万美元 瞄准非洲中东语音AI

中国京东开源JoyAI-Echo长音视频生成框架

美国Deepgram联合Fortanix和英伟达，本地语音AI转向机密计算部署

美国微软MAI-Transcribe-1.5接入Foundry，43种语言转录模型补齐语音AI工作流

中国Soul App开源SoulX-Transcriber，多人对话转录模型打通说话人、时间戳与文本识别

中国腾讯云与美国Soniox合作，共推多语种语音AI

日本NTT推出多模态可解释AI推理框架，视觉语言模型进入可信输出校准阶段

中国腾讯云联合美国Soniox，实时语音转写接入全球通信基础设施

中国MiniMax推出M3模型，百万上下文将AI竞争推向长任务智能体

中国阿里语音大模型登上Speech Arena全球第五，三项语音能力居中国首位

美国Meta推出AI聊天机器人订阅服务，最低月费7.99美元

美国T-Mobile推出网络集成AI实时翻译服务，迈向智能连接

中国DeepSeek-V4-Pro API调至原定价1/4，长期低价策略压低大模型调用成本

德国DFKI携RPTU研究力量推出Privacy Guardrail 0.2.0，用本地匿名化守住AI聊天敏感数据

美国Anthropic迎OpenAI创始成员安德烈·卡帕西加盟，重返大模型研发前线

美国xAI全平台推出Skills功能，Grok获得永久跨对话记忆能力向自动化工作空间演进

美国Coupa收购英国Rossum强化AI文档处理，T-LLM取代传统OCR覆盖端到端支出管理

中国腾讯元宝再升级，新增微信聊天记录智能总结与分析

美国OpenAI推出GPT-Realtime系列三款音频模型，首次将GPT-5级推理融入语音交互

美国Twilio旧金山SIGNAL大会发布四项对话层新能力，构建客户互动持久记忆与跨渠道编排

中国阿里千问PC端上线AI语音输入，跨应用智能助手功能全面开放

挪威奥斯陆大学与挪威国防研究所研究：结构化工作流可将大语言模型安全检测准确率从0%提升至93%

美国谷歌为安卓推出虚假来电检测功能可识别AI语音克隆诈骗

美国AethexAI筹集300万美元瞄准非洲中东语音AI