分类: 语言处理
行业焦点:
更多

xAI正式推出Grok语音转文本与文本转语音API,STT批量处理每小时0.10美元

维度网讯,xAI于当地时间4月17日宣布正式推出Grok平台的语音转文本(STT)和文本转语音(TTS)API。据xAI官方公告,此次更新旨在通过AI模型提供高保真、低延迟的语音交互能力,支持开发者在...

2026-04-18

CoreWeave与Anthropic签署多年协议,Claude模型算力部署将于年内启动

维度网讯,CoreWeave于2026年4月10日宣布与Anthropic达成一项多年期协议,将为Anthropic旗下Claude系列人工智能模型的开发与部署提供云基础设施支持。该协议约定算力资源于...

2026-04-11

字节跳动Seeduplex全双工语音模型上线豆包App

维度网讯,字节跳动于4月9日推出原生全双工语音大模型Seeduplex,该模型已在豆包App全量上线。Seeduplex基于“边听边说”框架设计,用户在语音交互过程中无需等待对方语音结束即可随时插话打...

2026-04-09

谷歌Meet语音翻译功能正式登陆安卓与iOS移动端

维度网讯,谷歌于当地时间4月8日向Meet安卓与iOS应用推出语音翻译功能。据谷歌官方公告,该功能支持英语与西班牙语法语德语葡萄牙语意大利语之间的双向翻译,翻译过程近乎实时。 该功能此前已在Meet网...

2026-04-09

谷歌限制Antigravity平台使用 封禁OpenClaw用户引争议

近日,谷歌针对其新推出的Antigravity“氛围编码”平台采取限制措施,称部分开发者存在“恶意使用”行为,此举在开发者社区中引发广泛讨论。一些使用开源自主AI代理OpenClaw并结合Antigr...

2026-02-24

英伟达与Groq推动实时AI发展:技术阶梯中的关键布局

从远处观察,大金字塔表面光滑,但走近后可见其由巨大石灰岩块堆叠而成,呈现阶梯状而非平缓斜坡。这一比喻可类比技术发展中的指数增长,往往表现为阶段性突破而非连续平滑曲线。 英特尔联合创始人戈登·摩尔在19...

2026-02-16

英伟达DMS技术降低大语言模型推理内存成本8倍

英伟达的研究团队推出了一项名为动态内存稀疏化(DMS)的新技术,可将大语言模型推理过程中的内存成本降低高达八倍,同时保持模型的推理准确性。这项技术通过压缩键值(KV)缓存来实现,该缓存在处理提示和推理...

2026-02-13

谷歌发布ATLAS研究破解多语言AI训练密码

谷歌研究团队近日发布了名为ATLAS的多语言AI训练研究成果,这是目前公开规模最大的相关研究。该研究通过774次实验,覆盖400多种语言,为AI开发者提供了数据驱动的指导方案。 ATLAS研究创建...

2026-02-03

谷歌非洲研究院推出WAXAL语音数据集,覆盖21种非洲语言

随着智能设备普及,语音交互已成为日常习惯,但全球仍有数亿人因技术无法识别当地语言而难以享受便利。在撒哈拉以南非洲,超过2000种语言的使用使得开发包容性语音技术面临核心难题——高质量语音数据的匮乏。 ...

2026-02-03

DeepSeek扩大招聘,专注于多语言、多模态人工智能搜索

中国人工智能初创公司DeepSeek正积极扩充团队,大力招聘相关领域专家。其核心目标在于开发一款能支持多种语言以及多模态输入(涵盖文本、图像和音频)的人工智能搜索引擎。 DeepSeek此次招聘范围...

2026-01-29
上一页 下一页 跳转至
确认