字节跳动Seeduplex全双工语音模型上线豆包App
维度网讯,字节跳动于4月9日推出原生全双工语音大模型Seeduplex,该模型已在豆包App全量上线。Seeduplex基于“边听边说”框架设计,用户在语音交互过程中无需等待对方语音结束即可随时插话打...
谷歌Meet语音翻译功能正式登陆安卓与iOS移动端
维度网讯,谷歌于当地时间4月8日向Meet安卓与iOS应用推出语音翻译功能。据谷歌官方公告,该功能支持英语与西班牙语法语德语葡萄牙语意大利语之间的双向翻译,翻译过程近乎实时。 该功能此前已在Meet网...
谷歌限制Antigravity平台使用 封禁OpenClaw用户引争议
近日,谷歌针对其新推出的Antigravity“氛围编码”平台采取限制措施,称部分开发者存在“恶意使用”行为,此举在开发者社区中引发广泛讨论。一些使用开源自主AI代理OpenClaw并结合Antigr...
英伟达与Groq推动实时AI发展:技术阶梯中的关键布局
从远处观察,大金字塔表面光滑,但走近后可见其由巨大石灰岩块堆叠而成,呈现阶梯状而非平缓斜坡。这一比喻可类比技术发展中的指数增长,往往表现为阶段性突破而非连续平滑曲线。 英特尔联合创始人戈登·摩尔在19...
英伟达DMS技术降低大语言模型推理内存成本8倍
英伟达的研究团队推出了一项名为动态内存稀疏化(DMS)的新技术,可将大语言模型推理过程中的内存成本降低高达八倍,同时保持模型的推理准确性。这项技术通过压缩键值(KV)缓存来实现,该缓存在处理提示和推理...
谷歌发布ATLAS研究破解多语言AI训练密码
谷歌研究团队近日发布了名为ATLAS的多语言AI训练研究成果,这是目前公开规模最大的相关研究。该研究通过774次实验,覆盖400多种语言,为AI开发者提供了数据驱动的指导方案。 ATLAS研究创建...
谷歌非洲研究院推出WAXAL语音数据集,覆盖21种非洲语言
随着智能设备普及,语音交互已成为日常习惯,但全球仍有数亿人因技术无法识别当地语言而难以享受便利。在撒哈拉以南非洲,超过2000种语言的使用使得开发包容性语音技术面临核心难题——高质量语音数据的匮乏。 ...
DeepSeek扩大招聘,专注于多语言、多模态人工智能搜索
中国人工智能初创公司DeepSeek正积极扩充团队,大力招聘相关领域专家。其核心目标在于开发一款能支持多种语言以及多模态输入(涵盖文本、图像和音频)的人工智能搜索引擎。 DeepSeek此次招聘范围...
IBM与e&达沃斯宣布合作,人工智能助力电信业合规管理
在世界经济论坛达沃斯年会上,IBM与阿联酋科技集团e&(原Etisalat)宣布达成战略合作,共同推出中东地区首批企业级智能体人工智能(Agentic AI)部署方案,旨在通过AI技术提升治理...
Databricks指令式检索器:较RAG效率提升70%,解锁企业元数据价值
在人工智能时代,数据检索作为核心环节,一直是提升智能体性能的关键。传统检索器虽被广泛应用于RAG流程,但在处理复杂、指令密集型的企业级问答任务时,仍显力不从心。近日,Databricks推出的Inst...
