《哥伦比亚新闻评论》(CJR)的 Tow 数字新闻中心研究显示,AI 搜索引擎在新闻引用准确性上表现堪忧,错误率超 60%。研究测试了 ChatGPT Search、Perplexity、Gemini、DeepSeek Search、Grok 3 等八款 AI 搜索工具,发现其错...
Google DeepMind 推出 Gemini Robotics 和 Gemini Robotics-ER,基于 Gemini 2.0 模型,增强机器人与物理世界的交互能力。Gemini Robotics 具备视觉-语言-行动(VLA)功能,处理视觉信息、理解语言指令并生成动作,适配多样机...
Moonvalley 发布 AI 视频生成模型 Marey,宣称使用开放许可数据训练,降低法律风险。模型以电影先驱 Étienne-Jules Marey 命名,与 AI 动画工作室 Asteria 合作开发,支持生成 30 秒高清视频,提供精细相机和动作控制,如...
OpenAI近日推出了一款擅长创意写作的AI模型,但其生成的短篇小说却引发了广泛讨论。尽管展示了一定的技术能力,这些作品却被批评为缺乏深度,甚至被比作高中写作研讨会中的故作深沉之作。OpenAI首席执行官Sam Altman在社交...
在AI驱动的图像生成领域,版权问题一直是争议的焦点。许多AI公司依赖从公共网站抓取的大量数据进行模型训练,并声称其行为受到合理使用原则的保护。然而,版权所有者对此并不认同。为了应对这一挑战,总部位于纽约和特拉维夫...
卡内基梅隆大学研究人员Isaac Liao与Albert Gu发现,无损信息压缩可解决抽象推理任务,挑战AI需大量预训练数据的观点。研究聚焦ARC-AGI基准测试,测试系统通过网格图像谜题推断规则,CompressARC系统不依赖预训练或外部数据...
Junction(前称Vital)完成1800万美元A轮融资,欧洲风投Creandum领投,Y Combinator、Point Nine与Amino Collective参投。公司开发单一API,连接超500种健康可穿戴设备与实验室,标准化设备数据,支持美国50州实验室测试,覆盖LabC...
PDF文件广泛存储科学研究、政府记录等关键信息,其僵化格式却阻碍机器读取与分析,成为数据专家的长期挑战。PDF设计初衷偏向印刷版面,而非数字优化,多数文件以图像形式存储,需光学字符识别(OCR)技术转换数据。马里兰大学数...
OpenAI近期发布Responses API,旨在支持开发者构建独立执行任务的AI代理,覆盖文件搜索、网页浏览与自动化操作,标志着AI代理技术迈向实用化。Responses API整合Chat Completions与Assistants API功能,支持GPT-4o及GPT-4o m...
索尼宣布,PlayStation 5 Pro将于2026年采用基于AMD FSR 4技术的升级方案,进一步提升图形清晰度和流畅性,超越现有PlayStation Spectral Super Resolution(PSSR)技术。PSSR目前可将720p图像动态转换为4K,并增强粒子效果,表...