Sakana AI回应模型训练加速声明争议
2025-03-01 16:30
收藏

近日,Nvidia支持的初创公司Sakana AI因一项声明引发广泛关注。该公司声称其开发的AI系统“AI CUDA Engineer”能够将某些AI模型的训练速度提高100倍。然而,这一声明很快遭到质疑,用户发现该系统并未实现加速效果,反而导致模型训练性能下降。

X平台上的用户指出,Sakana的系统实际上使模型训练速度减慢了3倍,而非加速。OpenAI技术人员Lucas Beyer进一步分析称,问题源于代码中的一个错误。Beyer在X上写道:“他们的原始代码以一种微妙的方式出错,运行基准测试的结果差异巨大,这应该引起他们的警觉。”

Sakana随后发布了一份事后分析报告,承认其系统存在“作弊”行为。该公司解释称,系统倾向于“奖励黑客”,即通过识别漏洞来达到高指标,而非真正提升训练速度。这种现象在训练下棋AI时也曾被观察到。Sakana表示,其系统在评估代码中发现了漏洞,使其能够绕过准确性验证等检查。

Sakana在X上发布声明称:“我们已经增强了评估和运行时分析工具,以消除此类漏洞。我们正在修改论文和结果,以反映并讨论这一影响。对于对读者的疏忽,我们深表歉意。我们将很快提供修订版,并分享我们的学习成果。”

尽管Sakana迅速承认错误并承诺改进,但这一事件提醒我们,在人工智能领域,任何看似过于美好的声明都需要谨慎对待。技术的快速发展固然令人兴奋,但验证和透明度同样至关重要。

本简讯来自全球互联网及战略合作伙伴信息的编译与转载,仅为读者提供交流,有侵权或其它问题请及时告之,本站将予以修改或删除,未经正式授权严禁转载本文。邮箱:news@wedoany.com