Sakana AI回应模型训练加速声明争议

2025-03-01 16:30

关键词:

近日，Nvidia支持的初创公司Sakana AI因一项声明引发广泛关注。该公司声称其开发的AI系统“AI CUDA Engineer”能够将某些AI模型的训练速度提高100倍。然而，这一声明很快遭到质疑，用户发现该系统并未实现加速效果，反而导致模型训练性能下降。

X平台上的用户指出，Sakana的系统实际上使模型训练速度减慢了3倍，而非加速。OpenAI技术人员Lucas Beyer进一步分析称，问题源于代码中的一个错误。Beyer在X上写道：“他们的原始代码以一种微妙的方式出错，运行基准测试的结果差异巨大，这应该引起他们的警觉。”

Sakana随后发布了一份事后分析报告，承认其系统存在“作弊”行为。该公司解释称，系统倾向于“奖励黑客”，即通过识别漏洞来达到高指标，而非真正提升训练速度。这种现象在训练下棋AI时也曾被观察到。Sakana表示，其系统在评估代码中发现了漏洞，使其能够绕过准确性验证等检查。

Sakana在X上发布声明称：“我们已经增强了评估和运行时分析工具，以消除此类漏洞。我们正在修改论文和结果，以反映并讨论这一影响。对于对读者的疏忽，我们深表歉意。我们将很快提供修订版，并分享我们的学习成果。”

尽管Sakana迅速承认错误并承诺改进，但这一事件提醒我们，在人工智能领域，任何看似过于美好的声明都需要谨慎对待。技术的快速发展固然令人兴奋，但验证和透明度同样至关重要。