OpenAI 发布 GPT-4.5 “Orion”：迄今最大模型面临性能与成本挑战

2025-03-03 15:09

关键词:

OpenAI 周四推出 GPT-4.5，代号“Orion”，这是其规模最大的AI模型，依托空前的计算能力和数据训练完成。首批访问权限已向ChatGPT Pro订阅者(月费200美元)开放，API开发者亦可通过付费层使用。从下周起，ChatGPT Plus及Team用户将陆续获得该模型。初始白皮书中曾提及“GPT-4.5并非前沿AI模型”，但此句在数小时后被删除，最新版本已不含该表述。

GPT-4.5沿袭OpenAI传统技术路径，通过无监督学习的“预训练”阶段大幅增加算力和数据投入。与前代相比，其规模提升带来“更深入的世界知识”和“更高的情商”，在写作、编程及问题解决等任务中表现更自然。然而，性能增长幅度未达预期。在SimpleQA基准测试中，GPT-4.5准确性超越GPT-4o及推理模型o1与o3-mini，且幻觉现象减少。但在编码领域，SWE-Bench验证测试显示其表现仅与GPT-4o和o3-mini相当，低于OpenAI的Deep Research及Anthropic的Claude 3.7 Sonnet。SWE-Lancer测试中，GPT-4.5虽优于GPT-4o和o3-mini，但在高难度学术测试如AIME和GPQA上，仍落后于领先的推理模型。

运行成本是GPT-4.5的另一大难题。API定价为每百万输入令牌75美元、输出令牌150美元，远高于GPT-4o的2.50美元和10美元。公司表示正评估是否长期提供该模型的API访问。OpenAI将其定位为研究预览，旨在探索其潜力与局限性。功能上，GPT-4.5支持文件与图像上传及画布工具，但在双向语音模式等高级特性上暂不支持。

行业观察人士视GPT-4.5为传统预训练方法的试金石。专家指出，数据与计算扩展的收益趋于平缓，可能预示“缩放定律”面临瓶颈。OpenAI联合创始人Ilya Sutskever曾表示，预训练已接近极限。未来，公司计划融合GPT与推理系列，从GPT-5开始迈向更综合的AI系统。GPT-4.5虽未独占基准测试鳌头，但被视为通往更强模型的过渡。

美国