OpenAI 发布 GPT-4.5 “Orion”:迄今最大模型面临性能与成本挑战
2025-03-03 15:09
收藏

OpenAI 周四推出 GPT-4.5,代号“Orion”,这是其规模最大的AI模型,依托空前的计算能力和数据训练完成。首批访问权限已向ChatGPT Pro订阅者(月费200美元)开放,API开发者亦可通过付费层使用。从下周起,ChatGPT Plus及Team用户将陆续获得该模型。初始白皮书中曾提及“GPT-4.5并非前沿AI模型”,但此句在数小时后被删除,最新版本已不含该表述。

GPT-4.5沿袭OpenAI传统技术路径,通过无监督学习的“预训练”阶段大幅增加算力和数据投入。与前代相比,其规模提升带来“更深入的世界知识”和“更高的情商”,在写作、编程及问题解决等任务中表现更自然。然而,性能增长幅度未达预期。在SimpleQA基准测试中,GPT-4.5准确性超越GPT-4o及推理模型o1与o3-mini,且幻觉现象减少。但在编码领域,SWE-Bench验证测试显示其表现仅与GPT-4o和o3-mini相当,低于OpenAI的Deep Research及Anthropic的Claude 3.7 Sonnet。SWE-Lancer测试中,GPT-4.5虽优于GPT-4o和o3-mini,但在高难度学术测试如AIME和GPQA上,仍落后于领先的推理模型。

运行成本是GPT-4.5的另一大难题。API定价为每百万输入令牌75美元、输出令牌150美元,远高于GPT-4o的2.50美元和10美元。公司表示正评估是否长期提供该模型的API访问。OpenAI将其定位为研究预览,旨在探索其潜力与局限性。功能上,GPT-4.5支持文件与图像上传及画布工具,但在双向语音模式等高级特性上暂不支持。

行业观察人士视GPT-4.5为传统预训练方法的试金石。专家指出,数据与计算扩展的收益趋于平缓,可能预示“缩放定律”面临瓶颈。OpenAI联合创始人Ilya Sutskever曾表示,预训练已接近极限。未来,公司计划融合GPT与推理系列,从GPT-5开始迈向更综合的AI系统。GPT-4.5虽未独占基准测试鳌头,但被视为通往更强模型的过渡。

本简讯来自全球互联网及战略合作伙伴信息的编译与转载,仅为读者提供交流,有侵权或其它问题请及时告之,本站将予以修改或删除,未经正式授权严禁转载本文。邮箱:news@wedoany.com