DeepSeek V3模型的版本更新
2025-03-25 16:10
收藏
3月24日晚,DeepSeek发布了模型更新——DeepSeek-V3-0324。本次更新为DeepSeek V3模型的版本更新,并非市场此前一直期待的DeepSeek-V4或R2。目前,其开源版本已上线Hugging Face。据悉,其开源版本模型体积为6850亿参数。

同日,DeepSeek在其官方交流群宣布称,DeepSeek V3模型已完成小版本升级,欢迎前往官方网页、App、小程序试用体验(关闭深度思考),API接口和使用方式保持不变。
从网友反馈的实测效果来看,V3编码能力已经接近 Claude3.7,数学能力也有提升,能像推理模型一样解题。
此前于2024年12月发布的DeepSeek-V3模型曾以“557.6万美金比肩Claude 3.5效果”的高性价比著称,其多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。但截至目前,还没有任何关于新版 DeepSeek-V3的能力基准测试榜单出现。
其后,DeepSeek于2025年1月发布了性能比肩OpenAI o1正式版的DeepSeek-R1模型,该模型在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。
2025年2月25日,市场上也曾出现DeepSeek-R2模型的发布时间或将提前的消息。路透社称,DeepSeek正在加快推出DeepSeek-R1模型的后续产品DeepSeek-R2。据悉,DeepSeek-R2原计划在5月初发布,但公司现在希望尽早推出。
相关推荐

德国赢创与Imubit在新加坡启动工业AI试点
2026-05-05

存储厂商延长供货协议周期:闪迪、希捷、西数锁定 3 至 5 年订单
2026-05-05

美国红帽推出Tank OS开源项目将OpenClaw封装
2026-05-05

SC CapRock为巴西Taboca亚马逊矿区部署多轨道混合卫星连接
2026-05-05

美国Cognizant以6亿美元收购AI基础设施服务商Astreya
2026-05-05

美国IQ Fiber投资1亿美元,在佛罗里达州皮尼拉斯县推出10 Gbps对称光纤互联网
2026-05-05

美国Airspan与Wireless Services在夏洛特机场部署DAS,下载速率从50Mbps跃升至超300Mbps
2026-05-05

美国海洋能源公司Panthalassa获1.4亿美元B轮融资,2026年部署北太平洋AI波浪计算节点
2026-05-05

阿联酋阿布扎比启动AI无人巡逻艇海上监控测试
2026-05-05
美国莱迪思半导体以16.5亿美元收购固件与AI基础设施管理厂商AMI
2026-05-05
最新简讯
