DeepSeek AI新模型曝光:搭载 MODEL1 全新架构,最快2月上线
2026-01-21 17:02
收藏
1月21日消息,据维度网报道,DeepSeek计划于今年2月中旬农历新年期间,推出新一代旗舰AI模型DeepSeek V4。该模型将搭载全新技术架构,写代码能力有望实现显著提升,引发行业广泛关注。

1月20日,恰逢DeepSeek-R1模型发布一周年,有开发者在GitHub平台发现,DeepSeek更新了一系列FlashMLA相关代码。在涉及的114个文件中,28处明确提及未知的“MODEL1”大模型标识符,且该标识符与现有模型“V32”(即DeepSeek-V3.2)被并列或区分引用。通过代码上下文分析,技术人士推测,“MODEL1”大概率对应一款采用全新架构的AI模型,其核心技术特征与现有模型存在明显差异。
具体来看,新架构在键值(KV)缓存布局、稀疏性处理方式以及FP8数据格式解码支持等关键技术环节进行了优化调整。这些技术革新针对性解决了模型运行中的内存占用与计算效率问题,为模型性能提升奠定了基础。
值得关注的是,DeepSeek研究团队此前已连续发布两篇技术论文,分别提出“优化残差连接(mHC)”的创新训练方法,以及受生物学启发研发的“AI记忆模块(Engram)”。业内普遍推测,即将发布的DeepSeek V4有望整合这些最新研究成果,进一步释放AI模型在复杂任务处理中的潜力。
相关推荐

美国苹果与谷歌合作 下一代Siri将集成Gemini
2026-06-06

澳大利亚Firmus与SUBCO拟2027年Q2建成超60Tbps海缆
2026-06-06

美国思科发现SD-WAN Manager漏洞,可致管理员权限提升
2026-06-06

美国纽约市将AI交通传感器网络扩展至100个地点
2026-06-06

美国Let's Encrypt后量子证书2026暂存2027投产
2026-06-06

美国Aitech推AI卫星平台,产品用于ArtemisII
2026-06-06

美国星链五年平均下载速度增长78.6%,2026年或触及天花板
2026-06-06

韩国三星与美国楷登扩展第二代2nm IP和设计流程
2026-06-06

日本发那科与美国谷歌合作加速物理AI,已交付超千台机器人
2026-06-06

印度STT全球数据中心以28.2亿卢比收购新孟买土地
2026-06-06
最新简讯
1
美国苹果与谷歌合作 下一代Siri将集成Gemini
2
澳大利亚Firmus与SUBCO拟2027年Q2建成超60Tbps海缆
3
美国思科发现SD-WAN Manager漏洞,可致管理员权限提升
4
美国纽约市将AI交通传感器网络扩展至100个地点
5
美国Let's Encrypt后量子证书2026暂存2027投产
6
美国Aitech推AI卫星平台,产品用于ArtemisII
7
美国星链五年平均下载速度增长78.6%,2026年或触及天花板
8
韩国三星与美国楷登扩展第二代2nm IP和设计流程
9
日本发那科与美国谷歌合作加速物理AI,已交付超千台机器人
10
印度STT全球数据中心以28.2亿卢比收购新孟买土地