DeepSeek发布新论文,开源记忆模块Engram
2026-01-13 14:52
收藏
据维度网获悉,DeepSeek发布新论文,由DeepSeek团队联合北京大学研究人员共同完成,提出名为“条件记忆”(Conditional Memory)的Transformer改进方案,通过引入可扩展的查找记忆结构,在等参数、等算力条件下显著提升模型在知识调用、推理、代码、数学等任务上的表现。通过引入Engram模块补全原生架构的知识查找短板。论文以梁文锋为通讯作者,实验显示270亿参数的Engram模型在多项任务中超越同规模纯MoE(混合专家)架构,推理效率显著提升。

相关推荐

中国华为在MWC 2026举办第三届绿色与韧性精英俱乐部
2026-06-05

英国沃达丰物联网与Skylo合作提供卫星NB-IoT连接
2026-06-05

意大利Sparkle为GÉANT新增欧洲、非洲及中东和北非三路容量
2026-06-05

巴林Beyon与科威特签署超8.25亿科威特第纳尔固网PPP协议
2026-06-05

中国香港德祥地产与中国联通香港签署AI算力合作备忘录
2026-06-05

美国开源后端平台Supabase完成5亿美元F轮融资
2026-06-05

美国简街集团计划自建数据中心
2026-06-05

加拿大推出全民AI战略,计划五年创造25万个岗位
2026-06-05

美国IBM与谷歌云推出企业AI云实践业务
2026-06-05

中国首都在线出资3000万元参设算力租赁合资公司
2026-06-05
最新简讯