MiniMax 在上海发布 M2.7大语言模型,具备自我进化能力,可执行 30-50% 强化学习工作流程

近日,中国人工智能初创公司 MiniMax 发布了名为 M2.7 的专有大语言模型。该模型具备自我进化能力,能够处理其自身开发流程中 30% 至 50% 的强化学习研究工作,标志着 AI 模型向自主优...

2026-03-19

美国麻省理工学院研究人员开发注意力匹配技术,将大语言模型内存需求降低50倍

美国麻省理工学院的研究人员开发了一种名为“注意力匹配”的新技术,通过压缩KV缓存,能将大语言模型的内存需求降低高达50倍,同时保持准确性,为企业AI应用处理大型文档和长期任务提供了高效解决方案。大型语...

2026-03-07

企业大型语言模型在线会议:AI智能体与多模态应用研讨

随着大型语言模型在企业级应用中日益普及,如何借助AI智能体技术协同完成复杂工作任务,正成为技术团队重点关注的方向。与此同时,多模态模型凭借其能够同时处理文本、图像、表格等多种数据类型的能力,正迅速崛起...

2026-02-23

微软推出开源大语言模型后门检测扫描器

微软近日宣布开发了一款轻量级扫描器,专门用于检测开源大语言模型中的后门,旨在提升人工智能系统的整体可信度。该工具由微软的AI安全团队研发,利用三个可观测信号,能够在维持较低误报率的同时,有效识别后门的...

2026-02-05

过度训练大型语言模型可能会使它们更难进行微调

来自美国卡内基梅隆大学、斯坦福大学、哈佛大学和普林斯顿大学的人工智能研究小组发现,如果大型语言模型过度训练,可能会使其更难进行微调。该小组在arXiv预印本服务器上发表的论文比较了不同训练量对单个法学硕士(LLM)...

2025-04-26

哈萨克斯坦通过首个大型语言模型拥抱人工智能的未来

扎尔巴耶夫大学智能系统与人工智能学院(ISSAI)向总统卡西姆-若马尔特·托卡耶夫授予了哈萨克斯坦首个大型语言模型(LLM),这是该国进军全球人工智能(AI)领域的重要里程碑。 该项目基于神经网络技术,为哈萨克语版本的Chat...

2024-12-29
上一页 下一页 跳转至
确认