近日,中国人工智能初创公司 MiniMax 发布了名为 M2.7 的专有大语言模型。该模型具备自我进化能力,能够处理其自身开发流程中 30% 至 50% 的强化学习研究工作,标志着 AI 模型向自主优...
美国麻省理工学院的研究人员开发了一种名为“注意力匹配”的新技术,通过压缩KV缓存,能将大语言模型的内存需求降低高达50倍,同时保持准确性,为企业AI应用处理大型文档和长期任务提供了高效解决方案。大型语...
随着大型语言模型在企业级应用中日益普及,如何借助AI智能体技术协同完成复杂工作任务,正成为技术团队重点关注的方向。与此同时,多模态模型凭借其能够同时处理文本、图像、表格等多种数据类型的能力,正迅速崛起...
微软近日宣布开发了一款轻量级扫描器,专门用于检测开源大语言模型中的后门,旨在提升人工智能系统的整体可信度。该工具由微软的AI安全团队研发,利用三个可观测信号,能够在维持较低误报率的同时,有效识别后门的...
来自美国卡内基梅隆大学、斯坦福大学、哈佛大学和普林斯顿大学的人工智能研究小组发现,如果大型语言模型过度训练,可能会使其更难进行微调。该小组在arXiv预印本服务器上发表的论文比较了不同训练量对单个法学硕士(LLM)...
扎尔巴耶夫大学智能系统与人工智能学院(ISSAI)向总统卡西姆-若马尔特·托卡耶夫授予了哈萨克斯坦首个大型语言模型(LLM),这是该国进军全球人工智能(AI)领域的重要里程碑。 该项目基于神经网络技术,为哈萨克语版本的Chat...