瑞士将发布开源大型语言模型推动AI多语言与透明度发展

2025-07-10 13:50

今年夏天，洛桑联邦理工学院(EPFL)与苏黎世联邦理工学院(ETH Zurich)将携手发布一款基于公共基础设施的大型语言模型(LLM)。该模型在瑞士国家超级计算中心(CSCS)的Alps超级计算机上完成训练，成为开源人工智能和多语言卓越领域的重要里程碑。

日前，约50个全球领先的开源法学硕士(LLM)及可信人工智能倡议组织在日内瓦齐聚，参与国际开源法学硕士建设者峰会。峰会由洛桑联邦理工学院和苏黎世联邦理工学院的人工智能中心主办，为构建开放基础模型的国际生态系统迈出关键一步。此次峰会预告了即将发布的开源LLM模型，该模型由EPFL、ETH Zurich及瑞士其他大学研究人员与CSCS工程师共同开发，目前处于最终测试阶段，将以开放许可形式提供下载，注重透明度、多语言性能及广泛可访问性。

该模型将完全开放，源代码、权重及训练数据均公开发布，支持科学、政府、教育及私营部门采用。苏黎世联邦理工学院人工智能中心研究科学家Imanol Schlag表示：“完全开放的模型能实现高信任度应用，对推进人工智能风险与机遇研究至关重要。”模型涵盖超过1000种语言，基于包含1500多种语言的大型文本数据集训练，确保全球适用性。模型将以80亿和700亿参数两种规模发布，满足不同用户需求，700亿版本将成为全球最强大的开源模型之一。训练基于超过15万亿个高质量标记，确保高可靠性及强大语言理解能力。模型开发严格遵守瑞士数据保护法、版权法及欧盟《人工智能法案》透明度义务。该模型在位于卢加诺的CSCS的Alps超级计算机上训练，该计算机配备超10000个NVIDIA Grace Hopper超级芯片，使用100%碳中和电力。CSCS主任Thomas Schulthess称：“战略投资专为人工智能打造的超级计算机，使我们能够训练此类模型。”夏末，该LLM将根据Apache 2.0许可证发布，随附详细文档，促进透明重用与进一步开发。EPFL教授Jaggi表示：“通过完全开放模式，我们希望推动瑞士、欧洲及跨国合作创新，吸引顶尖人才。”

更多信息： Dongyang Fan 等，《优秀的法学硕士是否合乎伦理?量化网络爬虫选择退出的影响》，arXiv (2025)。期刊信息： arXiv

瑞士

战略性新兴产业新一代信息技术

本文来自全球互联网及战略合作伙伴信息的编译与转载,仅为读者提供交流,有侵权或其它问题请及时告知,本站将予以修改或删除,未经正式授权严禁转载本文。邮箱:news@wedoany.com

上一篇：深度学习系统仅使用单个摄像头即可教会仿生软机器人移动

下一篇：英国支持新任务探寻金星云层生命迹象