几十年来,寻找更好的电池材料大多依赖反复试验,密歇根大学副教授Venkat Viswanathan称,在电池材料发现的大部分历史中,直觉是新发明的源泉,如今使用的大多数材料在1975 - 1985年发现,后续主要做细微调整来提高性能。不过,人工智能及其支撑的计算能力进步正在改变这一局面。

借助美国能源部阿贡国家实验室的超级计算机,Venkat Viswanathan和同事正开发人工智能基础模型,加速从个人电子产品到医疗设备等领域的新型电池材料研发。基础模型是用海量数据集训练的大型AI系统,与通用大型语言模型不同,科学基础模型专为药物研发或神经科学等专业领域定制,能生成更精确、可靠的预测。
Viswanathan表示,其团队开发的基础模型对分子世界有广泛理解,处理预测属性等特定任务更高效,可预测电导率、熔点、沸点、可燃性等对电池设计有用的特性。该团队模型专注于识别电解质和电极这两种关键电池组件的材料,潜在分子化合物可能有10^60种,基于数十亿已知分子数据训练的基础模型,能帮助研究人员更有效探索化学空间,锁定高潜力候选分子。
2024年,Viswanathan团队(包括博士生Anoushka Bhutani和Alexius Waddle)使用阿贡国家实验室领导力计算中心(ALCF)的Polaris超级计算机,训练了迄今最大的化学基础模型之一,该模型专注设计电池电解质的关键小分子。为让模型理解分子结构,团队采用SMILES系统,还开发了SMIRK新工具,改进模型处理结构的方式,使其能更高精度和一致性地从数十亿分子中学习。
基于这一成功,研究人员目前正用ALCF的新Aurora百亿亿次系统开发分子晶体的第二个基础模型,作为电池电极组成部分。训练完成后,将通过与实验数据比较来验证模型预测结果,确保准确性。此前,Viswanathan团队为每个感兴趣属性开发更小、独立的AI模型,Polaris上训练的基础模型不仅统一了这些功能,性能还优于过去单一属性预测模型。团队正探索模型功能,计划未来将其提供给更广泛研究界,还计划与密歇根大学实验室科学家合作,合成并测试模型识别出的最有前景候选材料。
利用数十亿分子数据训练基础模型,计算需求超出大多数研究实验室内部能力。该团队通过美国能源部“创新计算对理论与实验的影响”(INCITE)项目获得ALCF超级计算机使用权,此前团队面临扩展问题,初创公司Deep Forest Sciences创始人兼首席执行官Bharath Ramsundar称,训练人工智能系统时,可观察的分子数量受限,一开始用一百万到一千万个分子训练模型,最终达到一亿个也不够,且在公共云上训练大型基础模型成本高昂,使用美国能源部超级计算资源可提高研究可及性。
ALCF的超级计算机配备数千个图形处理单元(GPU)和海量内存容量,满足人工智能驱动研究的复杂需求。Viswanathan称,用数百万和数十亿分子训练模型差异大,大学研究团队常用的小集群无法实现,需要ALCF这样的资源。
人的因素也至关重要,过去两年,Viswanathan团队参加ALCF年度INCITE黑客马拉松,与阿贡国家实验室计算专家合作,扩展和优化工作负载。该项目还受益于与其他领域科学家合作,如阿贡国家实验室计算科学家阿尔温德·拉马纳坦(Arvind Ramanathan)将开发基因组学和蛋白质设计人工智能模型的知识应用于电池研究。
为使基础模型更具互动性和可访问性,团队将其与ChatGPT等基于大型语言模型(LLM)的聊天机器人集成。学生、博士后和合作者可提出问题、测试想法、探索新化学配方,无需编写代码或运行复杂模拟。Viswanathan称,这就像每个研究生每天都能与顶尖电解质科学家交流,开启了全新探索层次,也改变了研究人员对发现过程的看法,这些模型能创造性思考、产生新分子,对人工智能驱动的材料研究而言是非凡时代。
阿贡国家实验室领导计算设施(ALCF)为科学和工程界提供超级计算能力,促进广泛学科领域基础发现和理解,由美国能源部科学办公室高级科学计算研究(ASCR)项目支持,是美国能源部两个致力于开放科学的领导计算设施之一。














京公网安备 11010802043282号