微软与清华大学用英伟达芯片,以合成数据训练AI模型
微软与清华大学的研究人员携手开展了一项创新研究,他们开发出名为SynthSmith的合成数据管道,借助英伟达芯片进行复杂计算,成功实现无需真实世界数据就能训练人工智能模型。

研究团队仅依靠合成数据,便训练出一个拥有70亿参数的编码模型。令人惊喜的是,该模型在基准测试中的表现优于规模更大的140亿参数模型。在实验过程中,不同阶段使用了不同数量的英伟达芯片。监督微调期间,动用了128个Nvidia H20芯片,运行时长达220小时;强化学习阶段,则使用32个H200芯片,运行时间为7天。
不过,研究人员也指出,受计算能力限制,此方法难以扩展到参数超过1000亿的模型。为推动行业发展,他们将这项研究开源,方便其他人员在此基础上开展开发工作,且无需承担高昂训练成本。目前,使用的英伟达H20和H200芯片在出口管制下可供中国人工智能公司使用。
下一篇:中国新疆开行全国首趟棉花快速班列
相关推荐

中国首个机器学习台风快速增强集成预报模型,开始“上岗”!实现24小时台风快速增强预报
2026-06-13

Microchip法国南特厂获QML Y类认证
2026-06-13

比利时Imec实现III-V小芯片硅中介层集成
2026-06-13

日本NTT携埃森哲AWS扩展UWI加强代理AI治理
2026-06-13

美国加州CPUC批准1820万美元宽带拨款
2026-06-13

美国AT&T用代币化重构OSS/BSS,日处理约270亿代币,年省10亿美元
2026-06-13

尼日利亚数据保护委员会与Meta启动两年期数据保护计划
2026-06-13

喀麦隆ST DIGITAL今年将启用首个生态友好型三级数据中心
2026-06-13

阿曼Omantel为塞拉莱港部署专用5G SA网络
2026-06-13

美国Liquibase于发布免费CVE库
2026-06-13
最新简讯
1
中国首个机器学习台风快速增强集成预报模型,开始“上岗”!实现24小时台风快速增强预报
2
美伊谈判现积极信号 国际油价继续下跌
3
中国天合储能签约日本九州160MWh电网级储能项目,持续深化日本储能市场布局
4
罗马尼亚港口启动小堆可行性研究
5
Microchip法国南特厂获QML Y类认证
6
比利时Imec实现III-V小芯片硅中介层集成
7
日本NTT携埃森哲AWS扩展UWI加强代理AI治理
8
美国加州CPUC批准1820万美元宽带拨款
9
美国AT&T用代币化重构OSS/BSS,日处理约270亿代币,年省10亿美元
10
尼日利亚数据保护委员会与Meta启动两年期数据保护计划