芬兰LUMI AI工厂推出数据集即服务,优化AI开发数据访问流程
2026-04-02 09:28
收藏
维度网讯, 芬兰的LUMI AI工厂近期推出了数据集即服务(DaaS),旨在解决传统数据处理中数据移动耗时耗资源的问题。这项服务使数据在计算能力存在的位置可见,缩短了从数据到结果的距离,提升了实验和研究的效率。数据集即服务通过整合元数据、访问权限和数据位置,让数据集在LUMI超级计算机上可立即使用,这对AI开发至关重要,因为数据与计算的邻近性显著影响性能。

数据集即服务为用户提供了数据目录界面,数据生产者能以受控方式发布数据集,而数据用户无需手动搜索即可发现它们。该服务简化了对AI就绪数据集的访问,消除了大型数据集复制时的瓶颈,同时为数据提供者提供了标准化发布路径,提高数据可见性和利用率。与传统数据存储库不同,数据集即服务专注于使用而非长期保存,它编排数据访问,允许用户在不移动数据的情况下使用数据集。
数据集即服务基于现有组件构建,包括CSC的Fairdata-Metax元数据仓库和Fairdata-Etsin搜索工具,以及LUMI-O对象存储和REMS授权系统,这种模块化架构实现了成本效益和可扩展性。目前,该服务的预产品化版本已可用,数据目录包含十个数据集集合,如开放网络搜索索引,资源超过1,000个数据集,总容量超一PB,支持搜索引擎开发和大型语言模型训练。随着数据集即服务向完全产品化成熟,它将加速AI开发,推动数据在价值创造处的即时可用性。
本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告之,本站将予以修改或删除。邮箱:news@wedoany.com
相关推荐

美国研究团队开发机器学习模型 利用云类型和云量预测太阳能波动
2026-05-17

中国三大运营商回应零月租传闻:中国联通“魔方”最低消费,中国移动中国电信暂无计划
2026-05-16

加拿大Nord Quantique获富达领投估值14亿美元,DARPA加持押注硬件级量子纠错
2026-05-16

美国希捷HAMR技术推动30TB硬盘规模化出货,AI需求驱动HDD市场逆势增长
2026-05-16

瑞士意法半导体与瑞典Tobii量产单摄像头座舱感知系统,为欧洲高端车企供货
2026-05-16

丹麦Terma在里斯本空域世界展推出SCANTER 4002共置雷达方案
2026-05-16

日本富士通与东京科学大学在东京设立量子技术与HPC联合研究集群
2026-05-16

美国Runway押注世界模型构建物理世界模拟器,与谷歌DeepMind竞逐下一代智能
2026-05-16

Osaurus推出Mac端本地与云端AI模型控制层工具,下载量超11万次
2026-05-16

瑞士Acronis推出Cyber Frame平台,2026年通过北欧数据中心提供主权云服务
2026-05-16
最新简讯
1
Acen Renewables澳大利亚太阳能电厂季度发电量增87%,电池启动调试
2
中国国家电投贵州金元金沙柳塘煤电项目1号机组锅炉钢架完成首吊
3
中电建核电公司完成内蒙古苏能白音华电厂1号机组锅炉水压试验
4
英国Broadway公司新增USEON双螺杆挤出产线 产能提升2000吨/年
5
美国联邦政府公布科罗拉多河配水计划,加州等三州取水量将削减40%
6
美国Affinity Farms采用Sabanto Ag自动驾驶套件播种,年省50万美元
7
美国Struktol推出VMO系列熔体流动改性剂 提升聚丙烯加工效率与可持续性
8
Gulshan Polyols获印度BPCL与IOCL额外乙醇订单,供应2923千升
9
Technip Energies完成荷兰壳牌Skyline项目裂解炉升级,产能翻倍减排10%
10
日本瑞翁批准水岛工厂投资 扩大双环戊二烯产能约20%
