维度网讯,美国宇航局喷气推进实验室(NASA's Jet Propulsion Laboratory)与太空基础设施公司Loft Orbital合作,在YAM-9卫星上成功测试了一款视觉语言模型(VLM),该模型能够响应自然语言查询,自动识别地面感兴趣的区域。此次演示使用了谷歌DeepMind的Gemma 3模型,该模型专为边缘应用设计,可在远离数据中心的有限硬件上运行,结合了大型语言模型的情境理解能力和图像分析能力。
在测试中,研究人员要求模型对自然环境与人类发展交汇处的传感器数据进行分类,或识别铁路枢纽周边的基础设施,模型均完成了任务。YAM-9卫星由Loft Orbital建造,于2025年秋季发射,作为该公司轨道AI项目的探路者,配备了一块Nvidia Jetson Orin AGX GPU,这是太空计算中使用的领先芯片之一。Loft的航天器设计为第三方客户的平台,其商业模式更接近于基础设施即服务。
此次演示的意义在于,短期内可通过在轨道上进行初始数据分类,减少分析师需要处理的大量原始数据;长期则验证了在太空中运行更大规模人工智能基础设施的可行性。Loft的AI负责人保罗·拉塞尔(Paul Lasserre)表示,拥有VLM后可以实现持续监控和逻辑交互,例如监控边境并在出现可疑情况时通知用户。
NASA JPL人工智能小组的技术负责人胡安·德尔法·维多利亚(Juan Delfa Victoria)领导了NAVI-Orbital软件开发,该软件包是Gemma 3 VLM的“框架”。工程师必须精简软件包以减少所需的库和内存,使其能在轨运行。这是首次报道在轨道上使用VLM,但其他公司可能跟进。Planet Labs的卫星搭载了Jetson Orin处理器,目前用于简单物体检测,但一位发言人表示正在研究包括VLM在内的其他AI应用。Kepler Communications因保密协议拒绝透露是否已部署VLM,但指出自1月发射以来已有几个未公开的计算环境用例。
拉塞尔表示,验证概念后,未来的发展方向是扩建星座,确保对地球任何地点进行实时覆盖,这大约需要50到100颗像YAM-9这样的卫星(Loft目前在轨道上运营12颗航天器)。在轨道上部署较小模型的经验将影响更大规模计算基础设施的部署,尤其在电力和内存管理领域。NAVI-Space的概念始于德尔法·维多利亚和JPL研究员塔兰·西里亚克·约翰(Taran Cyriac John),他们最初设想为探测月球或火星的宇航员提供数字助手,使宇航员在穿着加压服时能通过语音与AI交互。
本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com









