维度网讯,为解决当前制约前沿AI工作负载的延迟和成本瓶颈,英国伦敦人工智能芯片初创公司Fractile在B轮融资中筹集了2.2亿美元,用于加速其AI推理芯片及系统的开发和商业化。该公司由牛津大学培养的工程师Walter Goodwin于2022年创立,专注于AI推理阶段。

本轮融资由Accel、Factorial Funds和Founders Fund领投,Conviction、Gigascale、O1A、Felicis、Buckley Ventures、8VC以及现有投资者跟投。Fractile认为,长上下文推理、自主编程、科学发现以及其他序列性工作负载越来越依赖于快速且经济地生成大量token。其公开资料声称,其系统运行前沿模型推理的速度可提升高达25倍,而成本仅为现有硬件的十分之一。
这家初创公司表示,随着模型生成更长的输出并处理更大的上下文窗口,现有架构面临内存带宽瓶颈。这笔融资将用于推动其首批芯片和系统进入客户部署阶段,同时在伦敦、布里斯托尔、旧金山和中国台湾台北进行招聘。报道还指出,Fractile已引起AI实验室的兴趣,这些实验室正在探索替代英伟达GPU的未来推理部署方案,不过商业系统仍有待实现。
这家初创公司的推理芯片目标工作负载为长上下文、高token输出的前沿AI推理。其声称的性能目标为推理速度高达现有硬件的25倍,成本仅为十分之一。招聘地点涵盖英国、美国和中国台湾。
“今天,我们很高兴地宣布,我们已筹集2.2亿美元,以加速将首批芯片和系统交付到客户手中。本轮融资由Accel、Factorial Funds和Founders Fund领投,Conviction、Gigascale、O1A、Felicis、Buckley Ventures和8VC参投,与出色的现有投资者一道支持我们。”
随着AI基础设施需求从仅限训练的规模转向持续、低延迟的模型执行,这家初创公司的推理芯片进入硬件竞赛。其挑战将是在英伟达、超大规模ASIC、Cerebras、Groq以及其他专注于推理的厂商均瞄准同一内存带宽瓶颈的市场中,证明芯片的软件成熟度、可制造性和系统级经济性。
本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com










