维度网获悉,中国GPU厂商曦望(Sunrise)正式推出新一代推理GPU芯片启望S3,这是曦望在近一年累计完成约30亿元战略融资后的首次集中公开亮相。截至2025年,曦望芯片交付量已成功突破万片。

启望S3是专为大模型推理打造的定制化GPGPU芯片。在典型推理场景里,其整体性价比相较于上一代产品提升超过10倍。从算力与存储设计来看,该芯片支持FP16至FP4精度切换,运用LPDDR6显存方案,显存容量大幅提升4倍。在DeepSeek V3/R1满血版等主流大模型推理过程中,单位Token成本较上一代降低约90%,这一优势有望为相关行业带来显著的成本效益提升。
曦望此次推出启望S3,展现出其在GPU芯片领域的技术实力与创新能力。随着人工智能应用的不断拓展,对推理芯片的性能和成本要求日益提高。启望S3凭借出色的性价比和低单位Token成本,有望在大模型推理市场占据一席之地,推动行业进一步发展。









