维度网讯,智象未来(HiDream.ai)于5月19日举办首届开放日,正式发布基于新一代原生全模态模型架构Unified Transformer(UiT)打造的图像大模型HiDream-O1-Image-Pro,参数规模超过2000亿。公司同时宣布完成新一轮亿级融资,深创投、金浦投资、财鑫资本、复聚资本等多家机构参与,这是智象未来半个月内再次完成融资,此前其刚于4月中旬完成超5亿元规模融资。
HiDream-O1-Image-Pro是智象未来在原生全模态架构路线上的旗舰闭源产品,区别于传统碎片化多模块拼接编码范式,该模型将原始图像像素、离散文本标记和任务条件统一纳入连续共享标记空间,实现图像、文本与多任务条件在底层表征层面的深度融合。这一架构设计使其在通用文生图、高保真文字渲染、多样化场景生成及图像编辑等关键任务中达到行业顶尖水准(SOTA)。此前,采用同架构的HiDream-O1-Image以80亿参数开源版本,在全球独立评测平台Artificial Analysis文生图榜单上登顶开源模型全球第一,表现超过Z-Image Turbo、Qwen-Image、FLUX.2 dev等主流开源模型,并成为该榜单排名前20中公开参数量最小的模型版本。
智象未来创始人兼CEO梅涛在开放日上表示,公司选择原生全模态路径,源于对视觉生成与物理世界结合的长期判断:“当前很多‘多模态大模型’本质上还是‘单模态拼接’。而原生多模态是从一开始就把‘世界的规则’刻进模型里——它知道物理定律、空间关系、因果逻辑,所以它能真正理解世界、推理世界、重构世界,而不只是‘生成内容’。”梅涛认为,原生全模态是实现AGI的必经之路。
智象未来成立于2023年3月,由加拿大工程院外籍院士、原京东集团副总裁梅涛博士创立,关键技术团队中超过90%的成员持有博士学位或硕士学位。公司已构建起“1+1+3”业务架构:HiDream系列底层大模型、HiHarness企业服务平台,以及覆盖商业营销(HiBurst,TikTok官方Top5服务商)、影视创作(“帧赞”,累计制作短漫剧超5000分钟)、社媒创作(vivago,用户规模超4000万)的三大智能体应用。
开放日现场,智象未来与上影新视野基金、蓝色光标、捷成世纪、倍尔健康签署战略合作协议,推动原生全模态大模型在影视、营销、医疗等领域落地。此次发布的HiDream-O1-Image-Pro为闭源版本,超两千亿参数规模充分验证了原生全模态架构范式的巨大可扩展性,公司正加速向图像、视频、文本、音频等多模态统一建模方向迈进。
本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com










