Inception是一家位于帕洛阿尔托的新兴企业,由斯坦福大学计算机科学教授Stefano Ermon创立。该公司最近宣布开发一种基于扩散技术的AI模型,称为扩散大型语言模型(DLM)。生成式AI目前主要分为两类:基于变压器架构的大型语言模型(LLM)擅长文本生成,并驱动Midjourney和OpenAI Sora等系统的扩散模型则聚焦于图像、视频和音频创作。Inception的DLM融合了LLM的传统功能,如代码生成提升和问答,同时显着性能并降低计算成本。

Ermon在接受TechCrunch采访时表示,他多年来在斯坦福实验室研究将扩散技术评估文本生成。传统LLM按顺序生成文本,每个单词需要依赖前词完成,速度设定。而扩散模型从粗略数据启动,通过一次处理一次性优化整体输出。Ermon思考利用这一功能来生成和调整大段文本。经过多年的努力,他与学生在去年发表的论文中详述了这一突破。随后,他创立了Inception,联合加州大学洛杉矶分校教授Aditya格罗弗和康奈尔大学教授Volodymyr Kuleshov推动技术化。虽然未透露融资细节,但TechCrunch获悉梅菲尔德基金已参与投资。
Inception已包含财富100强企业的客户,满足对低延迟和高速度的需求。Ermon指出,DLM能够更高效地利用GPU,这将导致语言模型开发模式。公司提供API、本地及边缘选项,并支持模型声明。其DLM则要求运行速度比传统LLM快10倍,成本缺乏十分之一。接下来提出,小型编码模型性能堪比OpenAI的GPT-4o mini,速度超其10倍;迷你模型超越Meta的Llama 3.1 8B,每秒处理超过1000个令牌。若数据属实,这个速度表现颇为亮眼。









