Inception推出基于扩散技术的新型人工智能模型

2025-02-27 10:12

关键词:

Inception是一家位于帕洛阿尔托的新兴企业，由斯坦福大学计算机科学教授Stefano Ermon创立。该公司最近宣布开发一种基于扩散技术的AI模型，称为扩散大型语言模型(DLM)。生成式AI目前主要分为两类：基于变压器架构的大型语言模型(LLM)擅长文本生成，并驱动Midjourney和OpenAI Sora等系统的扩散模型则聚焦于图像、视频和音频创作。Inception的DLM融合了LLM的传统功能，如代码生成提升和问答，同时显着性能并降低计算成本。

Ermon在接受TechCrunch采访时表示，他多年来在斯坦福实验室研究将扩散技术评估文本生成。传统LLM按顺序生成文本，每个单词需要依赖前词完成，速度设定。而扩散模型从粗略数据启动，通过一次处理一次性优化整体输出。Ermon思考利用这一功能来生成和调整大段文本。经过多年的努力，他与学生在去年发表的论文中详述了这一突破。随后，他创立了Inception，联合加州大学洛杉矶分校教授Aditya格罗弗和康奈尔大学教授Volodymyr Kuleshov推动技术化。虽然未透露融资细节，但TechCrunch获悉梅菲尔德基金已参与投资。

Inception已包含财富100强企业的客户，满足对低延迟和高速度的需求。Ermon指出，DLM能够更高效地利用GPU，这将导致语言模型开发模式。公司提供API、本地及边缘选项，并支持模型声明。其DLM则要求运行速度比传统LLM快10倍，成本缺乏十分之一。接下来提出，小型编码模型性能堪比OpenAI的GPT-4o mini，速度超其10倍;迷你模型超越Meta的Llama 3.1 8B，每秒处理超过1000个令牌。若数据属实，这个速度表现颇为亮眼。

美国