在DeepSeek-R1的颠覆性首次亮相之后,推理模型在2025年成为焦点。IBM也加入了这一行列,推出了Granite 3.2大型语言模型(LLM)系列。与DeepSeek-R1或OpenAI的o3等其他推理方法不同,IBM将推理深度嵌入到其核心开源Granite模型中,采用了一种称为条件推理的方法。这种方法允许用户通过标志动态激活推理功能,从而在需要时使用更密集的处理能力。

Granite 3.2的推理功能建立在2024年12月发布的Granite 3.1 LLM的性能提升之上。此外,IBM还推出了一个新的视觉模型,专门针对文档处理进行了优化,特别适用于数字化遗留文档,这是许多大型组织面临的挑战。
推理能力为企业AI带来的价值
虽然2025年推理模型备受关注,但IBM强调,推理本身并不一定为企业用户提供直接价值。Granite 3.2中的推理功能通过强化学习训练,能够改进复杂的决策过程,适用于软件工程任务、IT问题解决和其他代理工作流。IBM声称,通过启用推理功能,Granite 3.2在指令跟踪任务上优于包括DeepSeek-R1在内的竞争对手。
条件推理的灵活性
Granite 3.2的关键创新之一是条件推理功能,允许开发人员动态激活或停用模型的推理功能。这种灵活性使用户能够根据具体任务在分析速度和深度之间取得平衡。IBM还采用了Red Hat业务部门开发的“粒子过滤器”方法,使模型能够动态控制和管理多个推理线程,从而提供更加灵活和适应性强的推理过程。
解决企业文档挑战
Granite 3.2的视觉模型专注于文档处理,特别适用于处理企业档案中的旧扫描文档。这些文档通常包含图表、数字和表格,通用多模态模型在处理这些结构化文档时往往遇到困难。IBM的视觉模型在DocVQA和ChartQA等企业基准测试中表现出色,显示出与竞争对手相比的强劲结果。
时间序列预测满足业务需求
Granite 3.2还引入了“微型时间混合器”(TTM),这是一个基于transformer的专用模型,专为时间序列预测而设计。时间序列预测在财务预测、设备维护调度和异常检测等方面具有关键业务需求。Granite TTM模型将LLM的架构创新应用于时间序列预测,帮助企业根据历史模式预测未来值。
以企业为中心的实用AI方法
IBM对企业AI采取了实用主义的方法,专注于解决实际问题,而不是追求基准分数。Cox强调,IBM的目标是构建真实、实用的工具,使企业能够轻松完成实际工作。Granite 3.2的推出标志着IBM在生成式AI领域的进一步创新,旨在为企业提供更强大的AI解决方案。









