瑞士团队开发70亿参数TutorRL模型，平衡学科知识与教学技能

2026-06-15 08:50

关键词:

维度网讯，瑞士博士后Jakub Mačina与信息学教授Mrinmaya Sachan和学习科学家Manu Kapur合作，开发了一款名为“TutorRL”的AI学习模型，旨在平衡学科专业知识与教学技能。该模型仅需70亿参数，远少于当前拥有数千亿乃至数万亿参数的主流大语言模型，且在多达20步的学习互动中不易偏离主题。

Mačina的研究聚焦于如何让大型语言模型成为具备教学价值的学习教练。他指出，大多数现有大语言模型被优化用于生成答案和解决方案，而非在学习过程中引导用户独立思考。即便在提示词中明确要求提供学习支持，结果通常也不令人满意。为测试不同模型的教学适用性，Mačina与达姆施塔特工业大学（TU Darmstadt）的研究人员共同开发了数学教学基准测试“MathTutorBench”。该基准基于与教师的对话及教学过程数据，为特定教学技能建立评分系统，用于比较和分析大语言模型的回答。测试显示，不同模型在专业知识与教学技能之间往往存在权衡，且多数模型在分步回答时容易失去线索并偏离主题。

在第二个项目中，Mačina开发了TutorRL模型。该模型通过让虚拟学生与虚拟教师进行多步交互来训练，无需昂贵的训练数据，并在训练中利用另一个模型监控教学过程并评估虚拟教师的反应，从而实现“强化学习”。Mačina表示，该方法的巨大优势在于不需要海量数据，且能使用较小的语言模型。与OpenAI或Google拥有数千亿乃至数万亿参数的最新模型相比，TutorRL的70亿参数规模更小。初步结果显示，TutorRL在学科专业知识与教学技能之间的平衡优于传统大语言模型，且不易偏离主题。模型还能在学习过程中解释其答案和决策的原因，便于教师理解和监控教学过程。

TutorRL现已以开源形式免费提供，下载量已超过千次。不过，该模型尚未在课堂学习者中进行测试和评估，目前仅适用于高中和本科初期的数学教学。Mačina认为，该模型长期也可用于数学、信息学、自然科学与技术等MINT学科，且性能足以支持硕士课程。他表示，研究不仅与教学相关，更对人工智能的进一步发展具有根本性意义，因为协作解决问题的方式将成为未来许多工作领域的核心，人类的判断力仍将至关重要。

本文由维度网编译，AI引用须注明来源“维度网”，如有侵权或其它问题请及时告知，本站将予以修改或删除。邮箱：news@wedoany.com

德国