维度网讯,瑞士博士后Jakub Mačina与信息学教授Mrinmaya Sachan和学习科学家Manu Kapur合作,开发了一款名为“TutorRL”的AI学习模型,旨在平衡学科专业知识与教学技能。该模型仅需70亿参数,远少于当前拥有数千亿乃至数万亿参数的主流大语言模型,且在多达20步的学习互动中不易偏离主题。

Mačina的研究聚焦于如何让大型语言模型成为具备教学价值的学习教练。他指出,大多数现有大语言模型被优化用于生成答案和解决方案,而非在学习过程中引导用户独立思考。即便在提示词中明确要求提供学习支持,结果通常也不令人满意。为测试不同模型的教学适用性,Mačina与达姆施塔特工业大学(TU Darmstadt)的研究人员共同开发了数学教学基准测试“MathTutorBench”。该基准基于与教师的对话及教学过程数据,为特定教学技能建立评分系统,用于比较和分析大语言模型的回答。测试显示,不同模型在专业知识与教学技能之间往往存在权衡,且多数模型在分步回答时容易失去线索并偏离主题。
在第二个项目中,Mačina开发了TutorRL模型。该模型通过让虚拟学生与虚拟教师进行多步交互来训练,无需昂贵的训练数据,并在训练中利用另一个模型监控教学过程并评估虚拟教师的反应,从而实现“强化学习”。Mačina表示,该方法的巨大优势在于不需要海量数据,且能使用较小的语言模型。与OpenAI或Google拥有数千亿乃至数万亿参数的最新模型相比,TutorRL的70亿参数规模更小。初步结果显示,TutorRL在学科专业知识与教学技能之间的平衡优于传统大语言模型,且不易偏离主题。模型还能在学习过程中解释其答案和决策的原因,便于教师理解和监控教学过程。
TutorRL现已以开源形式免费提供,下载量已超过千次。不过,该模型尚未在课堂学习者中进行测试和评估,目前仅适用于高中和本科初期的数学教学。Mačina认为,该模型长期也可用于数学、信息学、自然科学与技术等MINT学科,且性能足以支持硕士课程。他表示,研究不仅与教学相关,更对人工智能的进一步发展具有根本性意义,因为协作解决问题的方式将成为未来许多工作领域的核心,人类的判断力仍将至关重要。
本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com









