在学术和职业领域,有效的英语口语沟通能力一直是成功的关键因素。传统上,英语口语能力的评估依赖于繁琐且昂贵的人工测试。然而,随着人工智能和机器学习技术的进步,自动化英语口语评估测试正逐渐受到研究人员的青睐。

尽管基于独白的口语评估方法广泛存在,但它们在现实世界的实用性上存在局限,尤其是在对话或小组互动场景中。为了克服这一挑战,由冈田翔吾教授领导的研究团队,携手日本先端科学技术大学院大学助理教授Candy-Olivia Mawalim等人,开发了一种多输出学习框架,用于同时评估英语口语能力的多个方面。
研究团队利用了一个新颖的口语英语评估数据集,该数据集包含来自青少年开放式高风险访谈的同步音频、视频和文本记录。这些记录由Vericant的真实服务收集,并整合了美国教育考试服务中心监督的专家评分。Mawalim博士表示:“我们的框架能够建模和整合口语能力的各个方面,加深对潜在因素的理解。通过融入开放式访谈,我们可以评估个人的自发和创造性沟通能力。”
该多输出学习框架整合了声学特征、视觉线索和语言模式,显著提高了预测准确率。使用轻梯度提升机算法,SEE分数的整体预测准确率达到了约83%。冈田教授指出,这一研究成果不仅为学生提供了提高英语口语水平的建议,还能帮助教师根据学生需求定制教学方案。
此外,研究团队还探讨了话语序列对英语口语水平的重要性,并评估了面试官行为和面试环境等外部因素的影响。他们的分析表明,面试官的言语、性别以及面试环境等因素会显著影响受访者的回答连贯性。
随着人工智能技术的不断发展,多模式评估有望在教育领域成为标准。Mawalim博士表示:“这可以为学生提供量身定制的课程和教学方法,帮助他们更有效地磨练和发展关键的软技能。”
总的来说,这项研究为自动化英语口语评估提供了一种更细致入微、更易于解释的方法,为开发以学生为中心的智能工具奠定了基础。
更多信息: Candy Olivia Mawalim 等,《超越准确性:青少年结构化口语技能指标的多模态建模》,《计算机与教育:人工智能》(2025)。













京公网安备 11010802043282号