语言测试是语言教学中不可或缺的组成部分,也是外语教育工作者一直关心的重要议题。近年来,在教育信息化、远程教育等背景下,信息技术对外语教育的影响越发显著。信息技术在改变传统的课程体系和教学模式的同时,也对语言测试的形式和方法产生了诸多影响。
信息技术的发展给语言测试带来了新变化,也对语言测试研究方法提出了新要求。在大数据背景下,越来越多的语言测试学者尝试运用数据挖掘技术研究语言测试问题。为方便读者了解数据挖掘技术应用于语言测试研究的现状,在汉斯出版社《国外英语考试教学与研究》期刊中,有论文首先介绍数据挖掘的概念、任务以及数据挖掘过程,然后按主题分类讨论数据挖掘技术在语言测试研究中的应用,最后对大数据时代背景下数据挖掘技术应用于语言测试研究的未来进行展望。
语言测试研究中对数据挖掘技术的应用尚处于探索阶段,研究文献数量相对较少,且主要集中于近几年。笔者以“数据挖掘+语言测试”、“数据挖掘+题目难度/文本难度”、“算法+语言测试/语言教学”、“人工智能+教育/教育测量/语言测试”等为关键词进行大范围搜索,然后逐篇筛选,最终得到26篇最相关的符合要求的文献。文献来源主要有:语言测试期刊和教育测量期刊、大规模考试研究报告、数据库等。按研究主题可以将文献分为五类,分别是成绩预测、语言知识与语言技能的关系、题目难度预测、评分员行为研究和写作测试。
上述五个方面的研究,对语言测试具有理论、方法和实践意义。理论上,上述研究在某种程度上均能为语言测试的效度验证,尤其是为构念效度和评分效度提供证据。方法上,研究中多种数据挖掘技术的应用,尤其是非线性模型如神经网络模型、决策树模型、逻辑回归模型等,表明在语言测试领域,应根据数据的真实情况选择合适的数据分析方法,当自变量与因变量呈非线性关系且自变量之间存在交互影响时,采用非线性的模型有助于得出更准确的结论。实践上,成绩预测能够及早发现可能挂科或学习困难的学生,进行教学干预;题目难度预测能发现与题目难度有关的因素,在开发试题时可以通过调控这些因素合理控制试题难度等。
值得注意的是,数据挖掘技术应用于语言测试研究时仍存在不足。数据挖掘只是对数据进行描述和预测,即揭示变量间隐藏的关系,它不能发现变量间的因果关系。以题目难度预测为例,数据挖掘技术只是挖掘出了和题目难度有关联的因素,而不能证明正是这些因素决定了题目难度。数据挖掘技术属于工程领域,其**************的是模型的最优化,而语言测试研究需要探究问题背后的教育学和社会学因素,最终服务于语言测试效度的提升,更好地满足考生、用人单位以及其他利益相关者的需求。因此,将数据挖掘技术应用于语言测试研究时,需要做一些适应性的改变,使之更好地服务于语言测试研究,如减少特征个数使模型更容易解释。
综上可知,数据挖掘技术已经应用于研究诸多语言测试问题,并取得了一定成果。然而除上述五个方面的研究外,更多主题,如测试的社会公平性、教师测评素养等尚待开展。更多语言测试数据有待挖掘,如论坛或贴吧上关于备考和考试的讨论以及经验贴等数据、相关的考试政策和文件、历年考试真题、考生关于备考的日志或学习记录等。其他数据挖掘技术有待尝试,如时间序列分析、关联规则挖掘、异常检测等。数据挖掘技术以高效处理海量数据,并从中发现隐藏的规律和模式见长,在未来的语言测试研究中,将发挥更大的作用和价值。