2024年5月4日发(作者:)

2020年40期总第532期

ENGLISH ON CAMPUS

英语写作智能评阅系统对比研究

——

以iWrite和批改网为例

文/吴艳华

【摘要】本文介绍了英语写作研究的趋势,概述了国内外英语写作智能评阅系统的现状,客观分析了国内高校使用

【关键词】英语写作;iWrite;批改网

率较高的iWrite和句酷批改网的相似点与不同之处,以期助力广大英语写作教师的教学和研究,提高学生的英语写作能

力。

【作者简介】吴艳华(1982-),女,陕西渭南人,渭南师范学院外国语学院副教授,英语语言文学专业硕士,研究方

【基金项目】本论文为校级横向课题阶段性成果,项目编号:20HX083。

向为英语教学、跨文化交际。

一、引言

英语教师在教学中最难攻克的。写作能力的提高,不仅需要学生

多写,也需要教师精批细改,及时反馈。然而,专门从事写作教

学的师资力量有限,学生不能及时得到反馈,写作训练不足,严

重影响了学生用英语写作的兴趣和写作能力的发展。

写作能力是英语学习五项基本技能中最难提高的一项,也是

纪90年代,美国教育考试服务中心(Educational Testing Service,

简称ETS)的Jill Burstein博士等人开发了E-rater,最初被用于管

理学研究生入学考试(GMAT)“Analytical Writing Assessment”

部分的评分,在2002年申请并在2006年获得专利,是第一个被

应用于大规模社会化考试的AES系统。该系统不仅擅长将学生使

匹配主题关键词来检测文章发展是否跑题。然而,自2006年起,

ETS不再承办GMAT。因此,E-rater已由Vantage Learning研发的

用的语言与数据库中不同分数段文章的语言进行比对,关注学生

的用词和语法,还可以审核学生的文章组织和语言风格,并通过

IntelliMetricTM取代,应用于GMAT的评分。该系统吸取了人工

法语等多语言文本的评价。

二、英语写作研究趋势

育科研”一文中指出,“我们有理由相信,在今后二三十年里,

式、学习模式的变化,教师认知和学生认知都会发生变化,我

北京外国语大学刘润清教授2014年在“大数据时代的外语教

外语教育(可能主要是英语教育)会发生根本性变化。由于教学模

们科研的方向和重点(题目、领域、所跨学科)也会有根本性的改

变。由于计算机技术的高度发达和大数据时代的到来,科研方法

和统计方法也会有根本性的改变。”在进入21世纪后,互联网及

们的生活、学习、工作等都发生了巨大的变化。运用CNKI搜索

显增加,从2003年的两篇增加到了2020年的140篇。由此可见,

越来越多的学者开始关注大数据技术与英语写作研究的结合。

计算机逐渐普及,信息技术及各类电子设备的使用使人们获取信

息的能力大大增强,人类由此进入了大数据时代。大数据使得人

关键词“大学英语写作+大数据”,可以发现,相关文献数量明

智能(AI)、自然语言处理(NLP)和统计技术的优势,不仅能够模拟

国内关于写作自动评阅系统的研究起步较晚。北京外国语大

人工从句法、语义和篇章三个层面给出准确评分,还支持日语、

学梁茂成教授是我国英语作文评分的开拓者,一直专注于该领域

年申请了国家专利,得到了众多业界专家的肯定。随着计算机和

互联网技术的发展,大数据和云计算的运用,英语作文智能评阅

系统的技术也日趋成熟。目前,国内已经商用的在线自动评价系

统有句酷批改网、冰果英语、iWrite、蓝墨英语作文智能批改、

网易有道AI作文批等。

句酷批改网由北京词网科技有限公司研发,在2011年4月开

的研究。其开发的“大规模考试英语作文自动评分系统”于2005

三、国内外英语写作智能评阅系统概况

先开始了自动评分系统(Automated English Scoring, 简称AES)

的研发。1966年,美国杜克大学的 Ellis Page团队开发了世界上

该系统通过分析文章的浅层语言学特征从而对作文进行评分,

的“Knowledge Technology”基于潜在语义分析技术研发了

最早的英语作文评分工具——Project Essay Grader (简称PEG)。

缺点是评分忽视了作文内容维度。1989年,培生(Pearson)旗下

Intelligent Essay Assessor (简称IEA)。该系统从概念相关度和相

关内容的含量将学生的作文与已知写作质量的参考文本进行比

对, 从而给出评分。与PEG相比,它不仅从语法、文体以及写

作机制方面进行评价和反馈,还能评价作文内容的质量。20 世

为了使大规模作文评分更具效率,早在二十世纪美国就率

始展开大规模使用,可以从192个维度对文章进行分析,在1-2秒

内给出评分和评语。冰果英语智能作文评阅系统由浙江大学外国

语言文化与国际交流学院的教授团队携手中外人工智能专家团队

共同研发,包括高中和大学英语写作教学系统,能实时评分、提

供评语,从拼写、词汇、语法、搭配、句型、文风、内容等方面

给出反馈。iWrite英语写作教学与评阅系统由北外梁茂成教授及

其研究团队等与外研社共同设计并研发,在2015年上线,能够从

评和人评有机结合。蓝墨云班课在2018年推出了英语作文智能

语言、内容、篇章结构及技术规范四个维度进行智能评阅,将机

批改引擎,通过机器学习大量英语作文数据和语料,从词汇、语

69

ENGLISH ON CAMPUS

法、拼写、结构、内容关联度、逻辑延展等维度给出评分。2020

年,网易有道词典推出了AI作文批改功能,该功能基于网易有道

在翻译数据上的强大支撑,从10个维度进行评分,并提供评分、

作。

评语和纠错,覆盖了中小学、四六级、托福、雅思等多种英语写

四、iWrite

首先,两者的工作原理都是基于统计分析技术、自然语言处

和批改网的相似点

理、语料库和数据可视化等先进技术,从待测文本中提取特征,

让机器对文本特征与分数之间的关系进行学习,通过比对进行自

动评分,并提供评语和纠错建议。其次,两者的操作界面都简洁

明了,功能模块清晰,便于师生操作。第三、两者都有网页版和

手机操作端(批改网为APP,iWrite为微信公众号),都能从客观

角度来评析学生作文,帮助教师随时随地查看分析数据,帮助学

生纠正词汇、语法和写作规范,增强学生自主学习和完善习作的

能。第四,布置作业时,教师可以使用已有题库,也可以根据学

生实际情况或者教学内容,自主布置,生成自己的题库。两者都

支持学生多次提交,提供不同版本对比,可以进行同伴互评和教

师点评。第五,两者都能对整个班级以及学生个体的错误类型提

供直观的分析数据,便于教师整体把握学生存在问题。此外,学

生作文大数据,还可以助力教师进行进一步的分析和研究。

五、iWrite

1. 班级管理对比。两者都有班级管理功能,都可以创建班级

和批改网的不同点

和编辑班级信息。区别在于:在使用iWrite时,学生名单要提前

由外语教学与研究出版社U校园(unipus)的专业人员提前根据院

校教务处提供的名单信息进行导入,一旦有学生信息有误或者变

更,操作起来费时费力。而批改网只需教师输入班级名称就可以

自动生成班级号,在分享给学生后,学生在手机端APP自行输入

时自行修改。

个人相关信息就可加入班级,一旦学生信息存在问题,学生可及

目标用户群体,可满足大学生日常英语作文练习的需要。目前,

2.写作资源对比。两个写作平台均有题库,以大学生为主要

专业四八级、考研英语、雅思和托福训练,以及外研社出版的

iwrite 题库中的写作考试类型主要是A/B级、大学英语四六级、

新视野、新标准教材写作题,且主要是2006-2018年的真题。目

篇,考研英语65篇。相比之下,批改网的题库资源更为丰富。

前,大学英语四级题库有160篇,六级97篇,专四47篇,专八30

级真题题库分别156和138篇,四六级预测作文分别达987和680

批改网大学英语四六级提供1999至今20余年的题库。四六

篇。专四真题和预测分别为38和251篇,专八真题和预测作文分

别为17和144篇。

能。(1)资源管理可以由教师上传学习资料,也可以直接使用外研

3.特色功能对比。iWrite提供资源管理和续写任务两项功

社平台提供的有关英语写作指导的各种文档资源,便于学生进行

写作方法和技巧的学习。(2)iWrite的续写题库在数量和质量上明

显优于批改网。此任务的设计是基于广州外语外贸大学王初明教

现语言能力的提高。(3)依赖于中国英语联想词库的发展壮大,

授提出的续理论,可以帮助学生在模仿、互动、协同的过程中实

70

2020年40期总第532期

iWrite首创了基于联想词库的内容评价方法,能够有效识别作文

跑题。而批改网的特色在于:(1)题型多样。除了可以进行常用

考试写作题型批改,批改网具有应用文写作、汉译英、论文、朗

读、润色、阅读理解、听写等功能,基本涵盖了目前主要英语考

试的各种题型。(2)抄袭检测功能。在学生提交作文后,批改网能

够以句子为单位,查验该作文是否与本班其他同学作文有内容重

复、与本校学生作文是否有重复、与语料库是否有重复、与互联

网网页内容是否有重复,并提供学生复制率。教师不仅能看到学

生的复制率,还能看到复制来源。(3)进步报告。此功能可以记

录一个学校、一个班级或某个具体学生写作能力的成长过程。报

告有利于学校和教师掌握学校、班级学生总体薄弱点和个体薄弱

点,了解各知识点掌握程度的变化趋势,为学校和教师进行英语

教学的安排提供数据支持。

其题库中主要是写作题型。学生想要练习听力、阅读、写作和翻

4.支撑素材对比。iWrite 和U校园同属外研社开发的产品,

译等题型,必须由学校在购买U校园后再单独购买不同的模块。

购买批改网后,学生不仅可以运用其题库进行听、读、写、译训

练,还能使用同一账号进行实名注册后使用其公司的灯塔分级阅

读小程序。一方面,它具有自主研发的英文难度分级引擎,帮助

学生先测评阅读能力,然后根据自身能力及考试目标选择不同难

度的阅读材料。另一方面,其阅读文章每日更新,不仅有国内主

要英文报纸、媒体的文章,还有国外百余种外刊可供学生阅读。

六、结语

断总结经验,相继研发出许多英语作文智能评阅系统。一方面,

从世界上第一个自动评分系统诞生以来,国内外研究人员不

这些工具的使用能够减少人工评阅的主观性,极大地提高了广大

教师的工作效率,还能够让教师有更多的时间去关注学生作文的

内容、逻辑、结构和思想,为英语写作教学与研究提供了新的思

路和方法;另一方面,能够及时从词汇、语法、内容等方面为学

生提供个性化反馈,帮助学生发现自身存在的问题。但是,我们

也要意识到:自动评分系统终究是辅助教学的工具,其只有人机

结合,多元评价才能有效提高学生的英语写作能力。

参考文献:

[1]白丽芳,王建.近20年英语作文自动反馈有效性研究综述[J].外语

研究,2019(1):65-71,88.

[2]陈长进.作文自动批改系统比较研究[J].科技视界,2013(30):144-

145.

[3]梁茂成,文秋芳.国外作文自动评分系统评述及启示[J].外语电化

教学,2007(10):18-24.

[4]梁茂成.大规模考试英语作文自动评分系统的研制[M].北京:高

等教育出版社,2012.

[5]刘润清.大数据时代的外语教育科研[J].当代外语研究,2014

(7):1-6.

[6]周珊珊.国外语言测试研究热点综述(2010-2015)[J].外语测试与

教学,2018(2):1-14.