联想自研OCR:智慧阅卷显神通
随着2020年全国各省市高考成绩相继揭榜,广大应届生及家长们一颗悬着的心终于落地了。据教育部统计数据显示,2020年全国共约1071万人报名参加高考,而以全国卷为例,将会产生约4284万份试卷。除去运输、校对、试卷扫描、统计分数等花费的时间,负责阅卷的老师们需要在不足15天的时间对如此海量的高考试卷进行批改、录入,并发布成绩,这个工作量仅靠人工几乎是不可能完成的。
其实早在1999年,部分省市就率先实行了客观题的网上批阅,利用机器帮助老师提高阅卷效率(如使用答题卡)。至2004年,教育部积极推广高考网上阅卷。如今,高考试卷主观题部分早已使用机器扫描、自动切题的方式,协助教师进行批阅了。
虽然高考的阅卷系统是机密的,但是类似的阅卷技术早已在学校日常教学中予以应用。那么,这背后究竟是什么样的技术呢?一起来看看联想研究院自研的OCR(OpticalCharacterRecognition,即光学字符识别)智慧阅卷系统,到底有哪些神通?
阅卷系统中的OCR技术
说起OCR技术,相信很多人已经对此不再陌生。这是文字识别技术,可将纸面上的文字灰度变换成电信号,输入到计算机中去。据介绍,教师将试卷扫描上传后,智慧阅卷系统便可以利用OCR技术对扫描结果进行处理:
首先,对扫描的图片进行处理来增强图片的可读性。系统会先将照片中的试卷部分内容进行提取,去除背景,然后对图像进行噪声点去除、光照修正,以及背景净化,从而提升图像的可读性,为下一步处理做准备。
然后,系统对试卷文本进行分析,提取试卷内容的有效部分。系统通过对试卷的整体布局进行分析,分离出题目的区域,进行题目切分,提取出每道题目的具体区域,从而完成试题切割。
类似的技术,如果应用在高考阅卷中,那么一张学生作答后的纸质试卷,经过扫描、上传后便可以被系统按照每道题目切割出对应的作答区域,送至相应题目的阅卷教师手中,这样将极大地节省老师们翻卷子找题目的时间。
阅卷系统中的AES技术
客观题可以借助答题卡,采用机器阅卷,那么主观题呢?比如关于作文的批改。如果,不论中英文,系统能在人工阅卷前,就能先行分析出作文的基本信息,比如作文字数是否达标,中文使用的成语、修辞手法等数量,英文单词拼写是否有误等,那么将能极大地为阅卷老师提供便利和参考。
联想研究院的智慧阅卷系统就加入了AES(AutomatedEssayScoring,即作文自动评分)技术,能够利用自然语言处理和机器学习技术来帮助老师进行作文批阅。
系统通过文本分类、词汇分类、句法标注等自然语言处理技术,能够辅助阅卷教师检测作文是否存在跑题、语法错误等问题,并自动生成评语供阅卷教师参考,在一定程度上帮助了作文阅卷教师“预”阅卷,有效提高阅卷效率。
基于AI的错题集
除了阅卷场景,在日常教学和学习中,智慧阅卷系统还支持帮助教师统计学生错题并进行学情分析,以及帮助学生整理错题并助力巩固练习。
在教师端,教师对学生已完成作答的纸质试卷批改完毕后,可将试卷拍摄(或扫描)成图像。系统通过人工智能算法自动对卷面布局及教师批改进行分析,检测每道试题位置及教师批阅符号,随后自动完成卷面分数统计、错题提取、考情分析等功能。
在日常的教学中,系统可以帮助教师进行全班的错题分布情况统计,帮助教师轻松找到全班的薄弱题目,教师授课时可有的放矢地讲解;同时,教师还可以选择本次考试的错题组成错题集,用错题重新组一张试卷,帮助同学们重点巩固练习。
而在学生端,学生可以在日常学习中将自己做错的题目进行拍摄、上传,系统将自动收录进个人错题本中,为学生节约整理时间;同时,系统还支持“巩固练习”功能,利用AI技术自动为学生推荐与错题相同知识点的相似题型试题,帮助学生实现薄弱知识点的“举一反三”。
高考阅卷,从人工到电脑协助,再到人工智能高科技辅助,这与智慧教育的发展趋势是一脉相承的。联想研究院智慧教育实验室相关负责人表示,将不断创新与变革智慧教育,努力打造更多更优秀的产品,为教育事业助力赋能。