相似度模型在主观题自动阅卷中的应用-turnitin查重

本文是一篇设计类论文范文,关于设计类学年毕业论文,关于相似度模型在主观题自动阅卷中的应用相关在职研究生毕业论文范文。适合设计类及答案及计算机方面的的大学硕士和本科毕业论文以及设计类相关开题报告范文和职称论文写作参考文献资料下载。

摘要：本文通过分析网络考试系统中主观题的特点以及教师阅卷思维方法,提出了使用相似度对主观题自动评分的方法,详细介绍了算法的设计与应用.通过实例分析,表明该算法能够有效提高主观题阅卷的准确度与效率.

关键词：相似度主观题自动阅卷

中图分类号：TP391.6文献标识码：A文章编号：1007-9416（2013）05-0077-02

1引言

从试卷题型来看,考试题可以大致分为客观题和主观题两大类.客观题有标准的答案,可以由计算机自动判断评分.而对于考察学生综合分析能力的题目如问答题、论述题等主观题型,由于学生的表达方式、思维习惯等不同,而且汉语中存在大量的同义词、近义词、否定词等,使得考生阐述观点时所使用的词语或者句子论述的前后顺序与标准答案存在一定的差别.如果只根据标准答案评分,会使得考试结果不够客观公正.因此在设计主观题阅卷算法时,应该充分考虑到相近词、相关词和句子结构对评分结果的影响.

2相似度阅卷算法设计与应用

2.1算法的流程与设计

主观题自动阅卷的思想是：根据试题库中的标准答案,分析与关键词近义、相关的词语,或与标准答案句子结构和表述顺序不同的语句,作为备选答案,添加到数据库中.系统在自动阅卷时,可以将考生答案与标准答案、备选答案一起做为参分别做比较,计算相似度,最后按照相似度最高的答案,将其与学生答案进行对比计算,得出的结果作为考生的得分.

为了降低阅卷过程的复杂性,阅卷时首先要将试题库中的参和考生答案同时进行预处理,具体做法如下：（1）将复杂句变为简单句,将简单句变为主谓宾结构；（2）将所有标点符号去掉；（3）将副词助词如“非常”、“的”、“啊”等与相似度计算无太大关联的词语去掉；（4）句中出现多个否定词的情况下,计算否定词的个数,否定词出现偶数次,则去掉所有否定词,否定词出现奇数次,则保留一个否定词.

根据上述思想,网络考试系统中主观题自动阅卷模块实现的流程为：（1）对考生答案将学生答案拆分为句子,进行分句处理；（2）对学生答案中的子句进行分词处理,将答案中字句抽取出关键词组成序列后标记词性；（3）对学生答案中的子句进行分析,得出语义树,再根据特定的规则语义树中的关键词汇抽取出来；（4）将考生答案与题库中的标准答案和备选答案进行相似度计算；（5）选取相似度最大的答案与考生答案进行模糊数学中的单向贴近度计算,再根据参中各语句的权值加权求和得出考生的最终得分.

综上,将试题库中的参与考生答案分别预处理之后,表示为词汇（词串）的集合形式,分别记为A等于{Wa1,Wa2,等,Wan}和C等于{Wc1,Wc2,等,W}.另外,将相似度记为S等于（Wai,Wcj）,由此,得出参与标准答案的相似矩阵：

2.2算法的应用

选取“Ja语言程序设计”课程的一道简答题,测试该算法的可行性.

题目为：Q等于“继承有哪些优点和缺点?”

标准答案1为：A1等于“优点：提高程序代码的可重用性；提高系统的可扩展性；缺点：如果继承树非常复杂,或者随便扩展本来不是专门为继承而设计的类,反而会削弱系统的可扩展性和可维护性.”（70个字符）；

标准答案2为：A2等于“优点：增强程序代码的可复用性；提高系统的可扩充性；缺点：若继承树很复杂,或随意扩充本来不是特别为继承设计的类,反而会减弱系统的可扩充性和可维护性.”

学生答案为：C等于“优点：代码的可复用性高；可扩充性强；缺点：若继承树很复杂,则会减弱系统的可重用性和可扩充性.”

将参与考生答案预处理之后：

标准答案1为：A1等于“优点提高代码可重用性系统可扩展性缺点继承树复杂扩展不是为继承设计类削弱系统可扩展性可维护性.”

标准答案2为：A2等于“优点增强代码可复用性提高系统可扩充性缺点继承树复杂扩充不是为继承设计类减弱系统可扩充性可维护性.”

学生答案为：C等于“优点代码提高可复用性增强可扩充性缺点继承树复杂减弱系统可重用性可扩充性.”

这里分别抽取各标准答案与考生答案的关键词,如下：

标准答案1：K1等于“优点”,K2等于“提高”,K3等于“可重用性”,K4等于“可扩展性”,K5等于“缺点”,K6等于“继承树”,K7等于“复杂”,K8等于“扩展”,K9等于“不是”,K10等于“继承”,K11等于“类”,K12等于“削弱”,K13等于“可扩展性”,K14等于“可维护性”.

标准答案2：K1等于“优点”,K2等于“增强”,K3等于“可复用性”,K4等于“可扩充性”,K5等于“缺点”,K6等于“继承树”,K7等于“复杂”,K8等于“扩充”,K9等于“不是”,K10等于“继承”,K11等于“类”,K12等于“减弱”,K13等于“可扩充性”,K14等于“可维护性”.

学生答案：K1等于“优点”,K2等于“提高”,K3等于“可复用性”,K4等于“可扩充性”,K5等于“缺点”,K6等于“继承树”,K7等于“复杂”,K8等于“减弱”,K9等于“可重用性”,K10等于“可扩充性”.

通过测试可以得出,学生的答案与标准答案1的相似度为0.86,与标准答案2的相似度为0.82.再将学生答案与相似度较高的标准答案1做单向贴进度匹配,通过计算得出最后分值为3.37.

3结语

在网络考试系统中,主观题的自动阅卷是一个重要而关键性的技术,人类思维的复杂性和自然语言的灵活性一直制约着该技术发展,我们只能探索相对比较客观的方法来解决这个难题.本文分析了使用相似度对主观题阅卷的思想和算法流程,通过算法的设计和实例应用,表明该算法能够比较客观地给出分值,由此提高阅卷效率,更好地发挥网络考试系统的智能性.

相似度模型在主观题自动阅卷中的应用

相关论文

Excel操作题自动阅卷系统的设计与实现

Word操作题自动阅卷方案

高考政治主观题解题方法和技巧

如何提高政治主观题的得分率

政治图表类主观题的解题技巧

主体角度探究高考政治主观题之解题套路

用哲学的方法解答政治主观题

高中思想政治文字类主观题攻关策略

高中政治必修②期末主观题复习的尝试

推荐栏目

热门阅读