论文查重 | 论文文献库 | 国内常用论文检测系统论文检测结果的差异性分析

毕业论文是对学生大学四年在校学习、 实践等专业 知识学习的综合考核 。 为了端正学生毕业论文的撰写态 度,督促学生保质保量地完成毕业论文,南京邮电大学通 达学院图书馆(以下简称“我馆”)开通论文查重检测系 统对2016级毕业生的论文进行相似度检测 。 我馆开通试 用的是大雅论文查重检测系统(以下简称“大雅检测系 统”)和维普论文查重系统(大学生版)(以下简称 “维普检 测系统 ”)。 笔者选取40篇毕业生的论文在维普 、大雅论 文相似度检测系统中进行检测 , 对 检 测 结 果 进 行 了比 较分析。
1.论文样本选择与比较方法
1.1论文样本选择
从参与论文相似度检测的同学中选取40位同学的论 文,其中20篇选取理工科方向的通信工程、计算机科学与技 术、软件工程、微电子工程、信息工程等专业学生的毕业论 文,另外20篇选取文科方向的市场营销、物流管理、英语、电 子商务等专业学生的毕业论文。
1.2比较方法
(1)先使用大雅检测系统和维普检测系统对选取的40 篇毕业论文进行检测, 检测结果按照理工科组和文科组分 别记录;
(2)理工科组和文科组分别记录大雅检测系统 、维普 检测系统检测的论文相似度及两个检测系统检测结果差, 结果差采用大雅检测系统检测结果减去维普检测系统检 测结果;
(3)对每组的20条结果差进行分析,分别以5条、10条、15 条、20条数组统计结果差的平均值;
2.结果比较
分别对理工科、文科两组的检测结果差进行比较。
2.1理工科组比较结果
2.1.1两个检测系统相似度检测结果比较
通过大雅、维普检测系统检测理工科组20篇论文发现, 相同论文的检测结果存在差异, 使用大雅检测结果减去维普检测结果,相似比差异最高为-30.04%,最低为0.55%,具 体结果如表1、图1所示。
图1 理工科组两个检测系统相似度检测结果比较
2.1.2两个检测系统相似度结果差分段比较
对20条结果差进行分段求和, 首先计算前五条结果 差之和 ,然后分别计算前5组 、前10组 、15组 、20组结果差 之和,结果取绝对值,保留两位小数。 具体结果如表2、图2 所示。
表2 理工科组两个检测系统相似度检测结果分段误差
图2 理工科组两个检测系统检测结果分段误差
2.2文科科组比较结果
2.2.1两检测系统相似度检测结果比较
通过大雅、维普检测系统检测文科组20篇论文发现,相 同论文的检测结果存在差异, 使用大雅检测结果减去维普 检测结果,相似比差异最高为-53.07%,最低为1.68%,具体 结果如表3、图3所示。
表3 文科科组大雅检测系统与维普检测系统误差率
图3 文科组两个检测系统相似度检测结果比较
2.1.2两检测系统相似度结果差分段比较
从图3可以看出文科组论文在两个检测系统检测的结 果误差较大, 对文科组20条数据结果差分别按照5组、10 组、15组、20组记录进行分段求和 ,不取绝对值,具体结果 表4所示。
表4 文科组两个检测系统相似度检测结果分段平均误差
2.3结果分析讨论
通过大雅和维普检测系统对文理科两组数据的比较,可以发现每一篇论文在不同的检测系统的相似度比都有一 定差异,只是差异高低不同而已。
2.3.1理工科组比较结果分析
从表1、 图1可以看出, 两个检测系统结果差最高为- 30.04%,最低为0.55%,同一篇文章大雅检测相似度高于维 普的9篇,反之维普检测相似度高于大雅的11篇。 从表2、图2 可以看出,分段求结果之和,随着样本数的增加,两个检测 系统相似度差异逐渐缩小。 说明两个检测系统对不同论文 的检测都有相似比高于或低于另外一个检测系统的情况, 随着检测样本数的增加, 两个检测系统相似度高于或低于 对方的情况趋于对等。
2.3.2文科组比较结果分析
从表3、图3可以看出,文科组两个检测系统检测结果差 最高为-53.07%,最低为1.68%,同一篇文章大雅检测相似度 高于维普的4篇,反之维普检测相似度高于大雅的16篇。 在 文科组维普检测的相似比明显高于大雅检测系统。 从表4可 以看出,分段求结果差求和,结果没有取绝对值,可以看出 大雅检测系统检测的相似比都是低于维普检测系统的,随 着样本数的增加使得差异更明显。
3.结果差异原因
为何两个检测系统对同一篇文章的检测结果会存在这 样的差异呢? 我们对两个检测系统及差异比较明显的文章 进行了分析。
3.1检测的资源种类与数量不同
大雅检测系统和维普检测系统拥有各自的资源对比数 据库, 它们的资源对比数据涵盖的资源种类和数量是有差 异的,两个检测系统资源涵盖情况详见表5。
从表5可以清晰看出大雅检测系统和维普检系统检测 论文相似度所对比的数据库资源的种类及数量。 维普检测 系统在期刊、 学位论文资源方面的数量是高于大雅检测系 统的,大雅检测系统相比于维普检测系统最明显的优势是 拥有中文图书对比资源。
3.2论文参考的文献类型影响相似比
对文理科40篇毕业论文在大雅和维普两检测系统中进 行检测,结果从图1、图3可以看出同一篇论文在不同的检测 系统的相似比都是有或多或少的差异。 在表1、表3中我们可 以看到同一篇论文检测, 理工科组大雅检测的相似比低于 维普检测的结果达到30.04%, 相似比高于维普检测的结果 为29.75%; 文科组大雅检测的相似比低于维普检测的结果达到53.07%,相似比高于维普检测的结果为26.76%;从最高 差异来看,理科组两个检测系统的结果差比较接近,文科组 大雅检测的最高结果差明显高于维普检测系统。
笔者与论文在两个系统检测结果差异较大的学生就其 所参考的文献类型做了简单的交流, 从与学生的交流中获 知, 在大雅检测系统检测相似比较高的学生多数是偏重参 考一些电子图书、杂志报纸等网络资源,而在维普检测系统 检测相似比较高的学生偏重于参考的是CNKI、 维普期刊数 据的期刊、学位论文等。
从表2、图2可以得出随着检测样本数的增加,理工科组 大雅检测系统和维普检测系统两者检测的相似比结果差逐 渐接近。 而文科组随着检测样本数的增加,结果差异更趋于 明显, 维普检测系统在文科组的检测结果明显高于大雅检 测系统。 分析文科组的论文, 我校文科专业主要有电子商 务、市场营销、物流管理,学生的毕业论文多数是以实际的 电子商务平台或者营销案例为主,如淘宝、京东、小米手机 营销等, 这些方面的写作材料, 学生需要参考一些最新数 据,一般以期刊论文、网络资源为主。 在文科组的相似度检 测对比中, 拥有期刊数量较多的维普检测系统的检测结果 明显高于大雅检测系统。
4.论文相似度检测的困惑
不同的论文检测数据库涵盖的资源对比库都不同,一 些数据库平台会与电子杂志社签署独家授权的期刊,独家 授权就是通过合法许可 ,授权给被授权方 (合法的数字出 版商 )独家使用 ,未经期刊与被授权方同意 ,他人无权使 用。 这样就造成国内没有一家相似度对比数据是全面的, 不存在任何一家论文相似度检测系统的检测结果是最权 威的。
目前国内大多数的论文相似度检测数据库主要有期 刊、 学位论文等资源的相似度对比, 而没有图书资源的对 比。 大雅相似度检测数据库就有相似图书的检测,但是对于 学术期刊的对比就不如维普、CNKI全面。 那么我们在做学术 科研论文、学生毕业论文相似度检测时,到底需不需要重视 与电子图书的对比呢? 论文相似度检测系统的选择标准是 什么呢?
学生在毕业论文检测过程中会根据学校选择的相似度 检测系统调整自己的参考文献类型, 学生可能会花很多心 思了解该检测系统的对比资源库的特点, 想方设法降低自 己论文在该检测系统中的相似比, 显然仅通过某一个检测 系统检测的相似比判断是否抄袭是有局限的。
5.结语
在国内论文相似度检测系统众多, 又没有统一标准对 比数据库的情况下, 指定任何一个系统作为标准进行论文 相似检测都无法真正做到公平公正。 高校该选择何种论文 相似度检测系统是需要根据实际综合考虑的。 理想状态是 政府科研管理部门能够出面筹建资源对比库涵盖所有数字 资源的相似度检测系统,统一论文相似度检测标准。 如果没 有统一的检测数据库, 就需要使用不同的检测平台进行检 测,并结合人工评价进行综合评判,从而才能更好地检测毕 业论文的质量。

相关文章:基于论文检测角度的本科生毕业论文抄袭情况分析