论文查重 | 论文文献库 | “学位论文学术不端行为检测系统”在北京农学院的应用与实践

学术不端行为,即指在学术论文和科学研究过程中 出现的抄袭、剽窃、弄虚作假、违背科学共同体行为规 范或其它违背公共行为准则的行为。现有主要的学术不 端行为大致分为以下这四类:抄袭、伪造、篡改及其他。 “其他”主要包括不当署名、一稿多投、一个学术科研 成果多篇发表等学术不端行为。
1 引入学术不端行为检测的必要性与紧 迫性
近些年来研究生学位论文抄袭、剽窃、弄虚作假事 件屡见不鲜,这一现象已引起了国家教育部门和全社会 的广泛关注。研究生的学位论文作为研究生申请相应学 位的重要依据,是研究生学习和科研能力的综合表现, 对研究生科研能力的提高、严谨求实学术作风的养成起 着相当重要的作用。
根 据《 国 家 中 长 期 教 育 改 革 和 发 展 规 划 纲 要 (2010-2020 年)》的总体要求,教育部在《深化教育 体制改革工作重点》一文中指出:高等学校应该完善以 质量和贡献为导向的学术评价机制,探索建立学术不端 行为监督、查处机制。在《教育部关于严肃处理高等 学校科研不端行为的通知》文件中明确指出,高等学 校对学术不端行为必须严肃处理,并且高等学校对本 校有关机构或者个人的学术不端行为的查处负有直接 责任。
2 学位论文学术不端行为检测系统概述
学位论文学术不端行为检测系统以《中国学术文献 网络出版总库》作为全文比对资源库,对抄袭、剽窃、 伪造、篡改等学术不端行为进行论文查重。其系统示意图如 图 1 所示。
学术不端检测系统检测的主要目的是辅助各研究生 培养单位对研究生学位论文质量进行相应的评估,为审查论文提供技术服务。检测系统在对论文进行检测之后, 生成检测报告,为判断论文性质提供相关依据。
2.1 学术不端检测系统主要检测参考指标
学术不端检测系统设有总检测指标和子检测指标二 部分指标体系,涉及重合字数、文字复制比、首(尾) 部复制比等多项内容,从多个角度对学位论文中的文字 复制情况进行详细描述,根据指标参数以及其他数据相 关信息,自动给出预判的诊断类型并生成检测报告。
(1)总检测指标:从整体情况描述了论文的检测情 况,便于快速了解该论文总的检测情况。包括总重合字 数、总文字复制比、总文字数、疑似章节数、总章节数、 首部重合文字数、尾部重合文字数等几个检测指标。
(2)子检测指标:对于一篇学位论文来说,每一章 的内容各异,重点也不一样,其核心工作内容一般主要 存在某几章中,子检测指标从多个角度反映了检测文献 的检测情况,可以让用户迅速了解每一章节的检测情况, 便于用户进行针对性审核。子检测指标包括文字复制比、 重合字数、最大段长、平均段长、段落数、段文字比、 首部复制比、尾部复制比、引用复制比等几个指标。
2.2 学术不端检测系统检测流程及结果说明
注册用户可在权限范围内查看本单位已被 CNKI 正 式收录论文的检测结果,其流程如图 2 所示。
对于检测出的结果,系统通过量化的数字作为对学 术不端程度的认定:
(1)轻度:重合字数大于 1000 字或文字复制比小于 40%。
(2)中度:重合字数大于 5000 字或文字复制比大于 等于 40% 小于 50%。
(3)重度:重合字数大于 10000 字或文字复制比大 于等于 50%。
(注:重合百分比即文字复制比。)
3 学术不端检测系统在北京农学院研究生论文检测中的应用
利用学术不端检测系统,对北京农学院 2010 年毕业 的 89 名硕士研究生提交的毕业论文进行了检测。以下是 对检测结果的对比分析。
3.1 总文字复制比
在检测的 89 篇论文中,有 55 名研究生在撰写硕士 论文前,已经在《北京农学院学报》或其他公开刊物上 发表了与自己硕士论文相关的论文,绝大多数是第一作 者,有少数研究生是第二作者或以后,也有研究生发 表了两篇以上与自己硕士论文相关的论文。在上表的 总文字复制比的篇数统计中,在论文中参考了作者本 人所有署名文献的这部分文字不在总文字复制比的计 算中。
按照系统对抄袭程度的判定,在检测的 89 篇论文 中,无抄袭的(总文字复制比为 0)1 篇,占 1.1%;属 轻度抄袭的(总文字复制比< 40%)78 篇,占 87.6%; 属中度抄袭的(40% ≤总文字复制比< 50%)5 篇,占 5.6%;属重度抄袭的(总文字复制比≥ 50%)5 篇,占 5.6%。
北京农学院 2010 年 6 篇优秀硕士论文,总文字复 制比分别为 5%、11%、16%、19%、20%、33%。其中, 总文字复制比< 20% 的占 67%,20% ≤总文字复制比 < 40% 的占 33%,说明这 6 篇优秀论文的质量还是比较 高的。
3.2 其他检测指标分析
(1)在 89 篇论文中,各章节文字复制比有所不同, 普遍是论文的绪论和综述部分文字复制比较高,多数在 50% 以上,个别高达 90%;在一些试验性很强的论文中, 试验材料和方法的文字复制比也较高;此外,有些论文 的结论部分也存在高达 50% 的文字复制比。
(2)在检测的 89 篇论文中,由于论文格式的不统一, 系统有时不能自动去除如“独创性声明”、“关于论文使 用授权的说明”、“致谢”、“参考文献”等,导致这些部分的文字也被检测出重合,只是这部分文字与整篇论文 相比,比重较小。
3.3 存在的问题
(1)由于学位论文学术不端行为检测系统是以 CNKI 的《中国学术文献网络出版总库》以及其他论文、 报纸、专利全文数据库为全文比对数据库,用户可以通 过上传特色文献搭建个人比对库,同时选作为全文比对 数据库,如图 3 所示。
(2)选择比对库及范围,可以选择是否去除作者署 名文献以及比对时间,如图 3 所示。
(3)对于总文字复制比较高的论文以及优秀论文,为了确保检测结果更加合理和准确,在系统检测之后, 还需要通过人工干预的方法来进行进一步的比对。

相关文章:防学术不端不宜过度依赖论文查重