论文查重 | 论文文献库 | 学士学位论文重复率检测及其规范化提升策略探讨

0 引言
近年来, 论文抄袭等学术不端现象屡见报 端, 如何有效提升学术规范、 遏制学术不端行为 引发社会广泛关注。 早在 20 世纪 70 年代, 国际 上就开始研发识别学术不端行为的检测技术, 90年代数字指纹技术开始应用于高校及科研机构。 在我国, 中国学术期刊(光盘版)电子杂志社联合 同方知网公司于 2008 年底推出学术不端文献检 测系统[1]。 论文查重重复率检测系统的引入使用提升 了甄别论文抄袭的效率, 也对论文抄袭等学术不 端行为产生了一定的警示作用。 高等教育、 计算 机软件及计算机应用、 出版、 图书情报与数字图 书馆等不同领域的专家学者对此进行了持续探 讨, 研究内容主要集中在以下几个方面: (1)论文查重重复率检测系统的功能特点。 如比较 CNKI 检测 系统、 万方检测系统的检测方式、 论文格式、 报 告格式等[2], 以及在此基础上对比分析检测系统 之间在后台核心数据库、 技术特点、 算法特点等 方面的具体差异, 进而了解国内论文重复率检测 系统与国际间的差距[3]。 (2)论文重复率检测系统 的局限性分析。 既有从宏观角度对检测系统所带 来的“论文查重产业” 的诟病进行批判, 也有从微观 角度具体讨论查重系统存在的设计漏洞、 公共领 域内容表达、 无法根据不同学科论文特点进行灵 活调整的具体缺陷; 既有从法律层面分析查重系 统、 查重制度的弊端, 也有从整个学术生态系统 健康的角度看待论文查重系统的负面影响[4]。 (3)论 文重复率检测系统使用情况及实施效果。 杨芳[5] 采用问卷调查法和访谈法对 G 大学引入“学位论 文学术不端检测系统” 实施的便捷性、 科学性、 可信度、 有效性进行了调研, 并提出了使用建 议。 (4)改进论文重复率检测行为的对策和建议。 在正确认识重复率检测系统作用和局限性的基础 上, 分析“重复的目的”“重复的内容”“重复的数 量”, 进而把握合理使用的“度”[6]。
可以说, 对论文重复率检测系统的作用与局 限性, 学术界已基本达成共识, 对如何更有效地 发挥其检测优势、 提升学术规范水平, 学者提出 了对策建议。 但是, 现有研究成果仍存在一些不 足: 首先, 研究内容上, 主要侧重于对期刊投 稿、 硕博学位论文学术不端的检测效果, 而对学 士学位论文查重实效关注不够; 其次, 在研究视 角方面, 主要是从期刊编辑的视角探讨检测系统 的使用效果。 虽然也有对研究生导师对检测系统 的认识情况的调研[7], 但少有从检测受众——学 生的视角谈论文重复率检测的合理性和有效性; 最后, 在研究方法方面, 关于检测系统检测效果 的案例分析较少, 数据支撑不足。
在本研究中, 笔者将从学士学位论文学术不 端行为入手, 分析学士学位论文重复率检测的必 要性和有效性, 通过问卷调查重点关注在校大学 生对学士学位论文重复率检测的认识, 选取 5 篇 学士学位论文在不同检测系统中进行文字复制比 检测, 以实际检测情况分析重复率检测系统的局 限性和原因, 最终提出学士学位论文学术规范水 平的提升策略。
1 学士学位论文重复率检测的必要性
1.1 学士学位论文属于学术论文
为了解学士学位论文中的学术不端行为及原 因, 以及通过学生评价了解论文重复率检测系统 的科学性和有效性, 2018 年 2~3 月, 笔者进行 了一项关于学士学位论文学术不端情况与重复率 检测的网络问卷调查(问卷链接: https: //www. wjx.cn/jq/21036720.aspx), 调查对象为在校学 生(包括本科生、 硕士生和博士生), 共回收 214 份有效问卷, 样本数据来源于江苏、 山东、 安 徽、 河南、 辽宁等地 10 多所高校。 其中, 对于 “您认为学士学位论文属于学术论文吗”, 47.2% 的被调查者认为“不属于”, 39.72%认为“不好 说”, 仅有 13.08%认为“属于”。 这种现象说明 学士学位论文是否属于学术论文依旧是一个值得 探讨的话题。
《科学技术报告、 学位论文和学术论文的编 写格式》 (GB 7713-1987)明确定义了“学术论文 是某一学术课题在实验性、 理论性或观测性上具 有新的科学研究成果或创新见解和知识的科学记 录; 或是某种已知原理应用于实际中取得新进展 的科学总结, 用以提供学术会议上宣读、 交流或 讨论; 或在学术刊物上发表; 或作其他用途的书 面文件。” 其中,“学位论文是表明作者从事科学 研究取得创造性的结果或有了新的见解, 并以此 为内容撰写而成、 作为提出申请授予相应的学位时评审用的学术论文。 学士学位论文应能表明作 者确已较好地掌握了本门学科的基础理论、 专门 知识和基本技能, 并具有从事科学研究工作或担 负专门技术工作的初步能力。 ”[8]按照此国家标准 中的定义, 学士学位论文无疑是属于学术论文范 畴的。 然而, 此标准已于 2007 年 5 月 1 日作废。 后续实施的 《学位论文编写规则》 (GB/T 7713.1 -2006)将“学位论文” 的定义精简为“作者提交 的用于其获得学位的文献”。 除此之外, 大众的 疑点或争论依旧聚焦在学士学位论文是否真的满 足学术论文所必须具备的创新性要求与特点上, 即“学术论文应提供新的科技信息, 其内容应有 所发现、 有所发明、 有所创造、 有所前进, 而不 是重复、 模仿、 抄袭前人的工 作。 ”[9]
诚然, 学 术研究贵在创 新 。 笔 者 认 为, 本科生在 经历四年的专 业教育的基础 上, 已经初步 具备了一定的学术积累, 而学术积累正是学术创 新的前提。 本科生可能很难提出新的概念或理论 体系等重大创新或原始创新, 但是能够提出新的 问题或选取新的角度开展研究, 甚至运用人们所 忽略的方法取得研究进展都可以视为创新[10]。 换 言之, 借鉴叶继元教授关于学术创新层次的理论 观点, 相对于难度较高的“原始(自主)创新”, 学 士学位论文通常可以满足“集成创新”“协同创 新”“移植创新” 等。 因此, 学士学位论文具备值 得研究的问题, 有研究方法, 有数据、 事实等材 料的论证, 有结果和结论, 且满足“有所创新” (不论创新大小)的特点, 理应属于学术论文, 尽 管总体看属于学术论文较低的层次。 进一步讲, 以往学界对于论文抄袭行为往往关注的是硕士和 博士学位论文, 并未对学士学位论文给予更多 的关注[11], 而整顿学术不端行为理应从作为学术论文起点的学士学位论文抓起, 因而对其进行学 术不端行为分析是极具现实意义的。
1.2 学士学位论文学术不端行为分析
学士学位论文学术不端行为主要表现为抄 袭, 属于引文失范行为。 抄袭通常有四种表现形 式: 一是直接复制其他作者的文本而不指明出 处, 二是概括或重新组织语言解释别人的观点而 不注明, 三是一篇文章中大量引用自己已发表的 作品而不作任何说明(即自我抄袭), 四是内容来 源于对外文文献的机械翻译而不注明出处。 此次 调查显示(见图 1), 仍有较多学生对抄袭行为的界 定没有清晰的认识: 近 85%的学生认为“翻译 外文文献而不注明出处” 不属于抄袭行为。
学士学位论文学术不端行为的主要原因应从 内因和外因两个方面进行解释: 自身能力的不足 与学术道德水平低下是其内在原因; 学校及社会 外界学术规范教育的缺失和监管不严是其外在原 因。 此次被调查者将大学生学术不端行为的大部 分原因归咎于“自身能力和学术要求不匹配” 和 “急功近利, 学术道德不高” 这两项内在原因(见 图 2)。 这说明本科生的学术规范意识面临着务必 从能力与意识两方面进行全面提升的艰巨任务。
1.3 论文重复率检测系统的积极作用
在近几年学士学位论文抄袭屡见报端的情况 下, 论文重复率检测系统(以下简称“检测系统” ) 应运而生, 并在高校中迅速普及开来。 检测系统让 抄袭行为得以迅速暴露, 对杜绝学术不端行为起 到积极的威慑与防范作用, 被称为学术论文的“第 三只眼” 和“测谎仪”[12]。 检测系统的作用就在于对论文进行重复率检测, 如果文字复制比超过了 所规定的阈值, 就视为存在学术不端行为, 为界 定引证、 抄袭和剽窃提供了非常实用的技术手段。
1.3.1 合理性判断
据调查, 大部分(占比 61.68%)学校对本科生 毕业论文重复率的要求是 20%以下, 进而通过 与“复制比合理性” 的交叉分析可以看出, 其中 81.52%的学生认为学校对于重复率(20%以下)的 设置是“比较合理” 和“非常合理” 的, 另外 85.71%的学生认为 10%以下的重复率设置是 “非常合理” 的(见图 3)。 综合以上数据来看, 学 生对于学校设定的重复率标准是普遍认同的, 可 以说, 检测系统对于检测学士学位论文学术不端 行为具有合理性。
1.3.2 有效性判断
在关于检测系 统对于遏制论文抄 袭的有效性调查方 面, 43.46% 的 学 生认为检测系统对 抄袭行为并无太大 作 用 , 39.25% 的 学生则认为能有效 遏制抄袭行为。 由 此看来, 检测系统 对于论文抄袭行为的作用似乎是颇具争议的。 我们仍旧运用变量交叉分析方法, 对“您认 为论文重复率检测系统对遏制论文抄袭行为有效 果吗?” 和“您觉得本科生毕业论文有必要进行 重复率检测吗?” 这两个问题的调查结果进行分 析。 61.7%持“对抄袭行为并无太大作用” 观点 的学生仍旧认为有必要对学士学位论文进行重复 率检测; 持“检测反而会助长学术惰性, 滋生更 多隐性学术不端行为” 观点的学生中, 88.89% 在面对“是否有必要对学士学位论文进行重复率 检测” 这个问题时态度为“无所谓 / 说不清”; 11.11%的学生则认为还是有必要检测重复率的 (见图 4)。 这个略显矛盾的数据背后其实隐匿着这 样一种现象: 学生为达到规定的重复率标准而采 取了一系列、 多样化“反 检测” 手段, 主要有: 在不改变句意的前提 下, 进行同义词替换、 句式调换等操作; 将正 文内容转化为图片形式 以躲避所抄袭段落的检 测; 在正文中添加肉眼 不易发现的空格等投机 取巧的方式。 这些“反 检测” 手段使检测系统 对论文抄袭行为的识别 出现了“失灵” 现象, 这成为“检测系统无效论” 的主要原因。 但是, 鉴于目前尚未出现更加 智能与精准的检测系统, 仍旧不能否认现阶段的 检测系统的正面作用。 也就是说, 整体而言, 检 测系统对于发现、 鉴定学士学位论文学术不端行 为是有效的, 仍然起着第一道屏障的关键作用。
2 学士学位论文检测系统的原理及局限性
2.1 国内主流学士学位论文重复率检测系统简介
在本次调查中, 被调查者认为较为常见或常 用的论文重复率检测系统前 5 名依次是: CNKI学术不端 文 献 检 测 系 统 (PMLC)(占比 71.96%)、 万 方论文相似性检测系统(占 比 52.8%)、 ROST 反剽窃 系统(占比 50.93%)、 维普 通达论文引用检测系统(占 比 35.51% )、 论 文 引 用 检 测 系 统 ( 占 比 18.69%)。 表 1 分别从对比 数据库、 算法、 单次检测字 限制符数等方面对这五款主流论文检测系统进行 对比分析。
从表 1 中看出, 各论文检测系统所依托的对 比数据库和算法技术等方面存在着差异, 不同的 论文检测系统也因此具有各自的特色与优势。
(1)CNKI。 作为最大的中文文献数据库提供 方, 拥有相对全面的独家文献资源、 英文资源、 网络资源和第三方资源, 因此, CNKI 学术不端 文献检测系统(PMLC)在对比数据库方面具有其他 检测系统难以超越的先天优势。 且值得一提的是, 为了进一步提升查全率和查准率, CNKI 学 术不端文献检测系统(PMLC)允许机构用户上传本 校或本院往年的学士学位论文形成自建库, 从而 扩展对比数据库的范围, 提升查重准确率。
(2)万方检测(WFSD)2.0 版, 自 2018 年起采 用自主研发的句子级正交软聚类倒排语义算法, 有效提升了检测速度。 其最大的优势就在于检测 报告生成速度较快, 且检测费用较低。 此外, 在 线版检测报告采用多种交互与可视化技术, 有助 于读者轻松阅读结果、 准确获取信息[13]。
(3)ROST 反剽窃系统, 最大的特点在于自定 义分块检测机制, 可以精确地标示出文章的每一 文本块与其他文档的相似度, 每一文本块约为 50 字至 200 字不等(块数大小定为 200 字较为合 适), 以红色表示极度相似(相似度大于 80%), 一 目了然, 清晰醒目。 当设为 50 个字一块时, 可 以在较低信息粒度上查找出可能抄袭或相似的文 献[14]。 在检测结果具有较大参考价值的前提下, 此系统最大的优点是完全免费, 可以作为论文写 作者进行自查的有效辅助工具。
(4)VTTMS 维普通达论文检测系统, 独具自 定义阀值修改功能, 论文检测单位可以根据送检 论文的专业、 性质或检测严格度不同, 对片段相 似度阀值进行自定义修改, 进而提升检测结果的 科学性、 合理性。
(5) 论文引用检测系统, 有着较高的 易用性和灵活性, 为用户提供非常良好的操作体 验。 在最新的 3.1 版中进一步优化在线写作与修 改功能, 实现了学生在线检测并修改论文、 导师 在线评阅的互动操作, 从源头上保证了论文写作 质量和学术规范水平的提升。
2.2 论文重复率检测系统的局限性
为了解不同论文重复率检测系统的差异性, 笔者选取了 5 篇学士学位论文作为调查样本, 分 别运用以上几种论文检测系统进行重复率检测, 试图从检测结果的差异中探讨系统的局限性。 由 于 ROST 系统目前将功能重点集中在内容挖掘、 搜索引擎、 微博、 新闻传播动力学等领域, 反剽 窃系统存在失灵现象, 故此处不做讨论。 表 2 为 5 篇论文使用不同检测系统的检测结果。
通过以上对检测系统的对比和实际检测结 果, 可以将学士学位论文重复率检测系统的局限 性概括为两方面。
首先, 宏观上的查全率问题。 不同的论文检 测系统由于对比数据库的不同, 算法特点、 功能 特点等检测技术的差异, 以及各大数据库优先出 版情况的不同所造成的检测结果不尽相同[15], 表 2 中论文 4 的检测结果差值高达约 27%。 尽管 CNKI 学术不端文献检测系统后台数据库相对来 看更加全面, 但检测盲区仍然存在, 比如仍有大 量的网络文献、 外文文献、 内部资料等未能收录[16]。 从表 2 看出, 检测结果相对较高的是维普 通达检测系统, 而万方检测系统相对较低, 较接 近检测均值的分别是 CNKI 学术不端检测系统 (PLMC)和 论文引用检测系统。 鉴于检 测成本问题, 笔者在这里选取的样本数量有限, 仅作举例说明之用。 若想得到更加科学、 权威的 结论, 需要大规模的检测样本以及更加精细的数 据分析工作。 综上, 鉴于不同论文检测系统检测 结果存在较大的差异, 如何科学利用检测系统之 便并正确发挥其效能, 是广大师生及相关机构应 当考虑的重要问题。
其次, 微观层面的查准率问题。“文字复制 比” 并不能等同于真实的“引用率”, 更不能以 较高的“引用率” 来判定抄袭行为。 在论文检测 报告中, 主要存在以下几种对合理重复的误判: 第一, 对“经典” 的合理引用的误判。 对于有些 常用的名言警句、 经典诗词等经常被检测标记为 复制抄袭内容; 第二, 对专业名词和文章标题等 固定词组合理重复的误判。 比如, 论文标题中的 “引言” 二字被判定为重复。 因此, 这些基于检 测系统算法特点的对于重复率的机械判断, 都需 要人为地进行纠正, 以修正查准率。
2.3 论文重复率检测系统局限性的原因
2.3.1 主观原因
一方面, 由于论文重复率检测系统的设计者 和开发者难以具备全面的学术背景, 对学术研究 规律、 学术规范、 文理科不同学科研究特点、 写 作规范等了解不够, 检测系统无法实现对不同学 科、 不同研究领域的差异化、 智能化检测。 维普 通达论文检测系统是目前业界唯一可以进行相似 性阈值自定义修改的检测系统, 相似片段阈值默 认 50%, 管理员可根据严格度进行修改, 但此 功能实际效果取决于管理员对阈值设置的重视度 与科学性, 有待进一步考证。 另一方面, 论文 写作者自身学术规范意识与能力不足。 由于本 科生论文写作经验不足, 学术规范意识相对来 说也比较薄弱, 导致一些学生在撰写毕业论文 过程中并没有全面而规范地标注引文, 因而检 测结果和实际抄袭率之间可能会存在较大差异。
2.3.2 客观原因
首先, 是对比数据库的局限性。 其一, 论文 检测的精准程度与对比数据库的收录数据量呈正 相关, 对比数据库收录的全面程度直接关系到论 文抄袭检测的结果和质量, 而目前还没有哪一个 检测系统可以实现对比资源的全面覆盖。 联合各 大数据库实现“一站式” 检测之所以困难重重, 根本原因是各大数据库之间各自为政的竞争关 系。 虽然经过多年的发展, 知网、 维普、 万方数 据库在数据内容、 信息服务方面都呈现出同质化 现象, 但明确自身优势、 突出自身特色, 实现差 异化发展, 力求赢得用户偏好、 占据市场依旧是 各大数据库的主要战略目标[17]。 其二, 对比数据 库的局限性还体现在收录文章的滞后性。 数据库 收录除“优先数字出版” 外, 均滞后于纸质版期 刊的发行。 如果引用的文章属于最新的研究成果 还未被数据库及时收录, 那么数据库的时滞性必 然会影响到检测结果的准确度[18]。 其次, 是检测 算法的局限性。 我国论文重复率检测系统大多基 于数字指纹技术, 本质上都是对词或标记进行 “统计” 与“标记”, 无法从语义信息和语用信息 层面理解论文的含义, 因而只能识别文本复制 类型的简单抄袭。 此外, 虽然各检测系统都注明 可识别不同格式文本进行检测, 但在实际检测过 程中, 文档格式不同则会对检测结果产生较大的 影响[19]。 这些都是技术上需要逐步完善的方向。
3 学士学位论文学术规范提升策略
如何进一步提升学士学位论文学术规范, 依 据管理学理论, 整体思路应是事前预防、 事中控 制和事后治理。 具体而言, 事前预防主要是指在 学生的日常教育和管理中进行常态化的学术诚信 教育以及写作规范培训教育, 从根源上减少或杜 绝学术不端行为的发生; 事中控制主要体现在导 师在论文写作过程中所发挥的指导和监督作用, 这贯穿于搜集材料、 开题、 写作、 修改、 终审、 答辩等论文创作前后的一系列过程; 事后治理不 仅要求学校有完善的监督体系和明确的惩处措 施, 最重要的是正确看待重复率检测结果, 防止 对学术不端行为的漏判和误判。
3.1 学术诚信教育是基础
前文已经提到, 被调查者认为造成学术不端 行为的最重要原因是“急功近利, 学术道德不 高”, 因此, 大学生学术诚信教育依旧任重而道 远。 目前无论是国外还是国内都已十分重视学术 诚信问题, 对于学术不端行为持零容忍态度, 甚 至有教授认为学术不端也应作为一个重要的指标 要素纳入到大学排行榜的评价体系中[20]。 尽管 2016 年 6 月 16 日教育部发布的 《高等学校预防 与处理学术不端行为办法》, 在处罚方面有了较大进展, 但与国外相比, 我国学术 诚信教育依旧存在“重惩处、 轻预 防” 的不足[21]。 起着事前预防作用 的学术诚信教育比事后的学术不端 查处与惩治更加具有积极意义, 有 助于从思想源头上减少或杜绝学术 不端行为的发生。 以美国的宾夕法 尼亚大学和普林斯顿大学为例, 在 新生入学时, 即要求新生充分了解 学术诚信规范并签字承诺遵守规范。 除了入学教育之外, 学术诚信教育还应贯穿学生 的整个培养过程, 通过多样化的渠道和途径强化 学术诚信意识: 一是通过图书馆、 校刊校报、 网 站、 微博微信平台等宣传学术诚信的相关要求与 规则; 二是充分发挥学生团体的宣传作用, 举办 学术诚信科普活动; 三是组织举办学术沙龙、 研 讨会、 知识竞答等活动培养学生的学术诚信意 识[22]。 总之, 对大学生来说, 通过常态化的学术 诚信教育活动有助于大学生学术诚信思想的“内 化” 和学术诚信行为的“外化”。
3.2 写作规范教育是重点
学术论文的写作规范教育是预防学术不端行 为的重点环节。 调查显示, 大学生对学术规范知 识了解的最主要途径是学校开设的学术规范相关 课程(见图 5)。 相比不定期举办的学术规范讲座, 学术规范课程的作用在于形成一种更为长效的教 育机制, 不断纠正学生对学术论文写作规范认知 上的模糊与偏差。 而现实是, 大部分学生在本科 学习阶段并没有接受过系统的写作规范教育, 对 学术规范的认知和实践欠缺[23]。 因此, 建议高校 应重视本科生写作规范教育, 强化写作规范训 练。 一方面, 要注重教育内容的细致化和针对 性, 在教育和教学过程中要让学生对学术不端行 为有着清晰的认识, 比如学术不端的具体表现以 及不同学术不端行为之间的差异; 另一方面, 在 教育方式上, 要摒弃一味的填鸭式教学方法, 突 出课程的任务导向型[24], 提升师生之间、 同学之 间的积极互动、 研讨和交流。 只有这样, 才能收 到良好的教育效果, 切实提高学生的学术规范意识和论文写作质量。
3.3 强化导师指导是关键
导师的指导对学士学位论文学术规范有着极 为重要的影响。 首先, 从调查中看出, 导师指导 是大学生获得学术规范相关知识的最主要途径之 一; 其次, 大部分学生认为(占比约 72%)导师的 态度对学术不端行为有较大的影响, 即导师如果 严格要求学生遵守学术规范, 则可以有效遏制学 生的抄袭、 剽窃等学术不端行为; 最后, 从调查 中我们注意到, 除了大部分老师(占比约69%)对 待学士学位论文严格要求、 严禁抄袭之外, 仍有 部分老师疏于律人, 认为只要达到毕业重复率要 求即可, 对学术不端行为重视不够。
在 《高等学校预防与处理学术不端行为办 法》 中, 最重要一点是要求学校加强对毕业论文 的指导和监管, 从根源上杜绝学术不端行为[25]。 强化导师对毕业论文的指导需要一个有效的指 导、 互动平台。 而 论文检测系统推出 的指导教师在线与学生交互、 评阅与审核功能则 为加强导师对学生毕业论文的指导提供了平台。 区别于其他论文检测系统只给出重复率检测结果 的模式, 提供便捷高效的互动平台将导 师对论文的指导贯穿到了论文写作与修改的全过 程, 指导教师可通过系统直接线上评阅学生论 文、 审核检测报告, 且支持同组学生之间互相评 阅[26]。 总之, 论文检测系统从提高效 率、 加强互动且互动过程易追溯的角度, 为强化 导师指导、 创新导师指导路径带来了新的启发, 值得高校及导师队伍进行参考借鉴。
3.4 学术不端检测是保障
科学研究离不开对前人劳动成果的总结、 扬 弃以及在继承基础上的发展、 创新。 作者在撰写 论文过程中, 明确、 合理标注对他人研究成果的 引用是对他人劳动的尊重。 对毕业论文进行重复 率检测, 表明了学校打击学术不端行为的决心, 有助于对学术不端行为产生一定的威慑作用, 最 终营造公平、 公正的良好学术氛围。 一方面, 对 学生来说, 学术不端检测系统是本科生在论文写 作完成后进行引文规范自查的一种重要手段和方 式, 有助于发现论文撰写过程中出现的漏引现 象; 另一方面, 对学校和指导教师来说, 学术不 端检测系统为本科生论文抄袭、 剽窃等行为的筛 查提供了技术支持, 是强化学术规范的重要保 障。 虽然学术不端检测存在着一些技术层面和实 践层面的不足为人所诟病, 但是依旧发挥着重要 的辅助作用, 有着重要的参考价值。 将学术规范 和要求融入到检测系统中, 进一步提高其智能化 程度, 是提高检测精准度和可信度、 提升论文规 范化的必由之路。
3.5 正确看待检测结果是要求
如前文所述, 由于系统设计、 技术实现等主 客观原因的限制, 论文重复率检测系统存在着查 全率、 查准率不够理想等问题, 这就要求论文检 测结果审查机构和导师应正确看待论文检测结果 中的“文字复制比”“引用率” 等数据指标。 首先, 应理性看待低重复率论文。 不同的检 测系统检测结果具有差异性, 这就意味着只经过 某一种检测系统检测出来的低重复率的论文也不 能完全排除抄袭的可能。 如果能同时运用几种检 测系统对同一篇论文检测, 则更加容易发现学术 不端行为。 但是, 由于各大数据库之间的竞争关 系等现实原因, 目前很难实现论文检测系统的集 成检测或协同检测。 因此, 从促进学术规范、 净 化学术环境的角度出发, 笔者赞同张杨[27]对学术 不端检测系统数据库实行互联互通的呼吁:“数据 库的互联互通在技术上不存在任何障碍, 在安全 性方面不存在很大的问题, 需要的是平台间协作 意识的觉醒。 ”
其次, 应科学分析高重复率论文。 由于学科 或研究领域的专业性、 特殊性, 并不能仅仅参照 重复率来判断是否是抄袭行为。 比如, 历史学论 文的写作往往需要参考大量的史料, 法学论文的 写作有时需要梳理和引用大量的法律条文, 这都 会造成重复率的飙升, 但为了更好地表达主题和 思想, 对重复内容并不能进行删减和修改。 对于 这种情况, 应当依靠专家评审判断引用的必要性 和合理性, 这样既实现了学术公平, 又保障了学 术自由。 鉴于此, 高校对学士学位论文重复率上 限设置时, 不能“一刀切”, 要在考虑学科、 专 业差异的前提下设置不同的引用“红线”。
4 结语
加强学士学位论文学术规范, 不仅关系到高 校师生的切身利益, 甚至关乎学士学位论文的 “存亡”。 据调查, 学士学位论文检测系统的使用 在发现和遏制论文抄袭等学术不端行为方面发挥 着第一道屏障作用, 各院校对于学士学位论文重 复率标准的设定也具有合理性。 但是由于检测系 统存在的技术层面尚无法优化的局限性, 在加强 学士学位论文学术规范方面仍只能作为辅助手 段, 对其检测结果需要依靠导师等专家力量依据 论文选题、 研究领域、 专业差异等因素进行具体 问题具体分析。 加强学士学位论文学术规范, 需 要贯穿于学术论文写作的始终, 需要从日常教育 和培训做起, 需要高校师生及各相关主体的全面 重视、 通力配合。

相关文章:研究生学术不端行为治理的制度构建与完善 ——基于985工程大学文本分析