论文查重 | 论文文献库 | AMLC与PSDS检测医学论文重复率结果分析

2015年3月27日,BioMcd Cen妇l撤回了43篇“伪造” 同行评审的论文,其中4l篇来自中国,作者单位涉及30余 家国内知名三甲医院,学术造假、论文抄袭瞬间再次成为社 会舆论的焦点。急功近利、学术浮躁是我国学术界的固有顽 疾,而因为毕业、晋升、竞争的压力,作者进行学术造假、 论文抄袭的现象较为普遍。
为了净化学术环境,彻底消除学术造假、论文抄袭,政 府在政策方面出台了相关规章制度规范学术研究行为,数据 库商等软件行业则从技术上寻求解决,其中论文查重相似性检测 系统就是反抄袭、反剽窃的有效技术之一。目前,国内应 用较广、影响较大的论文查重检测系统为中国知网学术不端文献 检测系统与万方数据论文查重相似性检测系统(PSDS), 这些检测系统对医学论文的反抄袭、反剽窃起到了积极的作 用,有效地遏制了学术造假与论文抄袭。20lO年,《安徽医 学》编辑部开始启用舢沮C,对于论文重复率超过30%的稿 件直接退稿。2014年底,《安徽医学》网络投稿平台正式启 用,同时一并启用PSDS。自此,《安徽医学》所有稿件必须 经过网络投稿平台注册,且必须通过朋咀。C与PSDS的同时 检测,更加严格地控制论文的重复率(不得超过20%)。本文 利用』嗵几C与PSDS对《安徽医学》登记接收的论文进行论 文重复率检测,并对检测结果进行统计分析,现报道如下。
二、研究资料与方法
1.研究样本。选择2015年3月15日至2015年4月15 日《安徽医学》网络投稿平台登记接收的论文作为研究样本。 排除作者、单位等信息不全的论文;如有任一重复率检测系 统(万方、知网)无法检测的论文,则排除该论文。
2.分析方法。将符合要求的研究样本,分别上传至 朋咀。C、PSDS进行检测,对AMLC与PSDS的检测结果进 行定量与定性分析,并进行统计学比较分析。
3.分析指标。选择论文重复率作为本文定量分析指标, 即舢咀。C文字复制比和PSDS论文相似比。参照‘安徽医学》 处理稿件经验,将论文重复率丑O%作为正常稿件,论文重复 率>20%作为抄袭嫌疑稿件。
4.统计学处理。应用SPSS 15。O软件对本文数据进行统计 分析,定量分析指标以均数士标准差(;±s)表示,比较分 析采用t检验,定性分析指标以例(百分比)表示,比较分 析采用f检验,以Po.05为差异有统计学意义。
二、调查结果分析
1.研究样本基本情况。2015年3月15日至2015年4月 15日《安徽医学》网络投稿平台共登记接收论文226篇,其 中207篇论文符合本研究要求,纳为研究样本。稿件来源: 安徽省省内稿件115篇,占55.56%;省外稿件92篇,占 44.44%。稿件学科:临床医学类稿件167篇(含基础医学1 篇),占80.68%;护理医学类稿件18篇,占8.70%;医学教 育、卫生管理、公共卫生等稿件共22篇,占9.73%。 2.重复率检测结果比较。经过舢儿C与PSDS的系统检 测,肌C的论文重复率平均为(16.6l士17.05)%,PsDS 的论文重复率平均为(10.77士15.69)%。朋沮£与PsDS的 检测结果进行比较,差异有统计学意义(仁.8.050,P=o.000)。 3.重复率定性检测结果比较。√墙几C检测出14l篇正常 稿件,占68.12%,抄袭嫌疑稿件66篇,占31.88%。PsI)s 检测出175篇正常稿件,占84.54%,抄袭嫌疑稿件32篇, 占15.16%。舢儿C与PSDS的定性检测结果进行比较,差异 有统计学意义(P>O.05)。如表1所示
1.医学论文重复率较高。通过舢帆C与PSDS的共同检 测,发现医学论文的重复率处于较高水平。√嗵几C的重复率 为(16.6l士17.05)%,论文重复率>20%的稿件占31.88%:PSDS 的重复率为(10.77士15.69)%,论文重复率>20%的稿件占 15.16%。王福军等田对《第三军医大学学报》《遵义医学院学 报)来稿文字复制比进行统计分析,AM【C检测论文重复率 >2∞‘的稿件占20.3%,PSDS检测论文重复率>20%的稿件占 15.7%,与本文分析结果相似。中国知网对已发布的期刊文献 进行学术不端文献检测,发现大量存在文字重合率超过30% 的文章。不可否认,论文抄袭、一稿多投、重复发表等导致 了医学论文重复率的高水平。一方面是我国科研人员普遍对 学术不端行为认识不足,抵制学术不端的意识不强,导致学 术不端行为频繁发生:特别是剽窃抄袭他人研究成果、数据 造假、论文重复发表,直接导致了论文的高重复率。另一方 面。不合理的学术评价、学术体制的误导和法律规范的缺少, 导致了论文抄袭等学术不端行为的发生。
2.朋咀£与PSDS检测差异显著,单篇差异较大。通过 统计分析本研究的检测结果,发现朋门LC与PSDS检测的论 文重复率存在统计学差异,舢v【LC检测的论文重复率明显高 于PsDS;且舭C检测结果中,论文重复率>20%的稿件比 例显著高于髂DS,差异亦有统计学意义。另外,统计结果显 示单篇论文朋沮£与PSDS的检测结果差异较大。例如:稿 件编号为2015石88的论文,AMLC检测论文重复率为 2.70%,PSDS检测论文重复率仅为7.70%,相差达35.00%; 稿件编号为2015-656的论文,AMLC检测论文重复率为 48.10‰PsDS检测论文重复率为82.80%,相差达34.70%。 对于学术论文而言,产生以上差异的主要原因为检测资源库 的时间跨度差异、对比范围差异与对比期刊差异。舭C资 源库的期刊回溯到1915年,而PSDs资源库的期刊仅回溯到 l粥5年,时间跨度的差异直接导致两者资源数量的巨大差异 (触咀£期刊论文3000万篇,PSDS期刊论文2000万篇)【11。 触咀C对比范围包括中国学术期刊网络出版总库、中国博士 硕士学位论文全文数据库、中国重要会议论文全文数据库、 中国重要报纸全文数据库、中国专利全文数据库、互联网资 源、部分英文数据库、港澳台学术文献库、优先出版文献库 等,而PsDS对比范围包括中国学术期刊数据库、中国学位 论文全文数据库、中国学术会议论文数据库和中国学术网页 数据库等柳,由此产生的差异显而易见。另外,中国知网、 万方数据近年开始与多种学术期刊签订了独家收录协议,使 得AMLC与PSDS的资源数量出现了差异。中国知网收录的 文献类型多样,学科覆盖范围广,独家收录期刊种类越来越 多;然而万方数据独家收录中华医学会下属的“中华系列”“中 国系列”国际系列”高质量期刊,这一优势使得万方数据在医 学学科出类拔萃【5J。
3.建议。(1)统一检测标准。无论是触订儿C,还是PSDS, 他们都有各自的核心检测技术与对比范围,缺乏统一的标准, 导致检测结果的巨大差异。因此,建议加强学术不端检测系 统建设。尽快统一国内的检测标准,如:统一对比范围,互 相开放独家收录期刊的文献资源,统一增加图书、图片与外 文文献资源,统一扩展检测文献的常用格式等:(2)作者严 于律己。急功近利、学术浮躁是造成我国学术不端行为的根 源。而作者自身缺少学术道德,对学术不端行为认识不足, 对论文抄袭的危害估计不足,是造成医学论文高重复率的直 接原因。因此,医学论文的作者应严于律己,加强对学术不 端的认识,主动拒绝论文抄袭,成为执行道德原则和道德规 范的学术行为主体【6】,这是预防医学论文抄袭的重要基础; (3)编者严格把关。医学期刊的编辑与审稿专家应严格把关, 客观、公正、科学的评价论文,这是预防医学论文抄袭的关 键。审稿专家在对医学论文创新性和内容进行科学评价的同 时,需加强对论文研究方法和数据的审阅,重点审查一稿多 投、抄袭、篡改数据等不端行为【3l。期刊编辑对作者的投稿 应进行多次重复率检测,投稿时必须进行首次检测,修回论 文需进行再次检测,刊用论文在正式发表前仍需检测,以避 免作者一稿多投或重复发表。编辑在多次检测过程中,应使 用多个数据库,首次检测采用一个数据库(如舢沮£),复测 时采用两个或多个数据库(PSDS等)联合检测,尤其是医学 期刊,多个数据库联合复测可以检索出独家收录的文献巴(4) 读者积极监督。谢燕等【8】认为学术成果的检验不是一次性完 成的,期刊编辑、专家审阅仅仅是论文发表的入门审查,重 要的是发表后在社会上接受实践检验。读者是学术期刊重要 的服务对象,因此有必要将读者纳入医学论文的预防体系之 中,加强医学论文抄袭的防范。医学期刊应鼓励读者积极参 与学术不端监督,注意收集读者对发表论文的反映,重点关 注已发表论文是否存在抄袭、一稿多投、重复发表等行为。 捏造数据、篡改数据和剽窃等学术不端行为严重败坏了 学术风气,阻碍了学术进步,违背了科学精神和道德,抛弃 了科学的真实诚信原则。学术不端行为的蔓延是不折不扣的 负能量传播,给科学事业的发展带来了严重的负面影响。处 在信息爆炸时代的科技期刊,其主要功能是站在对学术求新、 对读者负责的社会视角,对内容庞杂、数量巨大的作者来稿 进行甄别和筛选,剔除垃圾信息,创造出更新更美的科学文 化精品【9】。总之,学术期刊应积极承担起抵制学术不端行为 的重任,编审人员不仅要善于利用现代技术手段进行审查、 评价论文,同时要加强学术不端行为预防机制的建设,完善 学术规范与学术道德教育,为读者、作者营造健康的学术环境。

相关文章:非侵权剽窃及其欺诈剽窃刍议——兼议论文检测软件对剽窃的防治作用