论文查重  | 论文文献库  | 科学合作与论文影响力之间的相关性研究

科学合作与论文影响力之间的相关性研究

来源：论文查重时间：2019-08-21 11:43:40

摘要：［目的／意义］随着科学研究综合性逐步加强，合作日渐成为主流的科研方式。通过对科学合作和论文影响力之间相关性进行研究，以探究科学合作是否对论文影响力存在着提升作用。［方法／过程］本文基于 JCR 的期刊数据，在 Web of Science 核心合集中选取了复合材料、图书情报和科学史与科学哲学领域 2009－2012 年的发文和被引数据，借助多元统计软件 SPSS21. 0 和社会网络分析软件等从作者、机构、国家等 3 个层次研究科学合作和论文影响力之间的相关关系，进而以高被论文查重引论文为研究对象探寻最佳的合作规模。［结果／结论］在不同的学科中，作者合作、机构合作和国家合作均与论文影响力呈显著的正相关关系，但科学合作的边际效益不同。科学合作的规模不可能无限扩大，最佳的作者合作规模为 2～4 人，最佳的机构合作规模为 1～ 3 个，最佳的国家合作数目为 1～2 个。
随着科学发展的不断推进，科学研究问题越来越复杂，专业化分工趋势也愈发明显，单打独斗的科研模式显得捉襟见肘。因此，科学家向外寻求帮助，集中不同成员的智慧共同解决问题，科学合作逐渐成为多数科学家首选的科研模式。在大科学时代，科学合作主要有 3 种形式：科学家之间的合作、科研机构之间的合作以及国家之间的合作。然而并非所有合作模式都是有效的，因此，需要通过论文影响力来判断不同合作模式的有效性。从整体来看，目前评价论文影响力的方法主要是同行评议和以计量为基础的评价方法，但由于同行评议方法本身的要求，导致这种方法主观性较大，结果难以控制。所以，本文采用以计量为基础的评价方法来测度论文影响力，使用论文被引频次作为论文影响力的衡量指标，并提出如下假设，通过实证研究验证假设是否成立。
H1：作者合作及作者人数与论文影响力呈正相关；
H2：机构合作及机构数目与论文影响力呈正相关；
H3：国家合作及国家数目与论文影响力呈正相关；
H4：上述假设在不同的学科中存在着差异。
1 相关研究综述
17 世纪 60 年代，首个无形学院成立［1］，学术群体之间的合作联系开始兴起。随后，科学合作的迅猛增长引起了科学家们的广泛关注和研究兴趣。从目前来看，科学合作的相关研究主要集中在科学合作规律探寻和科学合作绩效评估两个方面。
1. 1 科学合作规律探寻
国内外学者对科学合作规律的探寻主要是采用定量分析的方法来研究科学合作的比例和科学合作呈现的趋势。 1963 年， DJ Price［2］分析 1910－1960 年化学领域的论文发现， 50 年内作者合作比例从不足 20％增长到 60％以上； 1968 年， HA Zucker man ［3］统计24 297篇美国期刊论文后发现， 20 世纪以来科学合作的比例每 25 年增长约 25 个百分点； 1996 年， W Glänzel 等［4］分析了 SCI 数据库中的 4 534篇论文，结果显示 90％以上的论文为合著论文，且篇均作者人数为 4. 5 人； 2013 年，王贤文等［5］对中国的国际间合作情况进行研究，结果表明中国国际合作日益频繁，合作对象多为北美和欧洲国家。
除对科学合作的比例进行研究外，还有对科学合作趋势的研究。 1968 年， RK Merton［6］从知识交流和科学奖励等方面发现科学合作中存在着明显的 “马太效应”； 1994 年， JF Miquel 等［7］从 8 个学科对 98 个国家的国际合作、国家间关系和科学产出模式 3 个方面进行调查，进而揭示不同国家存在着不同科研行为； 2000 年， ME Newman［8］调查了医学、物理学和计算机科学 3 个领域的科学合作网络结构，发现 “小世界” 效应十分显著；次年， ME Newman［9－10］再次从网络结构、最短路径和中心度等方面对科学合作网络展开研究，将科学合作网络加权之后，可以在网络中发现与其他节点平均距离最近的节点； 2002 年，我国学者梁立明等［11］利用 CSCD 数据库揭示了我国学者跨省区合作对象会倾向选择科学生产能力高的地区； 2004 年，丁堃等［12］对我国管理科学领域合作规模、地域分布和第一作者年龄分布做了调查，结果显示在管理科学领域小范围的合作会更加容易产生创新性思维，合作范围集中在同单位，第一作者的平均年龄为 35. 79，年轻化趋势明显； 2013 年，杨思洛等［13］又对中外图书情报领域合作强度、合作范围与合作网络等展开细致地比较，发现在合作强度上国内合作略高于国外，主流合作模式是同城合作，合作网络均呈现出集中分散的态势； 2017 年，丁颖等［14］研究科学合作参与者的研究差异对论文整体影响，结论显示跨领域合作可以提倡，但是不应过度。
1. 2 科学合作绩效评估
科学合作绩效评估研究主要集中在两个方面，分别是科学合作与论文生产力之间的关系、科学合作与和论文被引频次之间的关系。 1966 年， DJ Price 等［15］对 555 名作者的合作关系和生产力之间的关系进行研究，发现两者呈正相关； 1980 年， P Hodder［16］分析了机构合作数量与论文产出之间的关系，结果表明两者存在着倒 U 型关系，即存在着最佳的机构合作数目； 2001 年， A Hollis［17］通过 339 位经济学家的面板数据来评估科学合作和科研产出之间的关系，发现在科学合作和论文产出之间呈现负相关，在此基础上， A Hollis 又深入分析了出现负相关的原因，包括合作团队工作的低效、团队成员之间的信息不对称等问题。相对而言，国内学者对此也做出了一些积极的探索。 2007 － 2012 年，刘则渊等［18－19］以威布尔分布和核密度分布曲线分别对 Web of Science 中物理学和分子生物学的合作规模和产出关系进行拟合，结果发现核密度曲线的拟合程度较高； 2017 年，刘俊婉［20］发现分子生物学、遗传学和物理学领域的高被引科学家中，合作者的论文数量呈负指数函数分布，且随着合作者数量增多，论文产出量也随之增多。
在科学合作和论文被引频次之间的相关关系研究方面， 1972 年， Arthur E Nudelman 等［21］通过问卷调查对美国、加拿大 225 名社会学专家进行分析，结果显示，合作研究比独著具有更高的学术声誉； 1986 年， SM Lawani［22］对癌症领域的论文进行研究发现，随着作者人数的增加，高质量论文的比重上升，自引总比重下降； 1990 年， F Narin 等［23］也发现多国家合作论文被引频次约为单个国家的 2 倍； 2001 年， W Glänzel 等［24］发现化学领域有相当比重的国际合著论文被引量小于样本的平均水平，并形象地称之为 “冷链”； 2010 年， M Franceschet 等［25］以 3 人为单位对合著作者进行分组，按照被引频次在整体样本中分布将论文质量划分为 4 个等级，并以此来研究作者合著规模和被引频次之间的关系，表明小规模的合作是较为有效的； 2013 年，钟镇［26］将作者人数窗口变为 1 人，并以相应人数窗口下的篇均被引作为论文影响力的衡量指标考察图书情报领域中作者合著和论文被引频次之间的关系，结果显示 4 人是最佳的合著规模； 2014 年，林卉［27］通过社会网络分析法来探讨生物信息学领域机构合作对论文影响力之间的相关关系，发现机构数目为 5 个、国家数目为 6 个是最佳的合作规模。
1. 3 相关研究的不足之处
通过对相关文献的梳理和总结，我们可以看出现有研究还存在以下不足： 1）论文影响力的测量指标比较混乱，现有的研究对论文影响力的测量方法大多为同行评议和论文的篇均被引，而且没有消除引用时间长短对论文被引频次带来的累积影响； 2）科学合作的外延定义较小，目前对科学合作的研究主要是从作者合作展开，少量的成果涉及到机构合作和国家合作； 3）研究样本多局限于某一学科领域或者某一期刊，其研究结论不具有普遍实用价值。因此，本文是相关研究的基础上，明确论文影响力测量指标，扩大科学合作外延，选取多学科领域的样本，研究科学合作和论文影响力之间的关系，分析科学合作是否对论文影响力存在着提升作用，以期为学者探寻最佳的合作模式提供参考。
2 数据来源和研究方法
2. 1 数据来源
本研究的数据来源为 WoS 核心合集，选取了复合材料（Material Science， Composites）、图书情报（Information Science ＆ Library Science）、科学史与科学哲学（History ＆ Philosophy of Science） 3 个学科的数据，这 3 个学科分别是理工科、社会科学和人文科学的代表。考虑到论文的被引频次需要时间的累积，因此本文选取了距今至少有 5 年的发文及其被引数据，即 3 个学科 2009－2012 年分别被 JCR 收录的期刊及其发文和被引数据。从检索结果来看， Review 类型的文章多为独著，且被引频次较高，容易对实验产生较大的影响，所以被排除在外，仅收集文献类型为 Article 的数据。检索时间为 2018 年 1 月 13 日至 2018 年 1 月 19 日，共得到 39 399条记录，其中复合材料10 456条，图书情报 12 202条，科学史与科学哲学5 822条，如表 1 所示（括号中数字代表当年 JCR 收录的期刊数量）。
2. 2 研究方法
为消除引用时间长短对实验结果的干扰，本研究使用 5 年固定引文窗口的被引频次作为论文影响力的衡量指标，即仅统计论文发表之后 5 年时间的引文数量。笔者首先将题录信息导入 Excel 表，统计每篇论文的被引频次。在假设验证部分，采用 Excel 和 SPSS21. 0 作为数据统计和分析软件，首先对作者人数、机构数目、国家数目的分布情况进行统计，分析论文的合作情况；进而利用 SPSS21. 0 分析作者合作、机构合作、国家合作与论文影响力的相关性关系，验证本研究中提出的假设；根据科研成本控制中的成本效益原则［28］，科学合作规模不可能无限地扩大，因此，笔者分析高被引论文中作者、机构、国家的合作情况，以此来发现最佳的合作规模。
本文将机构界定至二级单位，但确定机构的过程较为复杂，出现了以下 3 种问题： 1）一篇论文的同一作者属于不同的单位； 2）部分数据不存在 C1 字段，无法直接提取出作者所属的单位名称； 3）少量的论文作者署名为匿名（Anonymous）。针对上述问题，笔者制定了对应的处理措施： 1）若一篇论文的同一作者属于不同的机构，笔者只选取排名第一的单位名称作为论文作者所属的机构，这也就意味着独著作者只存在着一个机构； 2）部分数据不存在 C1 字段，对此，笔者根据记录的 TI 字段重新检索，使用论文 Online 链接原文网站提取论文信息、通过论文原文的作者简介匹配作者的机构名称、使用 ORCID 与 ResearchID 追踪作者在论文发表时的所属机构 3 种方法，解决 C1 字段缺失的问题； 3）少数论文作者署名为匿名（ Anony mous），这种情况无法确定论文作者的具体信息，但这种情况较为少见，且均为独著，所以对实验结果影响较小。
3 结果分析与讨论
3. 1 描述性统计分析
根据数据统计结果，表 2～4 分别是复合材料、图书情报、科学史与科学哲学领域（学科顺序下同）作者人数、机构数目与国家数目的分布情况。由表 2 可以看出， 3 个学科的合作情况差别较大，复合材料、图书情报的合著率分别为 94. 1％、 67. 9％，合作比例较大，但科学史与科学哲学的合著率仅为 23. 7％，这与人文学科的学科特点有关，人文学科研究个人见解比重大，个性化较强，不适合做集体研究［29］。但综合比较 3 个表发现，相对于作者合作，机构合作和国家合作水平仍然处于较低的水平，这说明了科学家倾向选择同一机构或者同一国家的合作伙伴。除此之外，笔者分别考察了论文数目随作者、机构、国家的变化情况，发现论文数目与作者、机构和国家的变化情况大体上符合洛特卡定律［30］。
3. 2 科学合作与论文影响力相关性分析在分析科学合作与论文影响力之间的相关性之前，笔者首先检验被引频次不符合正态分布，所以在分析科学合作与论文影响力相关性使用 Spearman 系数。
3. 2. 1 作者合作与论文影响力相关性分析作者人数的增加，通常意味着团队智慧的增长。为了分析作者合作和论文影响力之间的相关关系，本文使用 0 ～ 1 虚拟变量来代替论文独著和合著，表 5 是虚拟变量独立样本 t 检验结果，结果显示， 3 个学科合作论文的影响力均显著大于非合作论文。在此基础上，笔者考察作者人数和论文影响力之间的相关关系，结果如表 6 所示。由此可见，在上述 3 个学科中，作者人数和论文影响力显著的正相关关系，假设 1 成立。
3. 2. 2 机构合作与论文影响力相关性分析
从机构层面分析科学合作与论文影响力之间的相关关系，笔者仍采用独立样本 t 检验和双变量相关分析，分别从平均水平和整体水平来分析机构合作对论文影响力之间的关系。表 7 是机构独立样本 t 检验的结果，多机构合作论文的篇均被引要显著大于单机构论文。表 8 是具体考察每篇论文的机构数目和论文影响力之间的相关性检验结果，结果表明上述 3 个学科机构数目和论文影响力也均呈现出显著的正相关关系，假设 2 成立。
3. 2. 3 国家合作与论文影响力相关性分析基于提取的论文国家数据，构建国家之间合作矩阵，其中中国大陆与中国台湾地区的合作不视为国际合作，从共现矩阵结果来看，科学合作大多发生在同一国家内。笔者对国家合作和论文影响力的相关性分析，仍从平均水平和整体水平两个方面展开，表 9、 10 分别是国家数目和论文影响力独立样本 t 检验结果和相关性检验结果，表 9 的结果表明，从平均水平来看，多国家合作的论文影响力要显著高于单国家完成的论文，表 10 的结果说明在整体水平上论文影响力与国家数量呈现出显著的正相关关系，假设 3 成立。
3. 3 高被引论文科学合作情况
上述分析结果表明，科学合作与论文影响力之间的正相关关系显著成立，但根据科研成本控制的成本效应原则［28］，科学合作的规模不可能无限扩大。因此，本文在相关性分析的基础上，进一步以高被引论文为研究对象来探寻最佳的合作规模。普赖斯定律是用来筛选高产作者，但多数情况下，高产作者和高被引论文的分布具有相同或者相似的规律［31］。因此，本文使用普赖斯定律确定高被引论文。
其中， nmax 是被引频次最高的论文的被引频次， N 为确定高被引论文的最低被引频次。根据式（1），确定复合材料高被引论文1 949篇（被引频次≥15），图书情报1 621篇（被引频次≥ 17），科学史与科学哲学1 274篇（被引频次≥6）。篇均被引反映的是某一窗口下论文被引的平均水平，不能具体到每一篇论文的情况。散点图能详细表示因变量与自变量的分布模式［32］，因此，本文使用分布散点图来考察高被引论文的作者、机构、国家的分布情况。图 2 ～ 4 分别是 3 个学科高被引论文的作者人数、机构数目与国家数目的分布情况。通过观察图中点的密度情况，我们发现，被引频次与合作规模大致呈现出倒 U 型关系，作者规模为 2～4 人时高被引论文分布最为普遍，但在科学史与科学哲学领域中，合作规模要偏小，作者 1 人也分布着较多的高被引论文；机构层面，机构数目为 1～3 个时高被引论文分布比例最大；国家层面，国家数目为 1 ～ 2 个时高被引论文分布比例最大。
通过上述分析结果，我们可以发现，科学合作与论文影响力的正相关关系显著成立，但区别在于科学合作带来的边际效益有所不同。所以，对于假设 4 来说，结论准确表达为，在不同的学科中科学合作对论文影响力相关关系是相同的，但影响程度存在着差异。
随着科学合作的需求不断增强，科学合作的范围不断扩大，而且大多数科研人员在跨国流动的过程中，与原机构建立起更多的联系［33］。在实际的科学活动中，各个层面的合作通常相互交叉叠加，形成错综复杂的互动关系［34］。从结果来看，国家合作、机构合作和作者合作 3 个层次存在着交集，而且三者重叠的程度越大，论文的影响力也就越大，即多国家多机构多人＞多国家多机构单人＞多国家单机构多人＞多国家单机构单人＞单国家多机构多人＞单国家多机构单人＞单国家单机构多人＞单国家单机构单人。
4 结语
科学绩效一直是科研人员关注的问题，科学合作影响科学绩效，而且合作模式不同，科学绩效也会不同。本文以 2009－2012 年复合材料、图书情报和科学史与科学哲学领域发文为研究对象，以论文 5 年固定引文窗口下被引频次作为论文影响力测量指标，分别从作者合作、机构合作和国家合作 3 个层次测度科学合作和论文影响力之间的相关关系，得出以下结论：
第一，科学合作在以复合材料为代表的理工学科、图书情报为代表的社会学科中较为普遍，但由于人文学科本身的特点［29］，学术研究不宜频繁合作，论文合著率相对处于较低的水平。
第二，作者合作、机构合作、国家合作均与论文影响力之间存在着正相关关系。在不同的学科中，这种正相关的趋势是相同的，但区别是科学合作所带来的边际效益存在着差异。
第三，根据成本控制中的成本效益原则［28］，科学合作的规模不会无限扩大。以高被引论文为研究对象来探索最佳的合作规模，最佳的作者合作规模为 2～4 人，最佳的机构合作规模为 1 ～ 3 个，最佳的国家合作数目为 1 ～ 2 个。但在实际情况中，不同层次的科学合作通常交叉重叠，形成复杂的互动关系。
由于时间和精力的限制，本研究仍存在一些不足，主要体现在研究对象的选取方面、论文机构确定等，希望在未来的研究中进一步深入思考和探索。

相关文章：中医药期刊零被引论文的特征分析与对策——以《广西中医药》为例

关于我们: CheckBao是中文学术论文相似度查重检测系统，是权威、可信赖的中文学术剽窃检查的在线网站。CheckBao论文查重检测系统专注中文学术检测抄袭，基于亿级学术期刊、学位论文和互联网数据，采用大数据中文语义识别比对技术，为学术原创保驾护航。

联系我们: 客服QQ：1436706507