论文查重 | 论文文献库 | 科学合作与论文影响力之间的相关性研究

科学合作与论文影响力之间的相关性研究

来源:论文查重 时间:2019-08-21 11:43:40

摘 要: [目的/ 意义] 随着科学研究综合性逐步加强, 合作日渐成为主流的科研方式。 通过对科学合作和 论文影响力之间相关性进行研究, 以探究科学合作是否对论文影响力存在着提升作用。 [方法/ 过程] 本文基于 JCR 的期刊数据, 在 Web of Science 核心合集中选取了复合材料、 图书情报和科学史与科学哲学领域 2009-2012 年的发文和被引数据, 借助多元统计软件 SPSS21. 0 和社会网络分析软件等从作者、 机构、 国家等 3 个层次研究 科学合作和论文影响力之间的相关关系, 进而以高被论文查重引论文为研究对象探寻最佳的合作规模。 [结果/ 结论] 在 不同的学科中, 作者合作、 机构合作和国家合作均与论文影响力呈显著的正相关关系, 但科学合作的边际效益不 同。 科学合作的规模不可能无限扩大, 最佳的作者合作规模为 2~4 人, 最佳的机构合作规模为 1~ 3 个, 最佳的 国家合作数目为 1~2 个。
随着科学发展的不断推进, 科学研究问题越来 越复杂, 专业化分工趋势也愈发明显, 单打独斗的 科研模式显得捉襟见肘。 因此, 科学家向外寻求帮 助, 集中不同成员的智慧共同解决问题, 科学合作 逐渐成为多数科学家首选的科研模式。 在大科学时 代, 科学合作主要有 3 种形式: 科学家之间的合 作、 科研机构之间的合作以及国家之间的合作。 然 而并非所有合作模式都是有效的, 因此, 需要通过 论文影响力来判断不同合作模式的有效性。 从整体 来看, 目前评价论文影响力的方法主要是同行评议 和以计量为基础的评价方法, 但由于同行评议方法 本身的要求, 导致这种方法主观性较大, 结果难以 控制。 所以, 本文采用以计量为基础的评价方法来 测度论文影响力, 使用论文被引频次作为论文影响 力的衡量指标, 并提出如下假设, 通过实证研究验 证假设是否成立。
H1: 作者合作及作者人数与论文影响力呈正 相关;
H2: 机构合作及机构数目与论文影响力呈正 相关;
H3: 国家合作及国家数目与论文影响力呈正 相关;
H4: 上述假设在不同的学科中存在着差异。
1 相关研究综述
17 世纪 60 年代, 首个无形学院成立[1], 学术 群体之间的合作联系开始兴起。 随后, 科学合作的 迅猛增长引起了科学家们的广泛关注和研究兴趣。 从目前来看, 科学合作的相关研究主要集中在科学 合作规律探寻和科学合作绩效评估两个方面。
1. 1 科学合作规律探寻
国内外学者对科学合作规律的探寻主要是采用 定量分析的方法来研究科学合作的比例和科学合作 呈现的趋势。 1963 年, DJ Price[2] 分析 1910-1960 年化学领域的论文发现, 50 年内作者合作比例从 不足 20%增长到 60%以上; 1968 年, HA Zucker man [3]统计24 297篇美国期刊论文后发现, 20 世纪 以来科学合作的比例每 25 年增长约 25 个百分点; 1996 年, W Glänzel 等[4] 分析了 SCI 数据库中的 4 534篇论文, 结果显示 90%以上的论文为合著论 文, 且篇均作者人数为 4. 5 人; 2013 年, 王贤文等[5]对中国的国际间合作情况进行研究, 结果表 明中国国际合作日益频繁, 合作对象多为北美和欧 洲国家。
除对科学合作的比例进行研究外, 还有对科学 合作趋势的研究。 1968 年, RK Merton[6] 从知识交 流和科学奖励等方面发现科学合作中存在着明显的 “马太效应”; 1994 年, JF Miquel 等[7] 从 8 个学科 对 98 个国家的国际合作、 国家间关系和科学产出 模式 3 个方面进行调查, 进而揭示不同国家存在着 不同科研行为; 2000 年, ME Newman[8] 调查了医 学、 物理学和计算机科学 3 个领域的科学合作网络 结构, 发现 “小世界” 效应十分显著; 次年, ME Newman[9-10]再次从网络结构、 最短路径和中心度 等方面对科学合作网络展开研究, 将科学合作网络 加权之后, 可以在网络中发现与其他节点平均距离 最近的节点; 2002 年, 我国学者梁立明等[11] 利用 CSCD 数据库揭示了我国学者跨省区合作对象会倾 向选择科学生产能力高的地区; 2004 年, 丁堃 等[12]对我国管理科学领域合作规模、 地域分布和 第一作者年龄分布做了调查, 结果显示在管理科学 领域小范围的合作会更加容易产生创新性思维, 合 作范围集中在同单位, 第一作者的平均年龄为 35. 79, 年轻化趋势明显; 2013 年, 杨思洛等[13]又 对中外图书情报领域合作强度、 合作范围与合作网 络等展开细致地比较, 发现在合作强度上国内合作 略高于国外, 主流合作模式是同城合作, 合作网络 均呈现出集中分散的态势; 2017 年, 丁颖等[14] 研 究科学合作参与者的研究差异对论文整体影响, 结 论显示跨领域合作可以提倡, 但是不应过度。
1. 2 科学合作绩效评估
科学合作绩效评估研究主要集中在两个方面, 分别是科学合作与论文生产力之间的关系、 科学合 作与和论文被引频次之间的关系。 1966 年, DJ Price 等[15]对 555 名作者的合作关系和生产力之间 的关系进行研究, 发现两者呈正相关; 1980 年, P Hodder[16]分析了机构合作数量与论文产出之间的 关系, 结果表明两者存在着倒 U 型关系, 即存在 着最佳的机构合作数目; 2001 年, A Hollis[17]通过 339 位经济学家的面板数据来评估科学合作和科研 产出之间的关系, 发现在科学合作和论文产出之间呈现负相关, 在此基础上, A Hollis 又深入分析了 出现负相关的原因, 包括合作团队工作的低效、 团 队成员之间的信息不对称等问题。 相对而言, 国内 学者对此也做出了一些积极的探索。 2007 - 2012 年, 刘则渊等[18-19] 以威布尔分布和核密度分布曲 线分别对 Web of Science 中物理学和分子生物学的 合作规模和产出关系进行拟合, 结果发现核密度曲 线的拟合程度较高; 2017 年, 刘俊婉[20] 发现分子 生物学、 遗传学和物理学领域的高被引科学家中, 合作者的论文数量呈负指数函数分布, 且随着合作 者数量增多, 论文产出量也随之增多。
在科学合作和论文被引频次之间的相关关系研 究方面, 1972 年, Arthur E Nudelman 等[21] 通过问 卷调查对美国、 加拿大 225 名社会学专家进行分 析, 结果显示, 合作研究比独著具有更高的学术声 誉; 1986 年, SM Lawani[22]对癌症领域的论文进行 研究发现, 随着作者人数的增加, 高质量论文的比 重上升, 自引总比重下降; 1990 年, F Narin 等[23] 也发现多国家合作论文被引频次约为单个国家的 2 倍; 2001 年, W Glänzel 等[24]发现化学领域有相当 比重的国际合著论文被引量小于样本的平均水平, 并形象地称之为 “冷链”; 2010 年, M Franceschet 等[25]以 3 人为单位对合著作者进行分组, 按照被 引频次在整体样本中分布将论文质量划分为 4 个等 级, 并以此来研究作者合著规模和被引频次之间的 关系, 表明小规模的合作是较为有效的; 2013 年, 钟镇[26] 将作者人数窗口变为 1 人, 并以相应人数 窗口下的篇均被引作为论文影响力的衡量指标考察 图书情报领域中作者合著和论文被引频次之间的关 系, 结果显示 4 人是最佳的合著规模; 2014 年, 林卉[27]通过社会网络分析法来探讨生物信息学领 域机构合作对论文影响力之间的相关关系, 发现机 构数目为 5 个、 国家数目为 6 个是最佳的合作规 模。
1. 3 相关研究的不足之处
通过对相关文献的梳理和总结, 我们可以看出 现有研究还存在以下不足: 1) 论文影响力的测量 指标比较混乱, 现有的研究对论文影响力的测量方 法大多为同行评议和论文的篇均被引, 而且没有消 除引用时间长短对论文被引频次带来的累积影响; 2) 科学合作的外延定义较小, 目前对科学合作的 研究主要是从作者合作展开, 少量的成果涉及到机 构合作和国家合作; 3) 研究样本多局限于某一学 科领域或者某一期刊, 其研究结论不具有普遍实用 价值。 因此, 本文是相关研究的基础上, 明确论文 影响力测量指标, 扩大科学合作外延, 选取多学科 领域的样本, 研究科学合作和论文影响力之间的关 系, 分析科学合作是否对论文影响力存在着提升作 用, 以期为学者探寻最佳的合作模式提供参考。
2 数据来源和研究方法
2. 1 数据来源
本研究的数据来源为 WoS 核心合集, 选取了 复合材料 (Material Science, Composites)、 图书情 报 (Information Science & Library Science)、 科学史 与科学哲学 (History & Philosophy of Science) 3 个 学科的数据, 这 3 个学科分别是理工科、 社会科学 和人文科学的代表。 考虑到论文的被引频次需要时 间的累积, 因此本文选取了距今至少有 5 年的发文 及其被引数据, 即 3 个学科 2009-2012 年分别被 JCR 收录的期刊及其发文和被引数据。 从检索结果 来看, Review 类型的文章多为独著, 且被引频次 较高, 容易对实验产生较大的影响, 所以被排除在 外, 仅收集文献类型为 Article 的数据。 检索时间 为 2018 年 1 月 13 日至 2018 年 1 月 19 日, 共得到 39 399条记录, 其中复合材料10 456条, 图书情报 12 202条, 科学史与科学哲学5 822条, 如表 1 所 示 (括号中数字代表当年 JCR 收录的期刊数量)。
2. 2 研究方法
为消除引用时间长短对实验结果的干扰, 本研 究使用 5 年固定引文窗口的被引频次作为论文影响 力的衡量指标, 即仅统计论文发表之后 5 年时间的 引文数量。 笔者首先将题录信息导入 Excel 表, 统 计每篇论文的被引频次。 在假设验证部分, 采用 Excel 和 SPSS21. 0 作为数据统计和分析软件, 首先 对作者人数、 机构数目、 国家数目的分布情况进行 统计, 分析论文的合作情况; 进而利用 SPSS21. 0 分析作者合作、 机构合作、 国家合作与论文影响力 的相关性关系, 验证本研究中提出的假设; 根据科 研成本控制中的成本效益原则[28], 科学合作规模 不可能无限地扩大, 因此, 笔者分析高被引论文中 作者、 机构、 国家的合作情况, 以此来发现最佳的 合作规模。
本文将机构界定至二级单位, 但确定机构的过 程较为复杂, 出现了以下 3 种问题: 1) 一篇论文的同一作者属于不同的单位; 2) 部分数据不存在 C1 字段, 无法直接提取出作者所属的单位名称; 3) 少量的论文作者署名为匿名 (Anonymous)。 针 对上述问题, 笔者制定了对应的处理措施: 1) 若 一篇论文的同一作者属于不同的机构, 笔者只选取 排名第一的单位名称作为论文作者所属的机构, 这 也就意味着独著作者只存在着一个机构; 2) 部分 数据不存在 C1 字段, 对此, 笔者根据记录的 TI 字 段重新检索, 使用论文 Online 链接原文网站提取 论文信息、 通过论文原文的作者简介匹配作者的机 构名称、 使用 ORCID 与 ResearchID 追踪作者在论 文发表时的所属机构 3 种方法, 解决 C1 字段缺失 的问题; 3) 少数论文作者署名为匿名 ( Anony mous), 这种情况无法确定论文作者的具体信息, 但这种情况较为少见, 且均为独著, 所以对实验结 果影响较小。
3 结果分析与讨论
3. 1 描述性统计分析
根据数据统计结果, 表 2~4 分别是复合材料、 图书情报、 科学史与科学哲学领域 (学科顺序下 同) 作者人数、 机构数目与国家数目的分布情况。 由表 2 可以看出, 3 个学科的合作情况差别较大, 复合 材 料、 图 书 情 报 的 合 著 率 分 别 为 94. 1%、 67. 9%, 合作比例较大, 但科学史与科学哲学的合 著率仅为 23. 7%, 这与人文学科的学科特点有关,人文学科研究个人见解比重大, 个性化较强, 不适 合做集体研究[29]。 但综合比较 3 个表发现, 相对 于作者合作, 机构合作和国家合作水平仍然处于较 低的水平, 这说明了科学家倾向选择同一机构或者 同一国家的合作伙伴。 除此之外, 笔者分别考察了 论文数目随作者、 机构、 国家的变化情况, 发现论 文数目与作者、 机构和国家的变化情况大体上符合 洛特卡定律[30]。
3. 2 科学合作与论文影响力相关性分析 在分析科学合作与论文影响力之间的相关性之 前, 笔者首先检验被引频次不符合正态分布, 所以 在分析科学合作与论文影响力相关性使用 Spearman 系数。
3. 2. 1 作者合作与论文影响力相关性分析 作者人数的增加, 通常意味着团队智慧的增 长。 为了分析作者合作和论文影响力之间的相关关 系, 本文使用 0 ~ 1 虚拟变量来代替论文独著和合 著, 表 5 是虚拟变量独立样本 t 检验结果, 结果显 示, 3 个学科合作论文的影响力均显著大于非合作 论文。 在此基础上, 笔者考察作者人数和论文影响 力之间的相关关系, 结果如表 6 所示。 由此可见, 在上述 3 个学科中, 作者人数和论文影响力显著的 正相关关系, 假设 1 成立。
3. 2. 2 机构合作与论文影响力相关性分析
从机构层面分析科学合作与论文影响力之间的 相关关系, 笔者仍采用独立样本 t 检验和双变量相 关分析, 分别从平均水平和整体水平来分析机构合作对论文影响力之间的关系。 表 7 是机构独立样本 t 检验的结果, 多机构合作论文的篇均被引要显著 大于单机构论文。 表 8 是具体考察每篇论文的机构 数目和论文影响力之间的相关性检验结果, 结果表 明上述 3 个学科机构数目和论文影响力也均呈现出 显著的正相关关系, 假设 2 成立。
3. 2. 3 国家合作与论文影响力相关性分析 基于提取的论文国家数据, 构建国家之间合作 矩阵, 其中中国大陆与中国台湾地区的合作不视为 国际合作, 从共现矩阵结果来看, 科学合作大多发 生在同一国家内。 笔者对国家合作和论文影响力的相关性分析, 仍从平均水平和整体水平两个方面展 开, 表 9、 10 分别是国家数目和论文影响力独立样 本 t 检验结果和相关性检验结果, 表 9 的结果表 明, 从平均水平来看, 多国家合作的论文影响力要 显著高于单国家完成的论文, 表 10 的结果说明在 整体水平上论文影响力与国家数量呈现出显著的正 相关关系, 假设 3 成立。
3. 3 高被引论文科学合作情况
上述分析结果表明, 科学合作与论文影响力之 间的正相关关系显著成立, 但根据科研成本控制的 成本效应原则[28], 科学合作的规模不可能无限扩大。 因此, 本文在相关性分析的基础上, 进一步以 高被引论文为研究对象来探寻最佳的合作规模。 普赖斯定律是用来筛选高产作者, 但多数情况 下, 高产作者和高被引论文的分布具有相同或者相 似的规律[31]。 因此, 本文使用普赖斯定律确定高 被引论文。
其中, nmax 是被引频次最高的论文的被引频 次, N 为确定高被引论文的最低被引频次。 根据式 (1), 确定复合材料高被引论文1 949篇 (被引频次≥15), 图书情报1 621篇 (被引频次≥ 17), 科学史与科学哲学1 274篇 (被引频次≥6)。 篇均被引反映的是某一窗口下论文被引的平均 水平, 不能具体到每一篇论文的情况。 散点图能详 细表示因变量与自变量的分布模式[32], 因此, 本 文使用分布散点图来考察高被引论文的作者、 机 构、 国家的分布情况。 图 2 ~ 4 分别是 3 个学科高 被引论文的作者人数、 机构数目与国家数目的分布 情况。 通过观察图中点的密度情况, 我们发现, 被 引频次与合作规模大致呈现出倒 U 型关系, 作者 规模为 2~4 人时高被引论文分布最为普遍, 但在 科学史与科学哲学领域中, 合作规模要偏小, 作者 1 人也分布着较多的高被引论文; 机构层面, 机构 数目为 1~3 个时高被引论文分布比例最大; 国家 层面, 国家数目为 1 ~ 2 个时高被引论文分布比例 最大。
通过上述分析结果, 我们可以发现, 科学合作 与论文影响力的正相关关系显著成立, 但区别在于 科学合作带来的边际效益有所不同。 所以, 对于假 设 4 来说, 结论准确表达为, 在不同的学科中科学 合作对论文影响力相关关系是相同的, 但影响程度 存在着差异。
随着科学合作的需求不断增强, 科学合作的范 围不断扩大, 而且大多数科研人员在跨国流动的过 程中, 与原机构建立起更多的联系[33]。 在实际的 科学活动中, 各个层面的合作通常相互交叉叠加,形成错综复杂的互动关系[34]。 从结果来看, 国家 合作、 机构合作和作者合作 3 个层次存在着交集, 而且三者重叠的程度越大, 论文的影响力也就越 大, 即多国家多机构多人>多国家多机构单人>多 国家单机构多人>多国家单机构单人>单国家多机 构多人>单国家多机构单人>单国家单机构多人>单 国家单机构单人。
4 结 语
科学绩效一直是科研人员关注的问题, 科学合 作影响科学绩效, 而且合作模式不同, 科学绩效也 会不同。 本文以 2009-2012 年复合材料、 图书情 报和科学史与科学哲学领域发文为研究对象, 以论 文 5 年固定引文窗口下被引频次作为论文影响力测 量指标, 分别从作者合作、 机构合作和国家合作 3 个层次测度科学合作和论文影响力之间的相关关 系, 得出以下结论:
第一, 科学合作在以复合材料为代表的理工学 科、 图书情报为代表的社会学科中较为普遍, 但由 于人文学科本身的特点[29], 学术研究不宜频繁合 作, 论文合著率相对处于较低的水平。
第二, 作者合作、 机构合作、 国家合作均与论 文影响力之间存在着正相关关系。 在不同的学科 中, 这种正相关的趋势是相同的, 但区别是科学合 作所带来的边际效益存在着差异。
第三, 根据成本控制中的成本效益原则[28], 科学合作的规模不会无限扩大。 以高被引论文为研 究对象来探索最佳的合作规模, 最佳的作者合作规 模为 2~4 人, 最佳的机构合作规模为 1 ~ 3 个, 最 佳的国家合作数目为 1 ~ 2 个。 但在实际情况中, 不同层次的科学合作通常交叉重叠, 形成复杂的互 动关系。
由于时间和精力的限制, 本研究仍存在一些不 足, 主要体现在研究对象的选取方面、 论文机构确 定等, 希望在未来的研究中进一步深入思考和探 索。

相关文章:中医药期刊零被引论文的特征分析与对策——以《广西中医药》为例