原创 李翔、段晓君 集智俱乐部
导语
准确揭示高阶引文网络中期刊的特征有助于构建良好的期刊评价体系。近日发表在Scientometrics上的一篇文章,作者基于期刊引文流之间的依赖关系,提出了高阶重要性和高阶复杂性的评价指标,较为准确地识别了重要期刊和期刊种类。这也为学术论文投稿提供了一些理论参考。该研究受到了内容的启发。
研究领域:科学学,引文网络,高阶网络,节点重要性
李翔、段晓君 | 作者
邓一雪 | 编辑
论文题目:
Revealing the character of journals in higher-order citation networks[1]
论文链接:
https://link.springer.com/article/10.1007/s11192-022-04518-z
简介
引文网络的重要期刊识别方法可分为基于统计数据和基于网络拓扑两种。常见的基于统计数据方法包括影响因子,H指数,g指数,CiteScore,SNIP,SJR等等。常见的基于网络拓扑方法包括度中心性,接近中心性,介数中心性,PageRank,LeaderRank等等。
传统的基于网络拓扑方法以一阶引文网络为基础,分析期刊的重要性和复杂性。随着研究的深入,学者们发现一阶引文网络难以刻画期刊引文流之间的依赖关系。随之,“高阶网络”这一概念被提出:先将多元序列转化为高阶节点,再考虑连边之间的重新组合,最后得到一个全新的拓扑结构,即高阶网络。下图1是一个示例,由于时间1中多元序列P1→P3→P4,P2→P3→P5和时间2中多元序列P1→P3→P5,P2→P3→P4出现频率高,依赖关系较为突出,随之产生了P3|P1和P3|P2两个高阶节点,最后得到了两个不同的高阶网络。因此,利用高阶引文网络对期刊的重要性和复杂性开展研究,具有一定的科学依据。
图1 一阶网络和高阶网络示意图
模拟与算法
第一步:给定一阶引文网络,先将网络离散化,再根据期刊间的引文关系重新组合,得到多元序列数据,这一过程称为重组算法。由于重新组合的随机性,为了更加准确地刻画期刊引文流之间的依赖关系,因此采用独立重复实验10次。
第二步:基于多元序列数据,利用徐等人[2,3]提出的BuildHON+算法构建高阶引文网络。
第三步:基于高阶引文网络,定义高阶重要性指标和高阶复杂性指标,从而对期刊重要性和期刊种类进行评价。
作者将整个算法称为重组高阶网络算法(ReHON+)。当最大阶数为1或2时,记为ReFON算法或ReHON-2算法。此时,ReFON和传统的一阶网络(FON)是相同的。下图2是ReFON算法和ReHON+算法的示意图。
图2 ReFON算法和ReHON+算法示意图
数据描述
该数据集是APS出版社中22种期刊从1893年到2020年所有文章的引用关系,包括668,383篇文章和8,850,333次引用。下图是一阶引文网络和高阶引文网络展示图。
图3 一阶引文网络和高阶引文网络
指标定义
局部重要性(高阶加权出度)
全局重要性(高阶投票分数)
复杂性(高阶出度)
简单性(二阶自引率增量)
结果分析
以高阶加权出度和高阶投票分数分别作为高阶网络的局部重要性指标和全局重要性指标分析实验结果。重要性期刊RMP,PRX,PRL和PRAP的局部(全局)重要性排序以及归一化局部(全局)重要性有了大幅提高。图片形式与图4类似,不予展示。这说明这两个指标能够更加准确地刻画期刊的重要性。
以高阶出度作为高阶网络的复杂性指标分析实验结果。如图4所示,多学科期刊PRL,PRX,RMP,PRR,PRB,PRM和PRXQ的复杂性排序以及归一化复杂性有了大幅度提高。这说明这个指标能够更加准确地刻画期刊的复杂性。
以二阶自引率增量作为高阶网络的简单性指标分析实验结果。如图5所示,专业期刊的简单程度排序为PRC>PRA≈PRD≈PRE>PRB ,这与2020年JCR中期刊的种类数量保持一致。这说明这个指标能够很好地刻画期刊的简单性。
图4 APS期刊高阶复杂性
图5 期刊引文流
讨论
区别于单辆出租车的出行轨迹,单艘轮船的航行轨迹等,单次信息的传递存在着一对多的情况,由此,作者提供了改进的重组算法,如图6所示。
图6 改进重组算法
展望
在复杂系统中,个体之间不仅存在简单的二元交互关系,还存在多元同时交互或者多元顺序交互,即高阶交互现象。为此,学者们分别开发了基于组合(motif、超图和单纯复形)和基于依赖关系(高阶依赖网络)的网络高阶表示模型,统称为高阶网络。本文的表示模型为高阶依赖网络。基于依赖关系,高阶依赖网络不仅可以准确揭示期刊的特征,还可以在共存疾病识别、社会事件检测和战略意图研判等方面提供新的理论视角。
附录:
为了方便各位学者们的后续研究,作者在ResearchGate[1,4,5]上提供了APS出版社下长度不超过3的期刊引文流数据。如果使用该数据,请引用参考文献[1]。
参考文献:
[1] Li, X., Zhao, C., Hu, Z., Yu, C. and Duan, X. (2022). "Revealing the character of journals in higher-order citation networks. " Scientometrics. https://doi.org/10.1007/s11192-022-04518-z
[2] Xu, J., Wickramathne, T. W. and Chawla, N. V. (2016). "Representing higher-order dependencies in networks." Science Advances 2(5): e1600028. https://doi.org/10.1126/sciadv.1600028
[3] Saebi, M., Xu, J., Kaplan, L. M., Ribeiro, B. and Chawla, N. V. (2020). "Efficient modeling of higher-order dependencies in networks: from algorithm to application for anomaly detection." EPJ Data Science 9(1): 15. https://doi.org/10.1140/epjds/s13688-020-00233-y
[4] Li, X., Zhang, X., Huangpeng, Q., Zhao, C. and Duan, X. (2021). "Event detection in temporal social networks using a higher-order network model." Chaos: An Interdisciplinary Journal of Nonlinear Science 31(11): 113144. https://doi.org/10.1063/5.0063206
[5] https://www.researchgate.net/profile/Xiang-Li-308
原标题:《前沿速递:揭示高阶引文网络中期刊的特征》