Skip to Main Content

文献计量学与科研影响力: 计量指标

导论

       本栏目介绍一些常用计量指标,分为论文层级指标、期刊层级指标、学者层级指标。各类指标以Clarivate的JCR、ESI、Incites数据库的指标为主,同类平台如Elsevier的Scopus和SciVal的类似指标也会做相关介绍。本栏目除了介绍指标的定义、计算方法,并且对指标的不足或者使用时应注意的地方做相关说明,有助于更加全面认识计量指标。

论文层级指标

被引频次

指的是论文在发表后被引用的次数。

由于数据库的数据源范围和年限不同,同一篇论文在不同索引数据库的被引频次是不同的,通常数据库收录数据量越大,被引频次越高。例如,一篇期刊论文在SCIScopusGoogle Scholar的被引频次很可能是不同的,通常是SCI<Scopus<Google Scholar

归一化的引文影响力

由于不同学科、不同出版年、不同文献类型论文的被引频次存在不可比性,因此科研绩效评价数据库推出归一化的引文影响力指标,例如Incites平台的学科规范化的引文影响力指标(Category Normalized Citation Impact, CNCI)、SciVal平台的领域加权的引用影响力指标(Field-Weighted Citation Impact, FWCI)。CNCIFWCI是两个平台的不同命名,其计算方法和用途是相似的。下方以CNCI为例做详细解释。

一篇论文学科规范化的引文影响力 (CNCI) 是通过将其被引频次除以同出版年、同学科领域、同文献类型论文的平均被引频次得到的。

每个出版年、学科、文献类型的篇均被引频次的基线值以平均值的方法计算,其中e为基线值,f为学科领域,t为出版年、d为文献类型,c为被引频次,p为论文数量。

一篇论文的CNCI计算公式如下,等于该篇论文引用频次除以相应的基线值:

一组论文集的CNCI的计算公式如下,例如某个人、机构或国家的CNCI,等于该组论文CNCI的平均值。

一篇论文的

CNCI

含义

<1

低于全球同出版年、同学科、同文献类型论文的平均被引表现

=1

与全球同出版年、同学科、同文献类型论文的平均被引表现相当

>1

高于全球同出版年、同学科、同文献类型论文的平均被引表现

CNCI为一个成熟的影响力指标,其价值在于消除了出版年、学科领域和文献类型对被引频次的影响,可进行跨出版年、学科、文献类型的论文引文影响力的偏差小的比较。不过在使用该指标时需要注意三点:

1)当样本量较小时,例如某个学者个人的出版物,CNCI值可能会被一篇高被引论文显著影响。

2CNCI是一个平均值,因此即使样本量足够大,例如某机构的全部出版物,少数高被引论文也可能对CNCI的值产生巨大影响。

3)出版当年的基线值通常很低,因此出版当年CNCI值可能产生高于预期的波动。

被引次数排名前1%的论文

被引次数排名前1%的论文指同出版年、同学科、同文献类型论文中被引次数排名前1%的论文。该指标来自Incite平台,同类指标还有被引次数排名前10%的论文SciVal平台也有类似指标即Outputs in Top Citation Percentiles,并有1%5%10%25%四个选项遴选,但是须注意的是,该指标只是同出版年比较,在遴选时同时勾选field weighted选项从而确保对不同学科、不同文献类型做了归一化后的比较。

该指标可用于评价一位学者或者一所机构。例如,一所机构被引次数排名前1%的论文百分比是将该机构的被引次数排名前1%的论文数除以机构的论文总数得到的。该指标的全球基准值是1%,如果一所高校被引次数排名前1%的论文百分比高于全球基准值,则表明其产出高影响力论文的能力高于全球平均水平。尽管排名前1%可以代表高影响力论文,但从本质来讲,它通常只代表了一组文献集中的很少一部分,因此小样本量的统计学相关性成为该指标的一个重要问题。该指标适合与大样本量数据集一起使用。

ESI高被引论文(ESI Highly Cited Paper

根据同出版年同ESI学科统计最近10年发表论文中被引用次数进入世界前1%的论文。

ESI热点论文(ESI Hot Paper

ESI学科统计最近两年发表、在最近两个月里被引用次数进入世界前0.1%的论文。

 

期刊层级指标

期刊影响因子(Journal Impact Factor

期刊影响因子来自Journal Citation Reports®数据库(简称JCR)。2023年,JCR将对Web of Science核心合集收录的所有期刊赋予期刊影响因子。自此,AHCI和ESCI期刊都将获得期刊影响因子。

通常情况下,只有当一种期刊被Web of ScienceTM核心合集收录3年以上才会计算出它的影响因子。因为如果以JCR年(JCR years)为节点,影响因子实际是该期刊前两年发表论文在JCR年的被引用次数除以该期刊前两年发表的论文数得到的。比如期刊PLoS Biology 2022 JCR年的影响因子是9.8意味着这种期刊在2020年和2021年所发表的文章在2022年平均被引用9.8次。

期刊分区(JIF Quartile

Journal Citation Reports®数据库中每个Web of ScienceTM学科(Subject Categories)中的期刊按其影响因子值从高到低排序,若一期刊的影响因子属于前1/4则将其划分到分区Q1,若一期刊的影响因子属于接下来的1/4区间则将其划分到分区Q2Q3Q4的含义类似,Q1Q2Q3Q4又被称为一区、二区、三区和四区。

期刊影响因子百分位(JIF Percentile

Journal Citation Reports®数据库提供这一指标,将期刊影响因子在某一学科下的排名转化为百分位值,从而使得跨学科的期刊比较变得更有意义。该指标通过以下公式计算:

其中N为某一学科中的期刊总数,R是某期刊在该学科的影响因子排位数(降序)

期刊引文指标(Journal Citation Indicator)

       期刊引文指标(Journal Citation Indicator,简称JCI)于2021年发布,是一个规范化的期刊影响力指标。该指标的计算方式是某期刊前三年里出版的所有研究论文(articles)和综述(reviews)的平均CNCI。例如,计算期刊2022年的JCI数值,则需要对2019年、 2020年和2021年该期刊出版的所有研究论文和综述的CNCI进行分析。SCIE、SSCI、AHCI以及 ESCI收录的期刊均可获得JCI指标。

CiteScore

该指标来自Scopus数据库,指标意义与JIF类似,只是数据源和计算方法有所不同。CiteScore计算的是4个日历年内期刊上发表的5种同行评审文献类型(研究论文、评论论文、会议论文集、数据论文和书籍章节)的平均被引用次数。连续出版物名称的期号所属的日历年份取决于封面日期,而不是连续出版物期号上线的日期。

作者层级指标

h指数(h-Index

h指数的计算基于一组按被引频次降序排列的出版物集合。该论文集合中,如果N篇论文拥有大于等于N次引文,则h值等于N。例如,h=12,说明该作者发表的论文中有12篇论文至少被引用了12次。

作为一个计量指标,h指数的优势是作为一个简单的数学指标。综合考虑了作者的科研产出(文献数量)和科研影响力(引文数量),被认为是展现科研工作者终生成就的指标,因此一经提出便成为颇为流行的文献计量学指标。缺点是h指数是一个与实践相关的指数,它与一位科研工作者职业生涯的长度和发表论文的总数密切相关,对于年轻学者不利;此外各学科的文献出版规模差异较大,不适合跨学科之间比较。

g指数(g-Index

g指数是h指数的衍生指数,主要是弥补h指数不能很好反映高被引论文的缺陷提出的,g指数定义为:论文按被引次数排序后相对排前的累积被引至少g2的最大论文序次g,亦即第(g+1)序次论文对应的累积引文数将小于(g+1)2