目前,共有3个有影响力的高被引学者榜单,分别是Clarivate高被引科学家、斯坦福大学全球前2%顶尖科学家、Elsevier中国高被引学者。三个榜单都是基于文献计算量学方法遴选具有引文影响力的学者,但是数据源和方法论有较大差异。前两者面向全球科学家、后者面向中国大陆学者。
2001年,Clarivate第一次发布高被引科学家(Highly Cited Researcher),之后在2014年开始每年11或12月发布榜单。该榜单面向全球科学家,数据来源自ESI数据库。近几年该榜单人数规模约为6000余人,中国大陆学者进榜人数逐年上升。2023年11月15日,全球共有6849名位学者(7125人次)入选该名单,中国内地以1275人次居第二名,占比达17.9%。
具体方法
用于分析和遴选“高被引科学家”的数据源于基本科学指标(ESI)数据库。2023年榜单基于2012-2022年间高被引论文。按照ESI学科和出版年,每一篇论文的总被引频次排名位于前1%。
分类
在ESI中,所有论文包括高被引论文被划分到22个宽泛的领域(第22个领域为跨学科领域,见下文)。ESI的每一种期刊都仅被划分到一个领域,并且在该期刊中出现的论文也同样被分配到该领域。对于多学科期刊如《科学》、《自然》等都会对其进行特别的分析。此类出版物中的每篇文章会被单独评估,包括对参考文献中引用的期刊领域归属进行分析。最后,将该论文重新归类到其参考文献中最频繁出现的领域。
最终名单
对于每个ESI领域,通过先进的聚类法对作者姓名进行消歧,计算簇的个数,每个簇代表一个单独的科研人员。计算每个领域里面簇(科研人员)的个数的平方根。用这个数字来判断每个ESI领域上榜研究人员的大概数目。在某一个领域中高被引论文排名的作者名单中,平方根数值的作者的论文数目决定了该领域入选高被引科学家榜单需要发表的高被引论文数的阈值。
此外,入选者全部高被引论文的总被引频次必须达到2012年到2022年间ESI作者的总被引频次阈值,即在该ESI领域排名前1%。
如果一个作者发表的高被引论文数低于阈值一篇,但是其被引频次能令其排在按照阈值入选榜单的科研人员的前50%,这些作者也将入选。
ESI Field |
First Name |
Last Name |
HCPs |
Citation to HCPs |
Field Paper Threshold |
Field Citation Threshold |
Field Citation Threshold if One Fewer Paper than Threshold Number |
Status |
Field 9 |
Mary |
Pandit |
17 |
2838 |
11 |
1112 |
2920 |
Selected |
Field 9 |
William |
Clever |
10 |
3677 |
11 |
1112 |
2920 |
Selected |
Field 9 |
Judith |
Sage |
10 |
1008 |
11 |
1112 |
2920 |
Not Selected |
增加了具有跨领域影响力的研究人员
科睿唯安一直力图发掘具备跨学科影响力的研究人员,这项工作至今已迈入第六年。他们或许在多个不同领域贡献了多篇高被引论文,但在任何单一ESI学科领域的高被引论文数量都达不到入选“高被引科学家”的阈值要求。
发掘此类研究者能让高被引科学家的名单始终与时俱进,因为这往往能将年轻研究人员以及在交叉学科开展研究工作的科学家带进我们的视野。
为了识别具有跨学科影响力的研究者,科睿唯安根据各学科领域的阈值要求进行了分数计数,从而对高被引论文数和被引频次加以规范化(因此,每篇“临床医学”论文的单位分数都小于“空间科学”论文)。被引频次也以类似的方式进行分数计数。如果某位研究者的高被引论文数分数计数之和以及被引频次分数计数之和均等于或大于1.0,那么其影响力便相当于入选单个或多个ESI学科“全球高被引科学家”的研究者,因此即评为具有卓越跨学科科研表现的科学家。
2011到2021年虚构研究者Joseph Savant在四个ESI学科发表了15篇高被引论文。其中七篇在领域6,该领域的论文数入选阈值为8篇,这些论文为Savant拿到了0.875分(或7/8)。领域14入选阈值为6篇,Savant在该领域的三篇论文可得0.5分。各领域的分数论文计数之和产生了1.67的跨学科论文数总分值。分数达到或超过1表明该研究人员的影响力等同于入选单一ESI学科“高被引科学家”名单的研究者。第二个入选“全球高被引科学家”名单的标准是引文数是否足以排进某一领域的前1%。同样,不同领域的被引频次也以类似的方式进行分数计数。在上例中,Savant教授获得的引文数是入选高影响力跨学科研究人员所需引文数的五倍有余。
例外和排除
我们从分析中剔除了作者数超过30人或被出版商明确定义为团体作者的高被引论文。不仅如此,研究人员在任何机构、政府机构、资助机构或出版机构主办的学术活动中被发现存在科研不端行为也不能入选“全球高被引科学家”名单。
在2023年榜单中排除了“数学”领域。不同于其他ESI学科,数学领域的研究高度分化,由为数不多的个人从事诸多专业课题的研究。数学领域的平均发表率和引用率相对较低,所以论文量和引文量增幅很小,这往往会扭曲对整个领域的代表性和分析。因此,通过发表和引用操纵来获取更高学术地位和奖励的手段在数学领域往往更容易实施,尤其是通过有针对性地引用新近发表的、更容易跻身高被引行列(引文量位居前1%)的论文。这不仅会错估具有影响力的论文和个人,还会埋没本来有资格入选的高影响力论文和研究者。当前负责任的做法就是为这一学科领域另设一套分析和判断方法,以正确认定在该领域拥有广泛、重大影响力的研究者。
Source: https://clarivate.com/highly-cited-researchers/
自2015年,Elsevier与上海软科教育信息咨询有限公司联合发布的”中国高被引学者年度榜单”。每年4或5月发布榜单。2019年及之前的榜单人数规模约2000余人,2020榜单人数规模上升到4023名,2021年榜单人数规模上升到4701位,2022年榜单人数规模上升到5216位。
方法论:
爱思唯尔2023“中国高被引学者”榜单以全球权威的引文与索引数据库Scopus作为中国学者科研成果的统计来源,采用上海软科教育信息咨询有限公司开发的方法。榜单基于以下条件,分析中国学者的科研成果表现:
1.年限范围:2023年榜单的文献年限范围为1996年-2023年。高被引学者数据截取时间一般在10月底,数据统计在11月至来年2月之间进行。
2.作者范围:Scopus收录的科研成果发表署名机构为中国(大陆)机构的作者,且现职工作单位在中国,包括非中国籍和非华裔学者。
3.作者类型:仅统计上述学者作为第一作者或通讯作者发表的科研成果(包括:期刊、会议、专著)。
4.学科分类:由爱思唯尔根据教育部(MOE)学科分类体系(按文章分类),统计Scopus数据库中每个MOE学科的中国大陆学者分布情况。基于每个MOE学科的中国大陆学者分布情况,由软科提供每个学科的初始名额分配。此次高被引学者的基础数据提取使用了爱思唯尔(Elsevier)教育部一级学科分类映射,覆盖了教育部13个学科领域、111教育部一级学科。最终上榜名单涵盖了其中的84个一级学科。学者的学科归属以学者发文占比最高的5个学科作为基础,并且一定程度上结合学者研究方向,最终确定上榜学科。
5.在榜单统计的上述学者(第一作者或通讯作者文献)需要满足:
学者就职机构认定:
以Scopus学者档案信息中的现就职机构为基准,同时结合已确认的学者或相关机构主动反馈和申请的机构调整记录,最终确认榜单中入选高被引学者的现职机构。
Source: https://mp.weixin.qq.com/s/ggRS-gRJDIbpJu9NppRm7g
斯坦福大学的John P. A.Ioannidis教授领导团队于2019年建立并发布“全球前2%科学家排名榜单”(Stanford University World’s Top 2% Scientists)。这份榜单从近700万名科学家中遴选出世界排名前2%的科学家共约16万名,涵盖文、理、工学科,分为22个领域和176个子学科,主要分为“终身科学影响力排行榜”和“年度科学影响力排行榜”两个榜单。
“斯坦福大学全球前2%顶尖科学家”方法论 | |
项目 | 内容 |
统计来源 | Scopus |
发表年份 | 终身科学影响力排行榜:1960~统计年 年度科学影响力排行榜:统计年度 |
学科分类 | 分20个领域和176个细分领域 |
学者数量 | 从近700万名科学家中遴选出世界排名前2%的科学家共约16万名 |
学者范围 | 全球科学家 |
筛选标准 | 使用六种关键指标综合评估来进行打分(综合引用指数):1. 总引用 量;2. Hirsch H- index;3. 共同作者修正的Schreiber Hm-index;4. 单 独作者; 5. 单独或者第一作者;6. 单独、第一或者通讯作者的文章引 用量 |
提供的排名 | 1 包含自我引用和不包含自我引用数据时在所有领域中排在前100,000 位(Top100,000)的顶尖科学家 |
2 综合指数不在前100,000位 (Top100,000),但在其主要子学科领域的 前 2%的科学家(这些科学家至少发表了5篇论文) |
|
3 每位科学家在其子学科内的综合引用指数排名 |
下方为自2019年起发布的榜单链接:
2019年:
2020年:
2021年:
https://elsevier.digitalcommonsdata.com/datasets/btchxktzyw/3
2022年:
https://elsevier.digitalcommonsdata.com/datasets/btchxktzyw/4
2023年:
https://elsevier.digitalcommonsdata.com/datasets/btchxktzyw/6
2024年:
https://elsevier.digitalcommonsdata.com/datasets/btchxktzyw/7