SciHub下载量成论文影响力预测指标:能被下载的论文被引次数高出72%
天下苦学术出版商久矣
鱼羊 发自 凹非寺
量子位 报道 | 公众号 QbitAI
嗑盐的你,用过Sci-hub吗?
作为一个能免费看论文的学术搜索引擎,Sci-hub是科研人员的秘宝,同时,却也是学术出版商眼中的大毒瘤。
现在,有人站出来,用统计数据为Sci-hub正名:
能通过Sci-hub下载的文章的被引次数,是Sci-hub上下不到的文章的1.72倍。
也就是说,Sci-hub的下载量,已经成为论文影响力的重要指标。
这个结果一公布,立刻引发了网友的共鸣:
我总要先能看文章,然后才能引用啊。
Sci-hub,让文章更具影响力
这项针对Sci-hub影响力的研究,被研究人员们公开放在了arXiv上。
研究人员认为,Sci-hub作为一个闻名全球的项目,对于学术体系中的所有人都影响深远。
因为它能绕过大多数学术出版商的付费墙,实际上增强了论文的潜在影响力。
他们希望通过数据证明,Sci-hub的下载量与论文未来的引用量是正相关的。
数据集
研究人员为此准备了两个数据集,其中包含Nature、Science在内的12种顶级期刊上发表的文章信息,横跨神经科学、经济学等多个领域。
第一个数据集包含2015年9月至2016年2月这段时间内,能从Sci-hub上下载到的所有文章。
第二个数据集则来自传统的Scopus数据库,包含同一时段内,在选定期刊上发表的所有文章。
并且,通过跟第一个数据集的对照,研究人员筛掉了其中能在Sci-hub上下载的文章,使其仅包括无法通过Sci-hub免费获取的论文。
对于每一篇论文,研究人员都统计了其中图表的数量。另外,还统计了每篇论文第一作者和通讯作者的H-index、每本期刊的影响因子,以及每个作者所属国家的研究资源等数据。
研究结果
根据引文统计分布,文章引用次数超过2000次的论文被视作离群值。
研究人员通过最小二乘法、离群值影响、带有工具变量的稳健回归、异方差校正等等一系列广义加成模型来评估关系的敏感性。
在控制了所有的偏差来源之后,结果显示,能从Sci-hub下载的论文的被引次数,是不能从Sci-hub下载的论文的1.72倍(p<0.001)。
并且,Sci-hub下载量越高,论文的被引次数也越高。
在所有选定的期刊和涉及的学科中,Sci-hub的影响都很明显。
另外,结果也表明,图表丰富的论文更容易被引用。
研究人员认为,这样的Sci-hub效应具有多重意义。
第一,除了作为一个面对全球开放存取的「线上图书馆」,Sci-hub的下载量也可以作为一个重要的参考数据,用以预测论文未来的引用量。
第二,Sci-hub效应的存在,表明论文的版权限制,很可能会阻碍科研人员的工作。
在过去的几十年里,不仅通过像Sci-hub这样的途径「盗版」的科学论文越来越多,arXiv这样的开放预印本论文平台也越来越受到科研人员的认可。
不过,矛盾的是,Sci-hub的存在也可能反过来维护了当前的出版系统——当人们有途径能获取免费论文时,对封闭出版系统带来的限制感知就没有那么强烈了。
影响全球学术界的Sci-hub
Sci-hub创建于2011年。创始人是一位来自哈萨克斯坦的研究生Alexandra Elbakyan。
△科研女神,在线挥手
她的初衷很简单——天下苦学术出版商久矣。
毕竟,学术出版商是这样定价的:
对于一家上市公司来说,赚取多少利润合适,答案是“看市场能承受多少”。
以Elsevier为例,其订阅费每年都在上涨,到了2018年,加州大学(UC)系统平均每年要向Elsevier支付约1100万美元(约合7377万元人民币)的订阅费用。这还没完,在协商签订新协议的时候,这家出版商还要求继续提价。
而早在2012年,Elsevier公布的利润率就已经超过了40%。赚钱能力甚至超过了苹果、微软等科技巨头。
这样的巨额收费,一直被认为是在阻碍科学开放、知识民主。
而Sci-Hub不仅包含Elsevier,还提供Springer、IEEE旗下期刊、ACS等出版商的文章,覆盖范围非常广。
所以,不仅是中国、印度这样的发展中国家给Sci-hub提供了大量下载量,Science网站2016年发布的一份报告显示,在2015年9月到2016年2月期间,美国本土就有115万次Sci-hub下载请求,仅次于俄罗斯位居第五。
这无疑动了学术出版商的蛋糕。单纯站在法律角度,也确属违法。
2015年11月,在Elsevier的控告下,Sci-hub域名遭到封锁。从此Sci-Hub开始了流浪之旅,迁移到美国无法管辖的地方,网址频频更换。
创始人Elbakyan也为了避免被引渡到美国,开始四处躲藏。Science网站评价她是“可敬的利他主义抑或大型犯罪者,而这取决于你的立场。”
但无论如何,学术出版商利用长久以来积累的名望,使科研人员们不得不为职业生涯考虑,接受其昂贵的订阅收费服务,甚至被限制在论文发表后公开免费放出论文,这样的现状,负面影响正在慢慢显现。
正如这项研究中谈到的,对论文的访问限制,可能会导致科学研究无法充分发挥其影响力。
你觉得呢?
传送门
论文地址:https://arxiv.org/abs/2006.14979
— 完 —
- 低成本机器人“皮肤”登上Nature子刊:实现三维力的自解耦,来自法国国家科学研究中心&香港大学2024-11-23
- OpenAI重夺竞技场第一,但这波靠的是4o2024-11-21
- Qwen2.5更新百万超长上下文,推理速度4.3倍加速,网友:RAG要过时了2024-11-19
- 0元起步打造你的AI搜索!实测秘塔知识库新功能,竟能指导我升职加薪了2024-11-11