如何让一些虚假的论文通过一些手段,狠刷h指数,让作者误判文章的质量?最近,格勒诺布尔大学的CYRIL LABBE教授为了证明学术搜索引擎在收录广泛的优势下,却隐藏着巨大隐患,那就是被引数造假。
该教授利用MIT研究人员发明的SCIgen科技论文自动生成器,发表了102篇署名为“IKE ANTKARE”的学术论文,让IKE ANTKARE在谷歌学术中的h指数一下飙升到了94,成为计算机科学领域科学家H指数排名第6的学者。
作者可能除了对刷爆h指数这事表示关心外,也许还会问SCIgen是什么东东?在此小编简单介绍一下SCIgen:
SCIgen有多种叫法,如随机文本生成器、论文生成器等,总之就是一种会敲键盘就能分分钟搞定一篇科技论文的造假软件,它是由MIT学生于2005年开发的,初衷是为了证明用软件生成科学论文是轻而易举的事,他们把这个软件放到互联网上,提供免费下载。但是,潘多拉魔盒也就此打开,许多人用它伪造论文,仅5年间,被出版社查实的有超百篇论文系该软件生成。
那么CYRIL LABBE教授是如何刷谷歌学术中的 h 指数值?
首先,要让这些假论文被谷歌学术收录,事实上,学术搜索引擎和我们平常用的搜索引擎在算法上有非常大的不同,CYRIL LABBE教授为了让谷歌学术收录这些论文,他让每篇论文都对所有的100篇论文进行引用,然后生成该论文的html页面,html页面包含论文标题、摘要及PDF全文链接等信息。还在这100篇伪造论文的参考文献中加入了1篇真实的已被谷歌学术索引的论文,然后将这100篇论文上传到网上。不久,IKE ANTKARE的h指数就已经飙升到了94,甚至高于爱因斯坦的h指数84。
我们在此次实验性的造假事件中,至少可以看到,在收录范围广泛的学术搜索引擎所呈现出的高被引数很容易被人为造假,以这些学术搜索引擎的被引次数为依据,作为自己论文影响力的佐证是不靠谱的。