医学与社会
2021年05月号

论文造假, 引发国际期刊与论文工厂的斗争

作者:生命新知

一些期刊承认存在研究论文造假的问题。现在编辑们正试图与之抗衡。

当Laura Fisher注意到提交给《RSC Advances》的研究论文之间惊人的相似之处时,她开始怀疑。《华尔街日报》执行主编Fisher说,这些论文都没有共同的作者或机构,但它们的图表和标题却惊人地相似。“我下定决心要弄清事情的真相。”

一年后,也就是2021年1月,Fisher撤回了该杂志的68篇论文,英国皇家化学学会(Royal Society of Chemistry, RSC)的两名编辑也因为类似的怀疑各撤回了一篇;15篇仍在被调查中。Fisher发现了一些似乎是论文工厂的产品:一些公司大量生产伪造科学稿件。所有的论文都来自中国医院的作者。

《自然》杂志的一项分析发现,自2020年1月以来,期刊至少撤回了370篇公开与论文工厂有关的论文,预计还会有更多的论文被撤回。

这种论文清理之所以出现,是因为2020年,有人公开标记了一些他们认为来自论文工厂的可疑稿件。分析显示,这些被标记的论文涉及超过1000项研究。编辑们非常关注这个问题,2020年9月,伦敦出版商咨询机构出版伦理委员会(Committee on Publication Ethics, COPE)举办了一个论坛,专门讨论“通过论文工厂系统地操纵出版过程”。他们的演讲嘉宾是Elisabeth Bik,她是加利福尼亚州的一位研究诚信分析师,以在论文中发现重复图像的技能而闻名,同时也在网上发布了对论文工厂的担忧。

Bik认为还有数千篇这样的论文。她说,RSC的公告对其开放性意义重大。“这么多论文都是假的,真让人尴尬。承认自己被愚弄是好的。”在一些出现了大量明显的论文工厂投稿的期刊上,编辑们现在已经调整了他们的审稿流程,旨在不再被愚弄。打击行业欺诈需要更严格的审查:例如,编辑要求作者提供原始数据,并聘请专门人员检查图像。科学出版需要 “协调一致的努力来消除伪造的研究”,皇家科学委员会表示。

论文工厂侦探

2020年1月,Bik和其他化名为Smut Clyde、Morty和Tiger BB8的图像侦探在科学记者Leonid Schneider的博客上发布了一份400多篇已发表论文的名单,他们说这些论文可能来自同一家论文工厂。Bik将其命名为“蝌蚪”论文工厂,因为这些论文的蛋白质印迹分析(用于检测生物样本中蛋白质)中出现了这种形状。接踵而至的是大量的媒体头条。在这一年里,侦探们还发布了其他可疑论文的列表——他们在多项研究中均发现了类似的特征。到2021年3月,根据《自然》杂志的统计,他们总共列出了1 300多篇文章,可能来自论文工厂。

根据《自然》杂志的分析,到目前为止,调查人员声称的来自论文工厂的文章中,约有26%被撤回或贴上了密切关注的标签。还有很多仍在被调查中。例如,《细胞生物化学杂志》(Journal of Cellular Biochemistry, JCB)在2月1日宣布,2020年编辑们调查了137篇涉嫌篡改图像的论文,并撤回了其中的23篇。

并不是所有被标记的论文都有问题。JCB出版商Wiley(全球历史最悠久﹑最知名的学术出版商之一)的研究诚信负责人ChrisGraf 2021年1月表示,该出版商已经完成了对Bik等发现的73篇论文的调查,其中11篇论文没有发现对其采取行动的理由,另有7篇需要更正,55篇已经撤回或即将撤回。

出版商几乎从未在撤销通知上明确声明某项研究是欺诈性的,因为很难证明。例如,RSC的撤回通知中没有提到哪一家论文工厂,尽管他们认为这些文章确实来自同一家论文工厂。但《自然》杂志统计了自2020年1月以来撤回的370篇文章,全部来自中国医院的作者,大多数是在过去三年发表的。

《自然》杂志发现,自2020年年初以来,中国医院又有197篇论文被撤回。尽管有些被标记为图像问题,但这些论文并没有被列入潜在出版名单,通常是出现在出版后同行评议网站PubPeer上。

工业化作弊

全球最大的科学出版商爱思唯尔(Elsevier)出版服务部门负责人Catriona Fennell指出,出版业有组织的欺诈问题并不鲜见,而且不仅限于中国。她去年对《自然》杂志说:“我们已经看到了来自其他几个国家的工业化作弊证据,包括伊朗和俄罗斯。”其他人也曾报道过伊朗和俄罗斯论文工厂的活动。

爱思唯尔在今年向《自然》杂志发表的一份声明中说,它的期刊编辑每年都会发现并阻止上千份论文工厂提交的论文发表。

伊利诺伊州布拉德利大学图书管理员陈晓天(音译)说,长期以来,中国一直存在向研究人员出售论文的问题。早在2010年,时任中国武汉大学管理学研究员沈洋(音)领导的一个团队就警告说,有些网站会提供代写虚构研究论文的服务,或者绕过同行评议系统获取报酬。2017年,中国科技部表示将打击不当行为,此前有107篇论文在《肿瘤生物学》(Tumor Biology)杂志上被撤回;这些论文的同行评议是捏造的,其中一些论文来自第三方公司。

陈晓天说,中国医生是一个特殊的目标市场,因为他们往往需要发表研究文章来获得晋升,但医院太忙了,他们可能没有时间做科学研究。2020年8月,北京市卫生局公布了一项政策,规定主治医师要晋升为副主任医师,必须在专业期刊上以第一作者身份发表至少两篇论文,晋升主任医师则需要3篇。曾是中国某医院的高级内科医生和胃肠病学研究员的李长青(音译)说,这些头衔影响着医生的薪水和权威,以及他们的手术权限。

“这种影响是毁灭性的。”李长青说,“中文出版的环境已经被破坏了,因为几乎没有人相信他们或引用他们的研究。”“现在这场瘟疫已经侵蚀到国际医学期刊。”他补充说。在日本广岛大学工作的中国研究员黄福涛(音译)说,人们利用论文工厂的事实也影响到中国在全球的声誉。

问题论文的普遍存在导致一些国际期刊的编辑对中国医院研究人员提交的论文普遍产生了怀疑。2021年2月《分子治疗》(Molecular Therapy)杂志的一篇社论说,“这种‘垃圾科学’的数量不断增加,正在严重破坏中国研究的可信度,所带来的对其真实性及科学性的怀疑也与日俱增。”

其他几位编辑也表达了对论文工厂影响的担忧。爱思唯尔出版的《欧洲药理学杂志》(European Journal of Pharmacology)主编Frank Redegeld说:“它们正在削弱我们对从中国团体收到的其他稿件的信心。”

中国科学和教育部已经采取措施来遏制对发表论文的奖励。2020年2月发布的一份通知,告诉研究机构——包括医院——不要仅仅根据发表论文的数量来提拔或招聘研究人员,还要停止为论文支付现金奖励。2020年8月,中国宣布采取措施打击科研不端行为,包括试图遏制为他人捏造数据的独立承包商。

问题征兆

图像审查人员和期刊编辑已经在稿件中发现了一系列可能是论文工厂的特征。德国海德堡FEBS出版社的图像完整性分析师Jana Christopher说:“我们想知道如何保护自己,不发表这些东西。”她为一些期刊筛选来稿,并帮助RSC进行调查。

潜在的问题迹象包括来自不同研究机构的不同作者的论文有着相似的特征:具有相同背景和可疑平滑轮廓的蛋白质印迹、同一主题的不同标题、不同实验但布局相同的条形图、流式细胞仪分析的相同图。似乎这些稿件都是用模板制作的,文字和图片稍微调整一下,让论文看起来有些不同。

一个重灾区是研究与癌症有关基因区域的生物医学文章。澳大利亚悉尼大学的分子肿瘤学研究员Jennifer Byrne专门揭露这类有缺陷的论文,发现他们的实验细节有时列出不正确的核苷酸序列或试剂,因此所描述的实验根本无法进行。

Byrne说,许多这类论文尽管很难证明它们来自论文工厂,但它们可能只是改变了癌症类型或修改了基因。她说:“论文中核苷酸序列错误的问题非常严重。Bik还发出了其他需要编辑注意的危险信号,包括来自中国医院的那些电子邮件地址与任何作者姓名都没有联系的稿件。”她说,“单独来看,这些因素可能没有问题,但综合起来它们就有问题了。”编辑们还注意到,一个叫做ScholarOne的稿件处理系统,当它从同一个IP地址上接收到提交的文件时,可以标记出这种不寻常的活动。ScholarOne警告也有助于RSC的调查。

今年2月,Naunyn-Schmiedeberg’s Archives of Pharmacology杂志说它受到了论文工厂的影响。该杂志发表了一篇社论,列举了论文工厂文章的重要特点。这些问题包括非学术性的电子邮件地址、作者无法提供原始数据以及糟糕的英语表达。该杂志正在撤回10项研究,并报告说大约5%的稿件来自论文工厂。

出版商和其他与论文工厂斗争的人怀疑,他们只看到了已出版论文的冰山一角。Bik、Byrne等认为,论文工厂问题论文的总数可能达到数千甚至上万篇。

Christopher说:“这对整个科学是有害的,因为它使科学和科学家看起来不可靠。”Byrne还担心,仅仅通过在期刊上发表文章,将基因与特定癌症联系起来的虚假研究可能会产生误导,并可能被纳入荟萃分析。

僵尸文件

期刊编辑知道,即便他们拒绝了疑似是伪造的稿件,也不可能永远扼杀这篇论文。欺诈性的稿件可以同时提交给多家期刊:因此,即使编辑在同行评议中拒绝了它,他们也可能看到它在别处发表。

这种情况就发生在Christopher身上。三年前,她在一组FEBS出版社出版的两种期刊的13份研究稿件中发现了惊人的相似之处。他们的蛋白质印迹似乎不仅是捏造的,而且是相似的,似乎是通过调整模板创建的。期刊根据她的建议拒绝了这些稿件。Christopher在2018年发表了一篇文章,警告“系统地捏造科学图像”,并敦促期刊进行出版前的图像筛选。

今年,Christopher再次查了查那13篇稿件,发现它们都已经发表在了其他期刊上。

许多期刊已经改变了编辑评审流程,试图打击有组织的欺诈行为。例如,一些爱思唯尔杂志已经改变了他们的审稿范围,以避开论文工厂特别集中的主题领域。一些出版商表示,他们的许多期刊已经更新了政策,要求作者在提交文章的同时,提供蛋白质印迹背后的原始数据。但编辑们意识到,即使是原始数据也可能是伪造的,尤其是如果论文工厂发现有人提出这样的要求。

泰勒·弗朗西斯出版社出版诚信与道德负责人Alam说,一旦开始调查,一些作者就会很快要求撤回他们的论文。一些期刊已经允许作者撤回论文,而不用说明撤回理由。

COPE表示,它将更新现有的指南,说明期刊应如何应对出版过程中被论文工厂操纵的论文,还将成立一个由其成员组成的编辑工作组,以确定该组织如何在这一问题上提供更好的支持。

前进的道路

出版商表示,期刊之间共享信息的能力有限,因为即使是同一个期刊的标题在编辑上也是相互独立的。他们对在出版商之间共享可能是诽谤作者的信息持谨慎态度,而且数据保护规则阻碍了作者个人数据的分享。

《欧洲医学和药理学评论》杂志自2020年1月以来已经撤回了186篇文章。“我们对这些调查结果感到震惊。”其中一位主编Antonio Gasbarrini说。

许多期刊开始聘请分析师,试图及时发现稿件中的问题。例如,去年Wiley雇佣并培训了11人,试图在24种期刊上发现被操纵的图像,重点放在最可能发表的论文上。

出版商希望自动化筛选过程。已经有公司开发了一种软件,可以检测已发表论文中的重复图像。

爱思唯尔的研究诚信负责人IJsbrand Jan Aalbersberg说,软件正在改进,但还不能大规模浏览许多论文。要做到这一点,还需要一个庞大的图像共享数据库,出版商可以筛查论文之间的重复。

斯普林格自然出版社的研究诚信负责人Suzanne Farley说,她认为论文工厂提交稿件的比例将会下降。“论文工厂意识到出版商越来越善于检测他们的投稿,潜在的论文工厂客户也意识到现在使用这些服务会带来更严重的后果。” 她说。

但Christopher担心,如果欺诈者能够更好地规避明显的错误,将引发一场行业竞争。例如,去年发布在bioRxiv上的一份预印本研究表明,人工智能技术可以产生假的蛋白质印迹,而这些印迹与真实的印迹无法区分。这真的很令人担心伪造技术的复杂程度会随之提高,正如中国一句俗语所说的那样“道高一尺魔高一丈”。

参考文献:Holly Else, Richard Van Noorden. The Battle Aganist Paper Mills[J]. Nature,2021,591:516-519.

Copyright 1994-2015 Cinkate.com.cn All Rights Reserved 沪ICP备10014127号-5