一
Jennifer Byrne从未想过自己人生的高光时刻是被选入Nature(《自然》)杂志“2017年度十大人物”[1],而上榜的原因竟是“论文打假”:她的战绩是让Nature撤回了5篇含有基因序列错误的文章。在杂志刊登的照片上,你能从她的脸上看出一种执着的态度:“零容忍”。
在成为“职业打假斗士”之前,Jennifer Byrne是澳大利亚Westmead儿童医院的一名科研人员,从事癌症基因组学研究。与大多数同事一样,她白天搞科研,晚上陪家人,顺便找找基因组学论文中存在的错误。
有“重大发现”的那天晚上,和以往并无任何不同:那是2015年一个普通的星期六(16.180, 0.57, 3.65%),她照例把孩子安顿在客厅里,家人们在看电视,她则坐在房间角落里的电脑前。她灵机一动,想看看自己之前的研究领域现在发展得怎么样,顺手输入了几个领域内的关键词。
很多科研工作者都会这么干,但Byrne的领域相对冷门,学术成果也相对少得多。很快,屏幕里跳出来搜索结果,有5篇论文与她之前工作的相似度极高。
想象一下Byrne此刻的心情,惊喜?错愕?疑惑?她认真查看了这几篇论文,它们声称观察到癌细胞中某个基因失活的效应,但她却看到实验中使用的DNA序列甚至是错的。虽说论文也有可能出错,但凭借一名科研人员的直觉,她还是嗅到了不一样的味道——这些文章可能是抄袭。
Byrne呆坐在那里。震惊之余,她心里满满的想不通。大量低劣的图表、拼凑的数据,大段的重复性文字拼凑起来的文章,简直就是“无中生有”,怎么可能就正式发表了?同行评议呢?专家们都干了些什么?一时间,她无法抑制地哭了起来。
后来,她看到Science(《科学》)杂志2013年就已有一篇揭露“论文工厂”的文章[2],说某些论文其实是交易的商品,一时间五雷轰顶,仿佛所有信念瞬间崩塌。
没过多久,Byrne正式进入科学论文调查领域。
她首先选定了一位合作伙伴Cyril Labbé,是法国格勒诺布尔-阿尔卑斯大学( University Grenoble Alpes in France)的语言学家。他们开发了一个论文查重程序Seek & Blastn,可以提取论文中提到的核苷酸序列,然后与核苷酸公共数据库进行交叉核对,检查它们是否和文中要标靶的人类基因相匹配,也就是检查作者使用的基因序列是否正确;对于每一个不匹配项再进行人工复核。
他们评估了Gene(《基因》)杂志在2007~2018年间发表的7400篇原创论文,以及Oncology Reports(《肿瘤学报告》)在2014~2018年间发表的3800篇开放获取论文,发现存在核苷酸序列错误的文章分别占2%和12%。随后,他们又对癌症遗传学三个不同领域的600余篇论文开展了分析,发现有25%的论文都存在核苷酸序列错误的问题[3] 。
在Byrne心中,这些越来越多的问题不断唤起那个周六晚的感受,最终让她下定决心举报这些情况。
她首先向杂志社举报,希望能够开展调查。
与此同时,Byrne和Labbé一起继续分析了大量的可疑论文,并以共同通讯作者身份于2016年底在Information Systems Frontiers(《信息系统前沿》)发表了论文 “Striking similarities between publications from China describing single gene knockdown experiments in human cancer cell lines”,不仅细致比较了此前她发现的5篇问题论文中存在的错误及处理结果,还同时曝光了另外48篇高度相似的论文[4]。
这无疑是给学术界扔了一颗雷。
再后来,Byrne从美国研究诚信办公室(US Office of Research Integrity)获得经费,专门聘请了一名全职人员追踪可疑论文。澳大利亚政府也曾经给予她资助。
如今,Byrne已经不再从事实验室研究工作,在她心中里,“打假”的重要性远远大于具体的科研项目,前者可能对科学事业的贡献更大。相对于实验人员几年工作完成一篇论文,“论文作坊”的发表周期是几周,甚至可能是几天。这简直太不可思议,让人没法接受。必须有人站出来维护这个秩序。尽管打击“论文作坊”还需要证据,但有一件事情是明确的:科学离不开信任。
二
Leon Reteig万万没有想到,自己需要在博士期间更改研究方向,竟然是因为一篇错误的论文。当然,受影响的不仅仅是毕业时间,还有很多难以言尽的、甚至是未可知的方面。
2018年,Leon Reteig正在荷兰阿姆斯特丹大学(University of Amsterdam)攻读博士学位,研究不同刺激对大脑的作用。可是在一次重复同门师兄Heleen Slagter的实验时,始终得不到一致的结果。经过仔细分析,Reteig发现师兄的论文有错,错误很可能来源于数据后期处理:Excel软件在处理数据时,表格中夹带的一个错误代码对原始数据进行了统计学意义上的校正。
这个错误虽然很小,但足以令实验结论谬以千里。师兄的实验结果已经在2015年正式发表,现在能做的大概只有联系杂志社撤稿,毕竟否定已有的结论不太好看。为了毕业,Reteig被迫更改了博士论文的研究课题。显然这是一个明智的选择,因为师兄的论文在2021年才完成撤稿,这时,Reteig已经是另外一所大学的博士后了。
如何处理问题稿件,大概也是杂志社或者出版商最头疼的问题。尽管国际出版伦理委员会(Committee on Publication Ethics,简称COPE)建议期刊要对举报人给予回应,但真的落实到具体行为,不同期刊的反应却不尽相同。
在The Scientist杂志发起的一项调查中,Springer Nature, AAAS, PNAS, PLOS, Cell Press,以及eLife等期刊均表示将严格执行国际出版伦理委员会的要求,愿意接受举报并积极开展调查。的确,像Cell、PNAS和Nature这样的期刊是有专门的工作人员处理举报问题,但在海量的期刊群体面前,这么几本期刊就显得微不足道了。
Reaction Watch(撤稿观察网www.retractiondatabase.org)的网站创始人Ivan Oransky总结说,找一些无关痛痒的借口搪塞一下,大概已经算是有回应了,还有更多不讲诚信的杂志社,编辑们往往不作回应,也可能以后会做点什么,但“以后”会很遥远,远到不用指望。惟有Reaction Watch将这些故事都记录在案。
没有一个举报者不看重举报结果。Byrne的团队不断和期刊编辑联系,但结果却并不理想。她们一共举报了300余篇论文,涉及International Journal of Clinical and Experimental Medicine(《国际临床与实验医学杂志》),BioMed Research International (《国际生物医学研究》),Biotechnology and Applied Biochemistry(《生物技术与应用生物化学》)等多家期刊,可最终得到的反馈却并不多,不免让人感觉这简直是在浪费政府资源。于是Byrne团队绕过杂志社,直接找到出版商。
英国牛津大学的Hampton Gaddy也采取了类似的做法。
Gaddy注意到Victor Grech这个名字是因为一篇关于1918大流感的文章,他怀疑这篇文章涉嫌抄袭。经过搜索,他发现Grech不仅论文众多而且涉及题材广泛,仅仅是取材于电视节目Star Trek(《星际迷航》)的相关论文就多达30~40篇,甚至还有一篇预测全球将有5亿人死于COVID-19的文章。更令人难以置信的是,所有文章均发表在Early Human Development(《早期人类发展》)上,要知道,这可是一本儿童健康方面的杂志。
Gaddy先是写信给期刊,同时按照网友建议联系了出版商。两天后,他收到了一份来自出版商的回复,感谢他的举报。
根据Retraction Watch的记录,Grech名下的93篇论文,要么被撤回,要么被标注为问题论文。但是,期刊编辑始终没有回应。
三
如果举报情况属实,对有问题的论文进行处理即可;倘若被举报人不承认造假,事情往往会变得十分棘手。曾有这样一场耗时数年的学术纠纷,堪称经典:
故事的主角是两位心理学领域的研究者,一位是来自哈佛大学的Elizabeth Phelps ,一位是来自比利时鲁汶大学(KU Leuven)的Tom Beckers。
2010年,Phelps在Nature(《自然》)杂志发文,提出一种复杂行为干预法,用以消除一个人对恐惧的记忆。
2015年,Beckers打算重复Phelps的实验。但是,工作刚刚开始就发现了问题:如果按照论文所述的方法筛选样本,可能几轮筛选过后就无样本可取了。那实验结论的可信度在哪里?
顺理成章的,Becker找到Phelps提出问题,Phelps爽快地提供了详细的实验记录,甚至包括原始数据。几轮沟通下来,Phelps也发现了问题出在哪里:样本数没有问题,只是论文中的筛选方法写错了,应该是任意排除法,而非论文中提到的确定排除法。
为了说明这个问题,Phelps和他的合作者于2018年在Nature发表了一篇补充文章,对2010年论文中的实验情况进行了补充说明。
按理说,故事发展到这里应该结束了,但,并不。
Beckers转身给Cortex(《皮质》)杂志投递了一篇文章,标题即说明此文是针对Phelps 2010论文的一份“核实报告”(a verification report)。
这篇“核实报告”不仅指出样本筛选方法的错误,还给出了重复试验的结果。巧的是,这篇论文在同行专家评审中递到了Phelps手中,同时附送的还有编辑的一篇评述性文章,将Phelps事件上升到科学诚信的高度,称大名鼎鼎的Nature发表这样一篇论文简直荒诞,然后附上若干佐证材料。
Phelps自然十分恼火。在经历了一番复杂的交涉之后,Phelps承认“这不是一篇完美的论文,存在瑕疵”。但是,在写给 The Scientist 杂志的邮件中,他一直申辩说论文中的问题并不算是什么大问题(“there were no more issues with the 2 experiments reported in this paper than other studies.”)[4]。
2020年8月,Beckers的“核实报告”正式发表,掀起新一轮关注。两个月后,Phelps再次发表文章称,经过对2010年实验原始数据的重新分析,他们认为结论有效,算是对Beckers批评的回应。
Beckers团队当然不甘示弱,于2021年7月再度发表文章,提出反驳意见,坚持认为Phelps等人(2010)的实验结果存在严重缺陷。
四
Beckers和Phelps的缠斗不论多么激烈,双方还是能秉持学术文明,把斗争控制在学术领域内的。但也有些争斗走向了法庭,双方对簿公堂。
Paul Brookes是美国罗切斯特大学(University of Rochester)的一名研究员,长期从事线粒体研究工作,私下里他运营了一个博客名为science-fraud.org,从名字就可以大致看出博客的主题。他匿名在博客上曝光一些数据造假的论文,仅仅6个月就曝光了275篇明显存在问题的论文。
2013年1月2日,一封匿名邮件出现在一些科学家和大学管理人员的邮箱里,罗切斯特大学校长也收到了这封邮件。邮件中披露Brookes是science-fraud.org博客的主人,并称将对他的曝光行为提起法律诉讼。
迫于压力,Brookes最终删除了文章。现在他偶尔会在自己实验室主页上曝光一些问题论文。事实上,Brookes共收到了6次法律诉讼威胁,不过都没有发生过实际的诉讼。
诉讼不仅针对个人,同样也可以针对媒体,PubPeer网站也曾经当过被告。
PubPeer.com是一个可以进行“发表后同行评审”(post-publication peer review)的科学论坛,科研人员注册后可以对已出版的论文发表匿名评论。因此,PubPeer往往会扮演“举报平台”的角色。
2016年,来自美国韦恩州立大学 ( Wayne State University )的病理学研究员Fazlul Sarkar起诉PubPeer网站,因为论坛上有人匿名指控他学术不端,Sarkar想要获取这些匿名者的实名信息,但他败诉了。
2021年,PubPeer网站披露了法国艾克斯-马赛大学(Aix-Marseille Université)微生物学家Didier Raoult的60多项研究可能存在问题,举报人是著名的职业学术打假人、微生物学家Elisabeth Bik。为此,Bik以及一名共同经营PubPeer网站的神经学科学家被告上法庭,罪名是“勒索”和“骚扰”。
相对来说,举报人被告上法庭的案例数量并不多,但寒蝉效应是巨大的。
五
当一个科研人员经历过重复实验失败,当他/她发现面对的只是一堆文字、图表堆砌起来的不知道是什么东西的“玩意”,可能会选择举报。但举报大概只是一个热烈的开始,因为学术举报牵涉到研究人员、杂志社、出版商等众多方面,大家的态度随着事件的发展是在不断变化的。
Byrne和她的伙伴是举报人里最勤奋,也是最高产的,他们的记录是标记了712项错误使用的DNA序列。此刻,她的感觉是疲惫。
Reteig的举报虽然很快得到了回应,但他不仅没有放下心来,反而越来越担忧论文错误问题,毕竟还有更多论文都隐藏着类似拼写错误、Excel自动更正基因名称而带来的错误……他希望研究人员在公布研究结果的同时,也能公布原始数据和使用的分析软件等信息。
Gaddy目前正在攻读人口学硕士学位。作为Reaction Watch的忠实读者,发现有论文造假的那一刻他显然不能接受。但经历过这一轮举报后,他感到最令人难受的还是那些论文竟然能发表,尤其是新冠疫情期间关于COVID19的假论文让人不能忍。另一方面,他又意识到,论文里的东西太多了,其中大多数内容可能都无关紧要,也产生不了很大的影响。
作为Biomarker Insights(《生物标志物洞察》)杂志的编辑,Byrne着眼于出版业。她认为出版业需要做出一些流程上的调整,譬如说对于已经发表的论文给予更长久的跟踪。
对于众多打算举报的人来说,可能还是Oransky的建议看起来更中肯:举报前请做好受冷落的准备,不要对杂志社报有太多的期待。
似乎是繁华过后的寂寥,又像是狂欢过后的冷静,但这都是经历过之后才有的真实反应。
|