科研星球

700余篇文章被批遗传序列错误!大部分作者来自中国医院!

澳大利亚悉尼大学癌症研究员Jennifer Byrne领导的分析团队,通过对12,000篇人类遗传学论文进行计算机辅助分析,在700多项研究中发现其DNA或RNA序列中存在错误。


研究人员怀疑这其中可能存在欺诈行为,还会导致不可估量的严重后果,因为这表明人类基因研究中有部分是不可信的。


这些遗传序列错误是如何发现的?

自2015年以来,Byrne一直致力于发掘遗传学研究中的错误。当时有五篇文章(现有四篇文章已被撤回)均报道了一项常见实验:用一小段DNA以失活癌细胞中的基因。这些研究实验中报道了错误的核苷酸序列。


Byrne 继续寻找有类似错误的论文。2017年,她与法国格勒诺布尔-阿尔卑斯大学的计算机科学家Cyril Labbé 合作开发了名为 Seek & Blastn 的软件,该软件可以标记潜在错误。具体来说,该软件从论文中提取短核苷酸序列,并将其与公共核苷酸数据库Blastn比对,以检查是否与其靶基因相匹配,最后研究人员确认了一些基因标记与靶基因不匹配。


为了评估问题的严重程度,该团队特意筛选了两个期刊的论文,Gene(检查了2007-2018年发表的7,400 篇原始论文)和Oncology Reports(2014-2018年间发表的3,800 篇开放获取的论文)。此前,这两个期刊都发表过问题文章。经过人工检查,Oncology Reports论文中约12%存在核苷酸序列错误,Gene中为2%。

0 (1).png

Jennifer Byrne 

图片来源:Wolter Peeters/The Sydney Morning Herald


Byrne团队还挑选了癌症遗传学的三个子领域(以前也曾发现有问题):特定类型的microRNA对癌细胞的影响、癌细胞或癌症患者中使用药物顺铂或吉西他滨、消除17个基因其中之一的活性以确定其在癌细胞中的功能。在这些子领域,25%以上(大约600篇论文)论文中的核苷酸序列存在错误。


2021年7月31日,研究人员将发现发表在bioRxiv预印本上,结果表明总共有712篇论文,约占筛选总数的6%,其核苷酸序列存在错误。这些研究发表在78种期刊上,总引用次数超17,000次(其中29项研究发表在Springer Nature出版的期刊上,该期刊表示将调查相关论文)。此外,研究指出712 项研究中只有11项被撤回,3项表达了担忧。

0.png

图片来源:bioRxiv


Byrne 表示她的团队已经给所有相关期刊或出版商的编辑发了电子邮件,有些回复会进行调查。Oncology Reports的主编、病毒学家Demetrios表示还没有足够的时间来评估文章指出的所有数据。Gene的主编、分子生物学家Andre Van Wijnen目前也还没有任何回应。


为什么出错

研究人员指出在发现的人类基因功能论文中,含有错误核苷酸序列的比率高得惊人,此外,这些文章也使用了类似的语言和数字。这些问题论文作者大部分来自中国医院。对此,Byrne怀疑这些论文可能与“文章工厂”—第三方论文代写公司有关。



巴西里约热内卢联邦大学的研究员Olavo Amaral一直致力于可重复性和科学实践方面的研究,他表示由于Byrne团队挑选了特定的论文子集,因此尚不清楚这些发现是否代表了整个遗传学文献,但这警示我们需要重视并解决问题。Amaral说,“考虑到此类错误可以通过自动工具检测到,我认为这说明了定期同行评审非常糟糕,根本发现不了这些易于检测的错误,而这些错误可以通过更系统的质量控制形式进行处理”。


论文中遗传序列错误,对转化基因组学研究构成了重大挑战,不仅浪费了科学家研究时间,而且由于这些论文可能是伪造的,还使得其子领域可能根本就靠谱。为了确保高质量和可靠的基因功能研究迫切需要制定实践标准和指南。目前,一些期刊(包括 Gene)已经建议编辑使用Seek&Blastn检查提交稿件中核苷酸序列的错误。



没有账号?