人类基因组论文出错比例高得“离谱”

《中国科学报》 2021-08-10 16:45:06

近日,一项对近12000篇人类遗传学论文的计算机辅助分析发现,其中700多个研究包含的DNA或RNA序列存在错误。该研究负责人、澳大利亚悉尼大学癌症专家Jennifer Byrne认为,这一比例值得警醒,表明人类基因组研究中的一部分是不可靠的。

也许上述这些错误是偶然出现的,但研究人员怀疑,也有可能存在学术欺诈。

2015年以来,Byrne一直在寻找遗传学研究中的错误。此前,她在5篇涉及一项常见实验(使用一小段DNA使癌细胞中的基因失活)的论文中发现了问题——实验所用的核苷酸序列是错误的。此外,它们还使用了相似的语言表达和数据。Byrne怀疑它们出自一家“论文工厂”,即由第三方公司根据“订单”提供论文。

目前,这5篇论文中的4篇论文已经被撤回。随后,Byrne继续寻找存在类似问题的论文。

2017年,Byrne与法国格勒诺布尔大学计算机科学家Cyril Labb合作,创建了名为Seek &Blastn的软件,它能够识别出研究中潜在的错误。

例如,该软件可以从论文中提取短核苷酸序列,并将其与开放核苷酸数据库Blastn中的数据进行比较,以检查它们是否与研究预期的人类基因组相匹配。然后,研究人员会手动检查每个被标记出的不匹配的地方。

研究小组利用该软件对《基因》和《肿瘤学报告》(这两本期刊此前发表过有问题的论文)上的相关论文进行了筛选,包括2007年至2018年发表于《基因》的7400篇原始论文,以及2014年至2018年发表于《肿瘤学报告》的3800篇开放获取论文。

经过人工检查,研究人员发现《肿瘤学报告》论文中约有12%的核苷酸序列存在问题,《基因》论文中存在上述问题的只有2%。此外,Byrne带领研究小组还对此前出现过问题的癌症遗传学亚领域的研究论文进行了筛查,结果发现,在约600篇相关论文中,超过25%的论文核苷酸序列存在错误。

相关论文近日发布在预印本平台bioRxiv上。研究人员表示,他们发现的核苷酸序列存在错误的论文比例高得令人无法接受。他们已经给所有能够找到编辑联系方式的相关期刊或出版商发送了电子邮件,其中一些回复说将对这些存在问题的论文进行调查。(徐锐)

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

最新推荐