科研星球

这几个期刊将对“图片误用”动刀了

一项研究出现在美国癌症研究协会 (AACR) 出版的十种期刊中的任何一种之前,它都要经过一次不寻常的额外检查。自20211月起,AACR一直在同行评审后的所有稿件上使用人工智能(AI)软件,目的是自动提醒编辑人员注意重复的图像,包括那些部分已被旋转、过滤、翻转或拉伸的图像[1]

0.png

图源:AACR

为了避免发表带有被篡改图像的论文,无论是因为欺诈还是不恰当的美化,许多期刊聘请了编辑手动扫描提交的稿件是否存在问题,通常使用软件来帮助检查其发现内容。在过去的一年里,至少有四家出版商开始自动化检测流程,依靠人工智能软件在稿件发表之前发现重复和部分重复问题。


宾夕法尼亚州费城协会期刊运营主管Daniel Evanko表示,AACR尝试了多种软件产品,然后才最终选择了以色列Rehovot公司 Proofig 的服务。我们对此非常满意,他希望这项筛查能够帮助研究人员并减少发表后的问题。


当软件标记图像时,仍然需要专业的编辑来决定要做什么。例如,如果数据集被故意显示两次,且有解释说明,那么重复的图像可能是合适的。一些重复可能是稿件组装过程中的简单复制和粘贴错误,而不是欺诈。所有这些只能通过编辑与作者进行讨论来解决。然而,现在AI已经非常有效且成本低廉。专家表示,一波自动图像检查助手可能会在未来几年席卷科学出版行业,就像在十年内使用软件检查抄袭成为常规一样。出版业团体还表示,他们正在探索比较不同期刊稿件中图像的方法。


其他图像完整性专家对这一趋势表示欢迎,但警告称尚未对各种软件产品进行公开比较,并且自动检查可能会产生过多误报,或遗漏某些类型的操作。从长远来看,对软件筛选的依赖也可能会促使欺诈者使用人工智能来欺骗软件,就像一些人通过调整文本来逃避抄袭筛选一样。德国海德堡EMBO Reports 的主编 Bernd Pulverer说:我担心我们正在与人工智能技术进行军备竞赛,这可能导致一些深度伪造无法被发现


与手动检查器相比,AI软件可以更快、更大规模地发现研究论文中的重复图像工作——但仍需要编辑监督。

0 (3).png

图片来源:Laurence Dutton/Getty


软件时代?

由于担心错误或欺诈,研究人员多年来一直在开发图像检测AI——这可能使有问题文献比目前有限的撤回和更正数量多很多。2016年,由微生物学家 Elisabeth Bik领导的约20,000篇生物医学论文的手动分析[2],加利福尼亚的顾问图像分析师表明,多达 4% 的论文可能包含有问题的图像重复。(每年通常只有大约 1% 的论文得到更正,被撤回的更少。)


“我知道大约有20人在开发图像检查软件,加利福尼亚州旧金山经营咨询公司Image Data Integrity Mike Rossner表示,他于二十年前在Journal of Cell Biology杂志上第一次介绍了手动筛选稿件。去年,出版商联合成立了一个工作组,为筛选图像问题的论文制定软件标准。该小组今年发布了关于编辑应该如何处理篡改图像的指南,但尚未制定软件指南。


一些学术团体和公司表示,期刊和政府机构正在试用他们的软件,但Proofig 是第一个公开命名客户的公司。执行主编Sarah Jackson说,“除了 AACR,美国临床调查学会于月份开始使用Proofig的软件来处理Journal of Clinical Investigation JCI Insight 杂志的稿件。伦敦 SAGE 转型负责人Helen King表示,SAGE Publishing 10月在其五份生命科学期刊中采用了该软件。

图源:Proofig

Proofig 的软件从论文中提取图像,并将它们成对地进行比较,以找到共同特征,包括部分重复。在一两分钟内可以检查一篇典型的论文。该公司的创始人 Dror Kolodkin-Gal说,“该软件还可以纠正棘手的问题,例如将高分辨率原始数据压缩成较小文件时可能出现的压缩伪影。计算机比人类视觉更有优势,计算机不仅不会感到疲倦,运行速度也会更快,而且它也不会受到大小、位置、方向、重叠、部分复制和这些因素组合的影响


图像检查的成本远高于抄袭检查的成本,Kolodkin-Gal虽然拒绝详细讨论定价,但表示与出版商签订的合同往往根据论文中的图像数量收费,但也取决于稿件的数量。他说,“这相当于每张纸的收费接近几十美元而不是几百美元”。


Jackson 说,“在 JCI上,该软件发现的问题比以前工作人员手动审查的问题要多。但是工作人员对于检查 Proofig的输出仍然必不可少,重要的是该期刊已经拥有处理各种图像问题的程序系统。严谨的数据是我们期刊的绝对标志,这值得花费时间和金钱”。


与此同时,位于瑞士洛桑的出版商 Frontiers 开发了自己的图像检查软件——AIRA,作为自动检查系统的一部分。一位发言人说,“自 2020 8月以来,一个内部研究诚信团队一直在使用AIRA对所有提交的稿件进行图像检查。它标记的大多数论文实际上没有问题:只有大约10%需要完整性团队的跟进”。


包括 BikRossner在内的图像完整性专家表示,他们还没有尝试过AIRA Proofig,并且很难评估尚未使用标准化检测进行公开比较的软件产品。 Rossner 补充说,“除了重复之外,检测图像处理也很重要,例如删除或裁剪图像,以及图像盗用。该软件可能是视觉筛选的有用补充,但它可能无法替代当前形式”。Bik 补充道,“我相信这最终将成为稿件筛选的标准”。


此图来自图像检查软件公司Proofig,展示了其程序如何比较图像的各个部分(红色矩形,左侧)并标记相同的部分,在拉伸或旋转的图片中均是如此。蓝线表示AI检测到了数百个相同的特征。

0 (4).png

图片来源:改编自CDC/Proof


行业谨慎

尚未采用AI图像筛选的出版商提到了成本和可靠性问题——尽管有些出版商正在开发自己的AI。出版商PLOS的一位发言人表示,“正在密切监控工具的进展,这些工具能可靠地识别常见的图像完整性问题,并且可以大规模应用”。Elsevier表示,“仍在测试软件,我们的一些期刊会在发表前,联合使用软件工具和手动分析,筛选所有已接受的论文”。


一位发言人表示,2020 4月,Wiley为临时接受的稿件推出了图像筛选服务,目前有120多家期刊使用,但是由软件辅助的手动筛选。出版Springer Nature表示,正在评估一些外部工具,同时整理数据以训练自己的软件,该软件将结合互补的AI和人工元素来识别有问题的图像。

0.jpg

Pulverer 说,“EMBO Press 仍然主要使用手动筛选,我毫不怀疑很快就会拥有高级工具Pulverer担心欺诈者可能会了解该软件的工作原理,并使用 AI 制作人们和软件都无法检测到的虚假图像。尽管还没有人表明此类图像出现在研究论文中,但去年在bioRxiv上发布的一份预印本表明[3],有可能制作与真实数据无法区分的生物图像的伪造版本,例如蛋白质印迹。但是研究人员正在解决这个问题。印第安纳州西拉斐特普渡大学的计算机科学家Edward Delp负责美国国防高级研究计划局资助的一个项目,该团队正在发现AI伪造的生物图像,例如显微镜图像和X射线。目前,有关其系统的论文正在审查中。


跨期刊图像检查

目前,AI 图像检查通常在稿件中完成,而不是在许多论文中完成,这将使其计算量越来越大。但商业和学术软件开发商表示,这在技术上是可行的。纽约雪城大学的计算机科学家Daniel Acuña去年在数千份COVID-19预印本上运行了他的软件以查找重复项。


Crossref 是一家由15,000多个组织组成的美国非营利性合作组织,该组织负责组织跨论文的抄袭检查等,目前正在开展一项调查。其产品总监Bryan Vickery 说,“可以共享图像的跨出版商服务是可行且有用的”。

0 (2).png


STM Solutions 是英国牛津学术出版商行业组织 STM 的子公司,12月宣布正在开发一个基于云的环境,以帮助出版商检查提交的文章是否存在研究诚信问题,同时保持隐私和保密。STM 发言人Matt McKay 表示,“在我们的计划中,检测跨期刊的图像篡改、重复和抄袭占据重要位置”。


参考文献

[1] doi: https://doi.org/10.1038/d41586-021-03807-6

[2] Bik, E. M., Casadevall, A. & Fang, F. C. mBio 7, e00809-16 (2016).­­

[3] Qi, C., Zhang, J. & Luo, P. Preprint at bioRxiv https://doi.org/10.1101/2020.11.24.395319


没有账号?