这几个期刊将对“图片误用”动刀了_行业新闻_最新资讯

一项研究出现在美国癌症研究协会 (AACR) 出版的十种期刊中的任何一种之前，它都要经过一次不寻常的额外检查。自2021年1月起，AACR一直在同行评审后的所有稿件上使用人工智能(AI)软件，目的是自动提醒编辑人员注意重复的图像，包括那些部分已被旋转、过滤、翻转或拉伸的图像[1]。

图源：AACR

为了避免发表带有被篡改图像的论文，无论是因为欺诈还是不恰当的美化，许多期刊聘请了编辑手动扫描提交的稿件是否存在问题，通常使用软件来帮助检查其发现内容。在过去的一年里，至少有四家出版商开始自动化检测流程，依靠人工智能软件在稿件发表之前发现重复和部分重复问题。

宾夕法尼亚州费城协会期刊运营主管Daniel Evanko表示，AACR尝试了多种软件产品，然后才最终选择了以色列Rehovot公司 Proofig 的服务。“我们对此非常满意”，他希望这项筛查能够帮助研究人员并减少发表后的问题。

当软件标记图像时，仍然需要专业的编辑来决定要做什么。例如，如果数据集被故意显示两次，且有解释说明，那么重复的图像可能是合适的。一些重复可能是稿件组装过程中的简单复制和粘贴错误，而不是欺诈。所有这些只能通过编辑与作者进行讨论来解决。然而，现在AI已经非常有效且成本低廉。专家表示，一波自动图像检查助手可能会在未来几年席卷科学出版行业，就像在十年内使用软件检查抄袭成为常规一样。出版业团体还表示，他们正在探索比较不同期刊稿件中图像的方法。

其他图像完整性专家对这一趋势表示欢迎，但警告称尚未对各种软件产品进行公开比较，并且自动检查可能会产生过多误报，或遗漏某些类型的操作。从长远来看，对软件筛选的依赖也可能会促使欺诈者使用人工智能来欺骗软件，就像一些人通过调整文本来逃避抄袭筛选一样。德国海德堡EMBO Reports 的主编 Bernd Pulverer说：“我担心我们正在与人工智能技术进行军备竞赛，这可能导致一些深度伪造无法被发现”。

与手动检查器相比，AI软件可以更快、更大规模地发现研究论文中的重复图像工作——但仍需要编辑监督。

0 (3).png

图片来源：Laurence Dutton/Getty

软件时代？

由于担心错误或欺诈，研究人员多年来一直在开发图像检测AI——这可能使有问题文献比目前有限的撤回和更正数量多很多。2016年，由微生物学家 Elisabeth Bik领导的约20,000篇生物医学论文的手动分析[2]，加利福尼亚的顾问图像分析师表明，多达 4% 的论文可能包含有问题的图像重复。（每年通常只有大约 1% 的论文得到更正，被撤回的更少。）

“我知道大约有20人在开发图像检查软件”，加利福尼亚州旧金山经营咨询公司Image Data Integrity的 Mike Rossner表示，他于二十年前在Journal of Cell Biology杂志上第一次介绍了手动筛选稿件。去年，出版商联合成立了一个工作组，为筛选图像问题的论文制定软件标准。该小组今年发布了关于编辑应该如何处理篡改图像的指南，但尚未制定软件指南。

一些学术团体和公司表示，期刊和政府机构正在试用他们的软件，但Proofig 是第一个公开命名客户的公司。执行主编Sarah Jackson说，“除了 AACR，美国临床调查学会于7 月份开始使用Proofig的软件来处理Journal of Clinical Investigation和 JCI Insight 杂志的稿件。伦敦 SAGE 转型负责人Helen King表示，SAGE Publishing 于10月在其五份生命科学期刊中采用了该软件。

图源：Proofig

Proofig 的软件从论文中提取图像，并将它们成对地进行比较，以找到共同特征，包括部分重复。在一两分钟内可以检查一篇典型的论文。该公司的创始人 Dror Kolodkin-Gal说，“该软件还可以纠正棘手的问题，例如将高分辨率原始数据压缩成较小文件时可能出现的压缩伪影。计算机比人类视觉更有优势，计算机不仅不会感到疲倦，运行速度也会更快，而且它也不会受到大小、位置、方向、重叠、部分复制和这些因素组合的影响”。

图像检查的成本远高于抄袭检查的成本，Kolodkin-Gal虽然拒绝详细讨论定价，但表示与出版商签订的合同往往根据论文中的图像数量收费，但也取决于稿件的数量。他说，“这相当于每张纸的收费接近几十美元而不是几百美元”。

Jackson 说，“在 JCI上，该软件发现的问题比以前工作人员手动审查的问题要多。但是工作人员对于检查 Proofig的输出仍然必不可少，重要的是该期刊已经拥有处理各种图像问题的程序系统。严谨的数据是我们期刊的绝对标志，这值得花费时间和金钱”。

与此同时，位于瑞士洛桑的出版商 Frontiers 开发了自己的图像检查软件——AIRA，作为自动检查系统的一部分。一位发言人说，“自 2020 年8月以来，一个内部研究诚信团队一直在使用AIRA对所有提交的稿件进行图像检查。它标记的大多数论文实际上没有问题：只有大约10%需要完整性团队的跟进”。

包括 Bik和Rossner在内的图像完整性专家表示，他们还没有尝试过AIRA 或Proofig，并且很难评估尚未使用标准化检测进行公开比较的软件产品。 Rossner 补充说，“除了重复之外，检测图像处理也很重要，例如删除或裁剪图像，以及图像盗用。该软件可能是视觉筛选的有用补充，但它可能无法替代当前形式”。Bik 补充道，“我相信这最终将成为稿件筛选的标准”。

此图来自图像检查软件公司Proofig，展示了其程序如何比较图像的各个部分（红色矩形，左侧）并标记相同的部分，在拉伸或旋转的图片中均是如此。蓝线表示AI检测到了数百个相同的特征。

0 (4).png

图片来源：改编自CDC/Proof

行业谨慎

尚未采用AI图像筛选的出版商提到了成本和可靠性问题——尽管有些出版商正在开发自己的AI。出版商PLOS的一位发言人表示，“正在密切监控工具的进展，这些工具能可靠地识别常见的图像完整性问题，并且可以大规模应用”。Elsevier表示，“仍在测试软件，我们的一些期刊会在发表前，联合使用软件工具和手动分析，筛选所有已接受的论文”。

一位发言人表示，2020 年4月，Wiley为临时接受的稿件推出了图像筛选服务，目前有120多家期刊使用，但是由软件辅助的手动筛选。出版Springer Nature表示，正在评估一些外部工具，同时整理数据以训练自己的软件，该软件将结合互补的AI和人工元素来识别有问题的图像。

Pulverer 说，“EMBO Press 仍然主要使用手动筛选，我毫不怀疑很快就会拥有高级工具”。Pulverer担心欺诈者可能会了解该软件的工作原理，并使用 AI 制作人们和软件都无法检测到的虚假图像。尽管还没有人表明此类图像出现在研究论文中，但去年在bioRxiv上发布的一份预印本表明[3]，有可能制作与真实数据无法区分的生物图像的伪造版本，例如蛋白质印迹。但是研究人员正在解决这个问题。印第安纳州西拉斐特普渡大学的计算机科学家Edward Delp负责美国国防高级研究计划局资助的一个项目，该团队正在发现AI伪造的生物图像，例如显微镜图像和X射线。目前，有关其系统的论文正在审查中。

跨期刊图像检查

目前，AI 图像检查通常在稿件中完成，而不是在许多论文中完成，这将使其计算量越来越大。但商业和学术软件开发商表示，这在技术上是可行的。纽约雪城大学的计算机科学家Daniel Acuña去年在数千份COVID-19预印本上运行了他的软件以查找重复项。

Crossref 是一家由15,000多个组织组成的美国非营利性合作组织，该组织负责组织跨论文的抄袭检查等，目前正在开展一项调查。其产品总监Bryan Vickery 说，“可以共享图像的跨出版商服务是可行且有用的”。

0 (2).png

STM Solutions 是英国牛津学术出版商行业组织 STM 的子公司，12月宣布正在开发一个基于云的环境，以帮助出版商检查提交的文章是否存在研究诚信问题，同时保持隐私和保密。STM 发言人Matt McKay 表示，“在我们的计划中，检测跨期刊的图像篡改、重复和抄袭占据重要位置”。

参考文献

[1] doi: https://doi.org/10.1038/d41586-021-03807-6

[2] Bik, E. M., Casadevall, A. & Fang, F. C. mBio 7, e00809-16 (2016).

[3] Qi, C., Zhang, J. & Luo, P. Preprint at bioRxiv https://doi.org/10.1101/2020.11.24.395319

科研星球

这几个期刊将对“图片误用”动刀了

标签