科研星球

防止数据造假、促进数据共享和安全,区块链能解决临床研究的难题吗?

区块链近年来的名气越来越大,即使是圈外人也偶有耳闻,它常常与比特币绑定在一起。那区块链究竟是什么呢,又能怎样应用于临床研究的数据管理呢?


从本质上讲,它是一个共享数据库,也是一种革命性的数据管理方式。拿医院自主开展的临床研究场景举例,倘若有几家医院开展一场临床研究合作,最原始的办法就是各单位都用Excel表格记录数据。但这会有一系列的问题:医院各自为政,不好统一管理;数据都是明文记录,没有加密保护;原始记录可以随意更改,难以监管、溯源;数据成果最后集中到一家中心医院,协作医院只能做嫁衣裳;难以记录图像、视频等多种形态的数据。


对于企业主导的新药上市前的临床试验,临床监查员要在试验中确保数据质量的问题,最终我们的试验结果取决于研究中产生的数据,无论是申办方还是监管机构都希望数据是值得信赖的。临床试验是否达到监管机构的合规标准,原始数据是否标准,说到底还是信任与审查机制的问题。如果没有一个合适的医疗数据平台做到简单快捷的监查,申办方就要花费大量的人力与财力。

 

如果采用了区块链技术,上述的问题就能得到有效解决。那它的具体原理是怎么样呢,我们可以从以下的一些关键词去理解。

 

0.png

图1 区块链在医疗场景的应用


图1中患者产生的健康数据由医疗机构掌握,然后通过加密上传到区块链数据库中。研究者和患者可通过专属的解密方法获得授权的数据,研究者可用此类数据进行临床研究,患者也有权利是否允许自己的数据是否被访问。



去中心化


去中心化是区块链最根本的特征。什么是“中心”呢,大型的电商平台、教学三甲医院就属于这种“中心”。我们网购交易需要电商平台做担保,大型的临床研究需要大医院牵头。


这些中心化巨头的确为我们现实的生活、科研带来便利,但长期发展又会出现数据垄断、甚至数据作恶的现象。想必不少想做临床研究的伙伴也有这种体会:不是自己不够努力、技术不够,而是病人的数据都掌握在其他大医院,自己没有这样的平台,实在是有心无力。哪个医院掌握更多的数据,就能有更多的科研产出,强者越强。所谓的去中心化,就是把这个中心去掉,使原来属于中心化角色的权利分散化,参与者都能接触到这些数据,打破数据垄断。



分布式储存


那区块链通过什么样的手段实现去中心化呢,答案就是分布式储存。临床研究需要建立中心数据库,一般的数据库就相当于是一个账本,并且只有创建者,也就是发起研究的医院才能在这个账本上进行记账。而分布式储存数据库将一个公共账本分散存储到多个地方,参与的医院具有相同的权利,一起记录和共享数据。


除了促进共享外,每个医院都知道每次数据记录的事项,一旦有谁篡改历史记录,就很容易被发现。各医院间平日各自为政,谁也不是牵头单位,但如果能建立起区块链数据库,就能促进日常的病例数据共享,挖掘更多的科研价值。



联盟链


区块链可以进一步划分为公有链、私有链和联盟链,其差异在于数据权限开放的程度,公有链面对社会全体成员,全民皆可成为节点,去中心化程度最强;私有链中的节点都会被严格控制,有点像一个属于个人、或公司的私有账本,只对个人企业内部开放,去中心化程度最弱;联盟链就介于两者之间,数据由联盟内部的成员共同维护,只对组织内部成员开放。临床研究的数据需要一定程度监管和保密,参与的实体医院也有准入限制,所以医疗区块链实际上是一种联盟链。



哈希算法


数据的共享与安全的兼顾是个难题,区块链中的加密技术应运而生。其核心哈希算法是一种特殊的函数,它可以把任意长度的输入变换成固定长度的输出,永远都是固定256比特的长度。这个得到的输出值就叫做哈希值。哈希算法有一些特性,譬如无法通过输出倒推输入,不同的输入哪怕区别很小也会导致输出的哈希值差异很大,大部分的输入都能得到独一无二的输出等等。这些特性赋予了区块链不可篡改、匿名等特性,并保障了整个区块链体系的安全。

 

可以这样比喻,临床研究中,每记录一例患者的数据就会产生一个哈希值,这个哈希值就像水滴进入河流汇入大海,每个新区块的值都有上个区块的部分哈希值,经过层层处理分析,最后得出研究成果,但是最开始的哈希值仍然是可溯的。最后数据审核员只需要对比最终的哈希值和开始的哈希值,就能知道数据是否被篡改,同时也保证了数据的完整性。因为数据是以加密的形式传递的,所以即使数据丢失,患者的敏感信息也不会泄露。


0 (1).png

图2 哈希算法示意图



数字签名


我们的区块链里有多个医疗中心或监管机构作为节点,不同的节点权限不同,某个中心想要获取另一个中心的数据,需要经过一些列的验证操作。区块链主要使用数字签名来实现权限控制,识别交易发起者的合法身份,防止恶意节点身份冒充。这里所说的数字签名并不是某种纸质合约签名的扫描版,而是一段用于表示签名的字符。当A医院节点想要下载某批数据,他先利用自己的私钥对请求内容进行签名,并将签名附加在请求上。其他医院节点收到广播信息后,会用公钥验证其数字签名,完成消息完整性校验及消息发送者身份合法性校验后,改请求才会触发后续处理流程。



时间戳


那如果研究者想篡改原始数据怎么办呢,这就要引用到时间戳的技术了。时间戳一般是一个字符序列,能唯一地标识某一刻的时间。它可以证明其他的某个数据,在什么时间点,就已经完整存在。所以,简单来说,时间戳就相当于是数据的生产日期,并起到数据验证的作用


如图3,企业的新药市前临床试验涉及多个机构和大量的数据管理工作,最终的统计分析对结果至关重要,区块链可在开始前先对数据加上时间戳,然后再对数据进行揭盲。如果每一步数据传输都包含了哈希算法加密、数字签名、时间戳,数据的隐私和质量都会得到很大的提高,申办方与监管机构也对临床试验的质量更信任。


0 (3).png

图3 上市前临床试验流程



智能合约


临床研究中的数据审查繁琐且重要,有没有更高效方法替代人工呢?智能合约系统是个好的选择。简单来说,智能合约是一种在满足一定条件时,就自动执行的计算机程序。例如自动售货机,我选了什么商品,给了钱,就把商品弹出,这就是一个简单的智能合约系统。


这个前卫的概念早在1995年就已经提出,但是缺乏一个可靠的运行平台,确保智能合约不被篡改。区块链的去中心化、防篡改特性,很好地解决了这类问题。


当临床研究的原始数据符合一定规范后,各医院、机构节点均会验证相应条件,并将数据结果记录在区块链数据库上,进入下一个研究阶段,省去了大量的复核工作。基于区块链上大部分节点都是诚实的基本原则,如果某个几点修改了智能合约逻辑,那么执行结果就无法通过其他节点的校验而不会被承认,即修改无效。


0 (2).png

图4 临床研究相关数据在区块链中的传递


图4中上方栏为不同的临床试验阶段,左侧栏为不同的角色,中间的有颜色的空格代表不同角色在某一阶段发挥作用。当满足某条件后,触发智能合约自动到纳入患者阶段或进行锁库操作——引自Trials. 2017 Jul 19;18(1):335.



总结


综上所述,区块链技术可以有效地保障患者数据隐私、防止数据造假、促进数据共享,对于患者、医院研究者、企业都有很多好处。目前国内也有构建医疗区块链的趋势,但推广此技术起来仍面临许多难题,尚未有标杆性的平台诞生。我们掌握一定区块链的基础知识,能对未来的趋势有更深刻的了解。


来源:李健民 医咖会

没有账号?