(原标题:巨头大手笔布局医疗大数据 标准化应用掣肘重重)
神州控股和北科生物分别是IT、BT(生物技术)巨头,今年却不约而同地加速布局医疗大数据,日前,两者皆向21世纪经济报道记者讲述了最新的布局进展。而在23日刚刚结束的2017深圳国际BT领袖峰会上,医疗大数据也成了一大热点。
美国医学信息学会主席道格拉斯·弗里斯玛表示:“最终目的是通过大数据来帮助治疗疾病,因为每个病人身上攫取的数据越多,诊治下一个病人的成功率就越高。这就需要整合数据资源,不光是病人的电子病例,还有健康程度以及各方面的信息汇集起来,成为未来诊治其他病人的很好根据。”
相比较欧美国家,中国医疗大数据虽然起步晚,但随着健康医疗大数据应用被发展纳入国家大数据战略布局,以及三大国家级健康医疗大数据公司的成立,这一领域越来越受到政府、医院、科研机构和学术界的重视。
但市场蛋糕并不是那么好尝的。国内医疗数据在各个细分领域的开发应用挑战重重,包括医院数据无法实现互联互通、数据解读层面缺乏相应的人才等。即便是数字化医疗发展较为先进的欧美国家,也难以解决上述问题。
切入口众多
神州控股是医疗领域的后来者,其在此前披露了供股计划,计划将募资近60%的资金用于投资中国健康医疗大数据科技发展集团,其他资金用来偿还债务和利息费用。
资料显示,中国健康医疗大数据科技发展集团由中国工商银行、中国银行及中国电信集团等多间央企及国企筹划成立,是国家主导筹建的第一间健康医疗大数据集团。
根据神州控股公布的进展,其接获有效的接纳和申请供股股份合约共55.17亿股,占供股股份总数约1644.5%,超额认购逾15.44倍,筹集资金约港币13.4亿元。神州控股首席执行官叶成辉表示:“这个集团大部分股东都是国企,神州控股会占34%的份额。”布局医疗领域的背后,神州控股正处于战略转型期,其出售了IT销售业务后,着力发展人工智能、大数据和云服务。去年底,孵化近10年、筹备近3年的神州医疗正式成立。
据了解,神州医疗正与中国科学院开展全面合作,建设中国最大的肿瘤数据中心及肿瘤大数据平台,截至今年上半年,该肿瘤数据中心已连接17家省级肿瘤医院。
根据叶成辉介绍,神州医疗主要业务有三部分:一是和国内外的机构合作数据分析,例如牵手哈佛一家研究中心合作,对方将提供全球的基因数据给神州医疗,主要是面向癌症数据;二是影像处理,主要是结合医疗人工智能技术;三是参与建立中国健康医疗大数据科技发展集团。
“集团有一家是国家卫计委发放牌照的公司,可以让大家在全国不同城市、不同平台用到市民的医疗数据,进行不同的分析。国内以后会有一个大数据的医疗网,可以把所有医疗数据存储起来。”他说。相比之下,北科生物则是医疗领域的老兵,在布局医疗大数据之前,其在细胞数据存储上已经成果颇多。
不久前,北科生物跟成都天府国际生物城签署协议,共建国家生物医学大数据产业园项目,该项目中北科生物的投资额为60亿。北科生物董事长胡祥向记者透露:“接下来我们会把全国性的布局做起来,现在我也在跟几个城市谈。项目建起来以后,可以把标本、数据汇集起来。”
北科生物布局医疗大数据并不足为奇。2005年在深圳成立的北科生物是干细胞治疗技术的首批受益者之一,在过去的12年里,北科生物在全国各地落地细胞存储中心、区域细胞制备中心等,细胞存储业务一路增长。
“因为我们每个人的基因组成数据在细胞里都有,如果把纯细胞的业务变成获得跟人体相关性最高的健康大数据的来源,把细胞当成入口,大数据组合起来找到相关关系,就可以对疾病诊断、健康管理做出很好的模型。”胡祥说。
事实上,神州控股和北科生物仅仅是众多参与者中的一员。近几年国内医疗大数据市场玩家日益增多,各个玩家的切入点不同,遍布基因细胞、传统IT系统、互联网平台、医疗人工智能等,但最终目标都是通过进一步的数据开发实现智能化应用。
挑战不少
玩家虽然越来越多,产业却仍旧处于发展初期。
道格拉斯·弗里斯玛分析指出,医疗大数据的发展面临三大挑战:一是可用性,采集数据需要区分结构化数据和非结构化数据,提取时机、方法、内容等需要规则引导;二是多样性,数据采集设备和采集系统格式都不同,需要统一化再分析;三是数据应用,需要信息领域的专家开发数据,再应用到医疗机构里。
“最大的挑战不是数量和速度,而是如何将不同类型的数据整合、分类,通过一定的语言形容这些数据,并准确、真实的展示出病人的状况。”他说。
具体来看,传统医疗大数据主要是指医院内的医疗数据,国内医疗数据聚集地是各大三甲医院。
而中国的医院信息化已走过20个年头,相继出台了数据、信息化建设标准,但各大医院的落地情况参差不齐。即便是医院内部信息的互联互通问题已逐步得到解决,但医院与医院、医院与社区、区域与区域之间的信息仍不相容,信息孤岛现象依旧存在。
道格拉斯·弗里斯玛指出,医疗大数据发展较快的美国,也存在类似的信息孤岛现象。他说:“在研究的过程中,这些数据也是研究者所拥有的,他们不愿意把数据拿出来分享。所以我们仍然在苦苦挣扎,希望能找到好的方法将人们手中的数据进行分享,我们现在已经开始打破数据孤岛和数据隔离。”
最近几年,随着基因测序成本下降、细胞治疗技术的研发推进,组学数据开始走进大众视野。
胡祥指出,未来很重要的一类是组学数据,不管是基因组、蛋白组、微生物组还是其他,读取出来的数据是机器可以高效识别的,数据和人类健康相关性也很强。
不过,由于组学数据数量庞大,加之研发突破时间较短,目前组学数据的积累和应用面临多种难题,其中一大难题就是数据解读。中国科学院院士贺林直言,遗传咨询与基因检测是手心手背的关系,但国内遗传咨询人才的缺口非常大。
“美国经过了半个世纪培养到现在,有资质的遗传咨询师是四千人左右,国内的形势更严峻。基因检测产生这么多数据以后,不能理解、读懂的话,数据也是没有意义的。”贺林说。
除此之外,人工智能也是医疗大数据应用的一大热点,IBM、谷歌、苹果、腾讯等巨头皆出手布局。这一领域的数据早已跳出了医院数据、基因数据等医疗层次,涵盖行为数据、饮食数据等更多场景。
胡祥认为:“随着各种传感器和可穿戴设备的应用,24小时持续采集的数据也是非常有价值的。如果能把这一系列数据标准做好、方法学找到,把核心数据高效的整理起来,用这些数据训练人工智能,这才是未来的制高点。”
美国医学信息学院院士刘宏芳进一步表示:“国内有很大机会建立统一平台和标准化。目前相关开发、分析等专业人员的培训美国也是在摸索,这和传统统计、计算方法不一样,需要跨学科的方法研究。另外数据有了,但隐私也得注意。”