近年来,人工智能(artificial intelligence,AI)的发展正在为很多传统的工作带来巨变,渗透到现代生活的方方面面。常见的例子包括计算机象棋游戏、语音识别、内容传递网络中的智能路由(intelligent routing in content delivery networks)及自动驾驶汽车。在金融领域,AI被常规用于欺诈检测、算法交易和聊天机器人(即,通过语音或文字进行对话的计算机程序,如在线虚拟助理)。
其中最令人瞩目的,当属2017年的阿尔法围棋(AlphaGo),年初时战胜人类冠军的AlphaGo Master,在10月份被升级版的AlphaGo Zero战胜时,具有划时代的意义。尽管其能否代表智能计算的发展方向还有争议,但比较公认的观点是:由此,计算机技术已进入AI的新信息技术时代(新IT时代)。其特征,就是大数据、大计算、大决策,三位一体,AI的智慧正在接近人类。
在医疗保健领域,采用AI的工作起初进展比较缓慢,但目前正在以令人难以想像的速度突飞猛进。AI在医疗行业时机成熟的原因之一,就是“大数据”。因为在医疗领域里有极其丰富的数据集,让计算机可以用于“学习”、测试和验证,从而进行分析和给出预测,由此带来很多新的机会。
AI在医疗图像识别中的应用基础:从特征工程到神经网络
此前,在医疗保健领域,大多数计算机的成果来自于图像识别和分析领域,尤其聚焦于特征工程(feature engineering)。那么什么是特征工程呢,简单说,就是发现对因变量y有明显影响作用的特征,通常称自变量x为特征,特征工程的目的是发现重要特征。
一般来说,特征工程大体上可以分为三个方面,一是特征构造,二是特征选择,三是特征生成。特征工程在医学领域里的应用,其本质,就是先由专家给出病变特征(特征构造),建立起模型(特征选择),之后由计算机根据这些规则,去评估所检测的样本是否存在异常(特征生成)。这一方式,目前正在升级为AI时代的机器学习。
与前面所述的模式不同,包括机器学习技术在内,深度学习是AI的一种形式,狭义地说,就是“很多层”的神经网络,其所执行的是基于图像数据的、逐像素评价的迭代优化策略。也就是说,不需要事先给出规则,进行复杂的预处理,可以直接输入原始图像,训练模型不断自我学习,从而得出结论。
这里面的区别,就像是AlphaGo Master和其升级版的AlphaGo Zero之间的差异。前者是预先置入了数百万盘人类围棋专家的棋谱,并以监督学习和强化学习的方式进行自我训练;后者则不需要人类专家的棋谱,直接自我对弈产生大量棋局,为下一代版本提供训练数据,此过程循环往复,通过神经网络强大的搜索算法,进行自我对弈。
而在医疗图像识别领域,卷积神经网络(convolutional neural network,CNN)正在起着越来越重要的作用。作为神经网络的一种,CNN是一种前馈神经网络,人工神经元可以响应周围单元,可以进行大型图像处理,在模式分类领域,尤其有着显著的优势,成为研究热点。由于该网络避免了对图像的复杂前期预处理,可以直接输入原始图像,因而得到了更为广泛的应用。
CNN在医学图片识别领域里的实践
在医疗领域,病理切片的读取,就是一种具有模式分类特征的工作,并已经通过CNN算法取得了一定的成果,有望提高医疗的质量、安全性和诊断效率,使之更加标准化和专业化。例如,在Esteva等人的研究中,AI被用来区分皮肤病变是否恶性,研究人员比较了CNN鉴别恶性黑色素瘤等皮肤癌的能力,证明了AI算法在评估活检证实的临床图像工作中,至少和21个专业皮肤科医生的能力相当。研究人员建议,可以在移动设备(如智能手机)中置入类似的算法,允许这一低成本的诊断工具能够在世界的任何地方都得到普及。
在另一项研究中,Gulshan等应用了深度CNN方法检测了超过12.8万成人糖尿病患者的眼底图像,去识别糖尿病视网膜病变。这个算法对于鉴别视网膜病变和黄斑水肿的灵敏度和特异度都非常高,其研究意义在于建立了一个明确的路径来使用AI——不是取代医生,而是使用AI来进行那些操作简单、具有成本效益、广泛可用的检查和分析,去识别那些需要转诊、特殊护理的高危患者,同时安慰其他那些不存在视网膜变性或者病情稳定的糖尿病患者。
图像识别:放射科与病理科的不同
在医疗领域,放射学中数字图像的应用已经超过25年以上,这为应用AI进行诊断提供了有利条件。数项研究显示,包括乳腺病变的钼靶X线摄影、肺结节和感染的计算机断层扫描(CT)、脑肿瘤的磁共振图像等在内,放射科医师可通过AI来评估各种类型的扫描,得出诊断结论。
与放射学相比,病理学采用数字成像和计算机辅助诊断技术已经晚了很多年。在某种程度上,这也和两个学科的工作特点有关。因为计算机数字成像可以减少或免除冲印胶片的必要,解决了胶片存储、丢失和运输有关的问题。例如,这些胶片需要送往手术室、急诊科和重症监护病房(intensive care units,ICU)。数字图像能够大大提高效率和安全性。
而病理科则不同,因为解剖病理的工作流程,并不会因为数字病理学而减少或消除,医生仍需切取可疑的病变组织,将其冰冻后切片和染色,进行读取和存储。电子病理学将增加额外的工作流程、人力资源、设备和重要的数据存储终端,而且,据估计,病理学图像的数据将比放射学大出10倍。所有这些,都是在已有的操作流程上增加新的步骤和成本,将为卫生体系带来压力。
当然,数字病理学的采用将带来一些优势,特别是在远程会诊、读片的质量与安全方面。尽管如此,数字病理学的广泛采用,将需要一个明确的价值主张,而这种价值主张的实现则是缓慢的。
AI应用于病理诊断:数字化是第一步
恶性肿瘤的最终诊断,主要依赖于病理学,尤其是淋巴结转移、远处转移等预示着疾病严重程度的指标,需要靠有经验的病理医生通过读片来进行判断。在传统的医疗实践中,病理科医生会将送来检查的活组织做成冰冻切片,安装在载玻片上,并进行染色,然后使用光学显微镜进行观察和评估,给出诊断结果。
AI的出现,使这一流程得到了优化。病理科医生们将不再完全使用显微镜来读片,而是可以把切片电子化,放大到更多倍,在电脑上直接显示出来,进行读取。AI在医疗保健中的出现、数字数据成本的降低以及数字图像的可用性,现在正成为数字病理学的成功之所在。
2017年4月,“飞利浦智能网络病理解决方案”(Philips IntelliSite Pathology Solution,PIPS)得到了美国FDA的许可,被批准用于初级病理诊断。该系统使用专有的硬件和软件扫描并将从活检组织制备的常规外科病理玻璃载片数字化,这样,分辨率相当于放大倍数400倍。使病理学家能够通过数字化的方式来读取组织切片,以进行诊断,而不是直接在传统光学显微镜下去观察那些安装在载玻片上的组织样本。此外,由于系统将切片数字化,它还提供了一个精简的切片存储和检索系统,为病理医生和医务工作者获取数据提供了很大的便利。
这是第一个可以帮助解读数字病理图像的全切片影像系统(whole slide imaging,WIS),也是FDA批准的第一个用于该目的的WIS系统。
FDA表示,此次批准是基于约2000例手术病理病例的临床研究,对来自身体多个部位的活检组织的数据进行了评估。研究结果发现,基于PIPS图像所进行的临床解释,所得出的诊断与使用玻璃片制作的结果相当。
PIPS被FDA批准的更大意义在于,它将会被作为一个参照标准,为后续的其他类似医疗器械获批铺平道路。未来几年里,预计将会有许多新的初步诊断扫描仪被批准上市。
AI识别乳腺癌淋巴转移:Camelyon16竞赛
2016年,电气与电子工程师学会(Institute of Electrical and Electronics Engineers,IEEE)国际生物医学成像研讨会(International Symposium on Biomedical Imaging,ISBI)发布了Camelyon16竞赛,主要内容是对乳腺癌在淋巴结中的转移进行病理切片的分类与定位,对自动化深度学习算法用于检测乳腺癌转移的诊断准确性进行了评定。2017年12月12日,《美国医学会杂志》发表了这一竞赛的结果,研究者来自奈梅亨拉德堡德大学医学中心、埃因霍温理工大学和乌得勒支大学医学中心。
Camelyon16竞赛中,任务是判断淋巴结病理切片是否发生了癌变,同时需要对发生癌变的位置区域精准定位,所得出的结果将与临床病理医生的诊断进行比较,以评估其准确性。
一般来说,乳腺癌细胞的扩散方式通常会首先转移到附近的淋巴结中,所以在很多乳腺检查中,会提取一些附近淋巴结组织做成切片,经过切片、染色、扫描等过程后,生成图像。癌细胞和正常细胞在颜色、纹理、大小和组织形式上都会有很多的不同,一般来说就是,“核大深染”的突出特征。在大医院中,很多上了年纪的且具有很多“看片”经验的医生炙手可热,这意味着人类同样需要很多经验才能正确的进行分析判断,而年轻或缺乏经验的医生则容易出现误判。
Camelyon16希望能够通过计算机视觉技术帮助医生进行有效筛选,从而减少工作量和误判的可能性。共有390支来自世界各地的参赛队报名,其中23个团队在截止日期前提交了32种评估方法,其中近90%采用了基于CNN的方法。最后哈佛医学院、麻省理工学院、麻省总医院、香港中文大学、德国慕尼黑ExB队胜出。
2015年11月~2016年11月间,根据免疫组化染色确认,270例有或无淋巴结转移的全切片数码图像(其中110例有转移、160例无转移)被作为练习数据集(训练组),由两家荷兰医学中心提供给挑战赛参赛者,用于建立模型,训练算法。随后,又使用另外129例全切片数码图像(49例有转移、80例无转移)作为验证数据集(验证组),对算法进行评定。
同时,由12位荷兰病理医生组成的专家组,模仿日常病理工作流程,对验证组的相应载玻片进行评估。其中11位专家被要求在2小时左右的时间内,确定各个切片存在淋巴结转移的可能性;另外1位病理医生则无时间限制,他最终用了30小时读完了所有验证组的切片。
通过受试者操作特征(receiver operating characteristic,ROC)曲线下面积(area under the curve,AUC),对AI算法的诊断性能进行分析。结果发现:所有AI算法的AUC范围为0.556~0.994。最佳算法辨别有无病变的真阳性率为80.7%,平均假阳性率为1.25%,辨别转移分类的AUC为0.994,显著高于有时间限制的病理医生(P<0.001)。排名前5位的算法辨别转移分类的平均AUC为0.960,与无时间限制的病理医生相似。
因此,在挑战赛背景下,通过模仿日常病理工作流程的模拟练习,一些深度学习算法对全切片数字化图像的诊断能力,优于有诊断时间限制的11位病理医生,接近无诊断时间限制的病理专家。这些结果表明了深度学习算法用于病理诊断的潜力,但是需要在临床环境下对其实用性进行评定。对此,美国布莱根妇女医院的病理学专家发表述评:深度学习算法帮助人工智能检测乳腺癌淋巴结转移。
AI辅助病理学:广泛应用的几大障碍
虽然数字病理学为医学的发展带来了很多可以想象的空间,但和任何新生事物一样,AI在病理学中的广泛应用,也需要解决几个客观存在的问题。一个最重要的问题在于,AI如何在临床实践中得到应用。我们必须克服很多纷繁的问题,才能解决几个重大障碍。
首先,鉴于数字病理学将会增加额外的流程(包括人员),而显得成本更加高昂,如何证实AI的效率、质量和安全性,就显得尤其重要。有专家正在着手解决这一问题,试图证实其效率和潜在的质量问题。然而,现实是,很难在临床实践中开展对比研究,以证明其效用,更不必说具体任务的适用性。进一步的收益将来自于AI数字图像和其他多个数据集(例如,基因组学和放射学图像)的联用,这可进一步提高医保系统数据的利用价值。如何解决这一问题,将是AI广泛应用的第一个、也是最直接的障碍。
第二个壁垒,则是成本问题,如果AI的价值能够得到确证,可能直接导致政府或者其他第三方付费者愿意为AI辅助的病理检查建立报销机制,为其买单。目前,尽管医保体系已经有一些计算机辅助的报销编码存在,但应用还不够广泛,而且经常被拒绝。美国的医保体系目前正趋向于以安全有效的护理价值导向作为报销依据,而不只是为服务付费,因此将AI识别作为报销内容的一部分,将成为一种重要的激励,促使算法的开发和有效性的证实。
第三,教育和培训将是一个最大的挑战,需要长期的过程去解决。AI和其他计算机方法将必须被整合到培训项目中,未来的病理科医生将更加轻松并乐于使用AI算法。他们在工作中将面对的是计算机算法处理过的电子成像画面,客观的说,培育出这样的劳动力,如果从现在开始做起的话,大约还需要5到10年的时间来实现。
总结:AI病理学正在实现过程中
AI将成为医疗领域的主要元素,并且已经在医疗实践中起到一定的作用,并在很多领域具有潜在的价值。最近的例子已经证实了AI的价值,其价值在于辅助临床医生,提高诊疗的安全和质量。放射科医生可以在他们的家里、诊所里、办公室里,阅读从世界上任何一个地方发来的放射学检查片子,为那些缺乏放射学专家的地方送去专家读片的结果,这种在以前不可想象的情形,目前已经实现。
病理科医生应该也会有类似的机会,通过电子图像和AI技术来精准识别,快速、准确地拿出检查结果,AI技术应该就是病理学界所一直期盼的。当然这还需要在外科病理检查的流程中得到证实,深度学习将有助于病理学家提高他们诊断的准确性、标准化读片质量及获得更好的预后。
就像AI之前的显微镜、免疫组化和分子诊断技术那样,病理科医生被替代的风险极小。当然,尽管工作流程可能会改变,但病理科医生仍然会在临床工作中起到不可忽视的作用。未来已来,犹如逆水行舟,与其担忧会被取代,不如积极地学习和拥抱AI技术,去更好地开展工作。病理医生如此,其他学科的医生亦然。
(作者:贾玉华)
参考文献:Journal of the American Medical Association 2017,318:2184-2186