近日,中国科学院深圳先进技术研究院医学成像科学与技术系统重点实验室研究员李志成团队,联合郑州大学第一附属医院病理科主任李文才团队与神经外科主任刘献志、闫东明团队,首都医科大学宣武医院病理科主任滕梁红团队以及河南省人民医院团队,开发出新型的脑胶质瘤人工智能病理整合诊断系统。这一人工智能诊断系统以数字病理图像为输入,以2021年最新发布的第五版《世界卫生组织(WHO)中枢神经系统肿瘤分类》为诊断标准,直接输出符合最新指南的整合诊断结果,精度达到可比拟人类病理学家的水平。相关研究成果以Neuropathologist-level integrated classification of adult-type diffuse gliomas using deep learning from whole-slide pathological images为题,发表在《自然-通讯》(Nature Communications)上。
脑胶质瘤是常见的成人原发性脑肿瘤,其诊断金标准是术后病理切片检查。病理学家在显微镜下观察切片,根据组织学形态特征进行分类和诊断。而脑胶质瘤组织病理分类与预后、肿瘤生物学行为、遗传背景不一致。随着第五版《世界卫生组织中枢神经系统肿瘤分类》的发布,脑胶质瘤病理诊断迎来革新,正式迈入组织病理和分子病理整合诊断时代。依照最新指南,必须结合组织学特征和分子标志物,才能最终确定脑胶质瘤的类型和级别。脑胶质瘤整合诊断强调了分子信息的关键作用。实施整合诊断需要检测多个分子标志物,如IDH突变、1p/19q共缺失等,涉及Sanger测序、FISH检测等分子病理检测技术,耗时耗力且技术要求较高(整合诊断流程如图1所示)。同时,在临床实际中并非所有患者都有条件进行整合诊断。若能够在病理图像中直接确定整合诊断类型,将有可能省掉分子病理检测的环节,具有重要的临床意义。
数字病理图像智能分析技术在一些重大疾病的精准诊断中展现出应用前景。然而,将人工智能技术应用于脑胶质瘤的整合诊断颇具挑战性,主要原因在于脑胶质瘤形态学和基因型并不总是一致的:形态学相似可能基因型不同、形态学有差异可能基因型相同。新指南中的病理类型已不是单纯的组织学类型,而是融合了组织特征和分子特性的WHO“整合”类型。以IDH野生型胶质母细胞瘤来说,只要组织学判定为弥漫性胶质瘤且IDH为野生,再加上EGFR扩增、TERT启动子突变、7号染色体获得/10号染色体缺失三者中的一个,便可确诊为胶质母细胞瘤,而不再完全依赖于微血管增生或坏死等典型组织学特征;即使有微血管增生或坏死,若是IDH突变,也要划分为IDH突变的星形胶质瘤4级,而不能像上一版指南一样划分为胶质母细胞瘤。这打破了原来组织学病理类型和级别的界限,为数字病理图像智能分析算法带来了挑战。例如,算法即使识别出微血管增生或坏死等形态学特征也不可据此做出分类,应从图像模式中识别出底层的分子改变,才能得出预测结果,这对算法的表征能力提出了很高要求。
该团队收集了来自三家医院的2624例成人弥漫性脑胶质瘤患者数据,包括全切片病理图像和WHO第五版指南所需的全套分子病理检测数据。人工智能团队与临床医学专家利用超过110万张病理分块图像,开发出基于图像特征聚类的整合诊断模型(目前这一模型已开源)。前期研究发现:对于数亿像素规模的全切片病理图像,复杂的深度网络设计在面对多样性的病理模式时可能学习不到对诊断最为关键的信息,导致分类精度在不同数据集产生较大波动;在组织病理学分类任务中表现良好的模型在整合诊断任务中未表现出理想的泛化性和预测性能。研究发现,高维的病理图像特征空间可能对应不同的底层生物学信息,其中部分特征同时具备形态学特征+分子特性整合分类能力。基于这一发现,该研究采用聚类-分类的两步建模方法,在特征空间选出最具表征力的图块,再进行图块级分类,最终聚合为病人最终的诊断类别。在整个流程中,可重复性和稳定性是重点考虑的内容。该方法无需在病理图像上事先人工标注感兴趣区域。
实验结果显示,这一方法在内部验证集和两个外部测试集均取得了很好的分类结果,与其他常见模型相比具有更高的准确性。图3展示了对于病理专家很难或无法区分的“困难任务”典型病例,人工智能算法可以得到准确结果。
这一突破性的研究成果或推动人工智能病理整合诊断领域的发展,为数字病理整合诊断提出了新的可能性。本研究成果不能直接得出取代分子病理学检测的结论,但在临床诊断中分子病理学检测仍是分子诊断金标准。在需要快速做出初步判断、分子病理学检测不适用等场景下,基于人工智能的计算病理学算法则可以发挥优势:不需要分子病理检测,直接从数字病理图像中利用人工智能算法迅速判断出最有可能的整合诊断结果,为后续的诊疗决策提供支持。
研究团队单位:深圳先进技术研究院