人工智能(AI)作为一种新兴的辅助技术被探索用于临床诊疗,尤其在提高组织病理学分类的准确性方面至关重要。因此使用AI对肾细胞癌(RCC)等肿瘤进行分类颇具前景。然而,目前尚缺乏针对RCC亚型设计的AI模型,为此布朗大学的程亮(医学博士,理学硕士)教授团队联合多个学科完成了一项针对RCC的AI模型设计,并将研究成果《Artificial intelligence-based multi-class histopathologic classification of kidney neoplasms》于2023年发表在《Journal of Pathology Informatics》期刊。该研究利用252张全玻片图像(WSI)(包括56张透明细胞RCC、81张乳头状RCC、51张嫌色细胞RCC、39张透明细胞乳头状RCC和6张肾母细胞瘤图像)创建了一个计算模型。该AI图像分类器的开发使用了298,071个图像块(每个350×350像素)。该计算模型表现优异,为AI模型的临床转化提供了可能性,需使用多机构多中心的大型数据集和前瞻性研究进行进一步验证该AI模型。
一、研究背景
肾细胞癌是常见恶性肿瘤之一,诊断通常基于症状、影像检查及组织病理学。组织病理学为金标准,能区分肾细胞癌亚型及良性肾肿瘤,对预后和治疗至关重要。然而,病理学家稀缺及免疫组织化学等辅助研究有限是一大挑战。数字病理学和基于人工智能的图像分析技术,特别是卷积神经网络,为自动化图像分类提供了可能性。本研究旨在创建能区分多种肾细胞癌亚型和良性肾肿瘤的计算AI模型,并评估其在全玻片图像验证数据集上的性能。
二、全玻图像分类
本研究总共使用了252张全玻片图像(WSI)来创建基于AI的图像分类器(197张WSI)和全玻片图像级别的肿瘤分类数据集(55张WSI)。
三、创建AI图像分类器
AI图像分类器通过Google AutoML API创建,使用298,071个非重叠的图像块进行开发,这些图像块被详细分类并随机划分为训练集(75%)、测试集(5%)和验证集(20%)。图像分类器经过1小时训练后,在基于区域下部分精确率曲线(AuPRC)的平均精确度上达到了76%(图1),经过8小时训练后,该指标提升至93%。在50%的阈值下,图像分类器的精确度为88%,召回率为86%(图1)。在分类任务中,该模型对嗜酸细胞瘤的分类表现最佳(94%),而对嫌色性肾细胞癌(ccpRCC)的分类表现最差(47%)。此外,文中还提到了1小时和8小时训练模型的混淆矩阵。
三、全玻片图像性能
为了评估图像块分类器的性能,采用了独立的全玻片图像(WSI)验证数据集。该分类器的任务是识别全玻片图像中的肿瘤图像块。每张全玻片图像包含的肿瘤图像块数量不等,平均985个,范围在35至2,508个之间。多数全玻片图像中,最常见诊断的图像块占比很高,超过67%的病例中,最常见诊断的图像块占比超过90%。基于多数投票的肿瘤分类方法表现良好,在85%的病例(47/55)中正确分类了肿瘤,包括肾细胞癌和嗜酸细胞瘤等多种类型。所有占比高于0.77的肿瘤均被正确分类。
综上所述,图像块分类器在全玻片图像验证数据集上表现出色,具有较高的准确性和可靠性。
四、验证模型预测的准确性
病理学家随机检查了全玻片图像数据集中高置信度预测的肿瘤图像块,发现它们具有典型的组织病理学特征(图3)。具体而言:
ccRCC(嫌色性肾细胞癌)图像块显示透明细胞小巢和肺泡结构(图3a)。
pRCC(乳头状肾细胞癌)图像块有乳头状突起,分为1型(嗜两性细胞质)和2型(嗜酸性细胞质)(图3b)。
chRCC(透明细胞肾细胞癌)图像块展现植物状细胞边界、核周晕及混合细胞(图3c)。
ccpRCC(集合管癌)图像块有透明细胞短乳头状突起和管囊状结构(图3d)。
嗜酸细胞瘤图像块含嗜酸性细胞巢及小囊肿(图3e)。
肾母细胞瘤图像块显示高核质比细胞的紧密管状结构(图3f)。
(图片在网站上观看会导致画面变形,请于大家泌尿公众号上阅读全文。)
该模型能准确区分嫌色性肾细胞癌(ccRCC)与集合管癌(ccpRCC),以及乳头状肾细胞癌(pRCC)的乳头状突起与集合管癌。模型未将ccpRCC误判为ccRCC。同时,模型在区分嗜酸细胞瘤与透明细胞肾细胞癌(chRCC)方面表现优异,无显著重叠。特例分析显示,模型在全玻片中将透明细胞肾细胞癌的嗜酸性变异型准确归类,但在分析部分图像块时因嗜酸性细胞巢结构干扰,误判为嗜酸细胞瘤,提示需持续优化算法。
五、结论
本研究开创性地将人工智能(AI)模型应用于肾细胞肿瘤(RCC)亚型的精细分类中,成功区分了六种关键的RCC亚型,包括嫌色性肾细胞癌(ccRCC)、乳头状肾细胞癌(pRCC)等,甚至在肾母细胞瘤这一难以分类的肿瘤上也取得了成效。相较于过去主要局限于2-3种RCC亚型分类的研究,本研究显著拓宽了研究的广度,覆盖了四种最常见的RCC亚型(合计占RCC总病例的95%),并纳入了嗜酸细胞瘤和肾母细胞腺瘤。
鉴于罕见肿瘤亚型病例数据的稀缺性,本研究正积极推动多机构合作,以加速病理学领域AI研究的进展。通过全切片图像(WSI)验证数据集,本研究深入评估了AI模型在肾切除术标本上精准区分六种RCC亚型的能力。然而,数据集未涵盖活检标本,且pRCC病例的增加可能带来选择偏倚。同时,虽然ccRCC病例多为2级和3级,但本研究未进行等级亚组性能分析。
尽管在创建诊断标签时采用了相对朴素的多数投票技术,但该AI模型在全自动诊断WSI方面已初步展现出潜在的准确性。为确保其可重复性,仍需进行大规模、多机构参与的验证研究。
参考文献:Gondim,D D.,AlObaidy, K l., ldrees, M.T, Eble, J N.,& Cheng, L.(2023). Artificialintelligence-based multi-class histopathologic classification of kidney neoplasms. Jouma/ ofPathologyInformatics,14.100299