多模态数字化病理诊断结直肠癌的高倍免疫荧光成像与传统组织学相同组织切片
固定和染色组织的显微解剖已经用光学显微镜研究了两个多世纪,免疫组织化学(IHC)也广泛使用了50年。H&E染色组织切片的组织病理学检查,辅以IHC和外显子组测序,仍然是诊断和治疗许多疾病,特别是癌症的主要方法。从基于h&E的组织病理学到数字技术的转变与从固定组织切片获得10-80通道数据的方法(例如,MxIF、CyCIF、CODEX、4i、mIHC、MIBI、IBEX和IMC9–15)的引入同时发生。这些高通量成像方法使我们能够对人类和动物的正常和病变组织进行深度形态学和分子分析,并生成空间解析信息,这些信息是其他单细胞方法(如scRNA测序)的理想补充。
H&E图像的组织病理学检测是一种自上而下的方法,利用与疾病相关的细胞和非细胞结构和形态的先验知识来分析图像。相比之下,使用多重复合成像的研究通常依赖于自下而上的方法,其中枚举细胞类型,并通过计算确定与疾病相关的邻近区域。我们有很大的机会将这些方法在研究和诊断机构之间建立联系,从而将标准临床实践与肿瘤微环境的单细胞分析相结合。用于此目的的理想仪器应具有足够的复杂性和分辨率,以区分肿瘤和免疫细胞类型,在最小的人为干预下实现有效的数据采集,并且关键的是,允许收集相同细胞的高质量H&E图像用于病理检查。现有的高重复合成像检测方法的相对复杂性阻碍了其在临床上的广泛应用。
在本文中,我们描述了一种方法,单次、全片、16至18通道免疫荧光(IF)成像,然后对同一组织进行H&E染色和成像,探索其在生成预测肿瘤进展的空间生物标志物中的应用。使用来自多种肿瘤类型的FFPE标本,比较了这种多模态“Orion™”方法以及实现它的商业级仪器的性能,以建立IHC和CyCIF的循环数据采集。我们发现,H&E和IF同切片图像的联合分析大大提高了我们识别和解释与疾病进展显著相关的图像特征的能力,促进了H&E图像的解剖注释的转移(例如区分正常组织和肿瘤),同时使用高plex数据标记H&E图像。我们还发现,从高倍IF图像的分子分析生成的机器学习(ML)模型可以与H&E图像的ML相结合,以帮助特征识别和解释(大大扩展了先前关于分子和H&E图像联合分析的数据)。综上所述,结合使用自上而下和自下而上的方法,在40例患者队列中可高度预测无进展生存期(PFS)的潜在生物标志物。值得注意的是,根据高倍组织成像的标准,我们的分析涉及了大量数据,但患者数量太少,无法验证临床试验。因此,目前的工作应该被认为是一项原理验证研究。幸运的是,Orion方法可以扩展到更大的队列,一旦这些队列可以组装起来,就可以测试和验证临床使用的生物标志物。
构建和测试Orion平台
研究了实现同一细胞(即来自同一组织切片)的一次性高倍IF和H&E成像的多种方法。由于伊红在530-620 nm范围内荧光强烈,在IF之前进行H&E染色被证明是不切实际的。然而,经委员会认证的病理学家证实,当使用行业标准的Ventana自动玻片染色机进行染色时,经过一次或少量IF循环后,可以获得“临床级”H&E图像。另外多重荧光显微镜的局限性及复杂光谱的拆分等也导致了灵敏度的大大降低。为了开发Orion平台,我们测试了来自不同来源的100多个化学荧光团,以确定18种ArgoFluor™染料,这些染料基于以下特性,可以通过离散采样进行光谱提取:(i)在500 - 875 nm范围内发射;(ii)量子效率高;(iii)光稳定性好;(iv)在多重panel中相互兼容。ArgoFluor染料上野抗体共价偶联,直接针对免疫细胞(如CD4、CD8、CD68)、上皮细胞(细胞角蛋白、E-cadherin)和内皮细胞(CD31)细胞以及免疫检查点调节因子(PD-1、PD-L1)和细胞状态标记物(Ki-67),生成适合研究上皮肿瘤和邻近正常组织微环境和结构的panel。加速老化试验证明了优异的试剂稳定性,预计在-20ºC存储下>5年。
该商业级仪器利用7个激光器照射样品,并使用4X至40X物镜(0.2 NA-0.95 NA)收集发射光。该系统采用多个可调谐光学滤光片,这些滤光片在薄膜干涉滤光片上使用非正交入射角来移动发射带通。这些滤光片具有90-95%的传输效率,能够收集10-15 nm带通通道,在波长范围宽(425到895 nm)内具有1nm的中心波长(CWL)调谐分辨率。窄带通发射通道提高了特异性,并通过使用比传统LED光源亮10倍的激发激光器和敏感的CMOS检测器来克服信号强度的降低。原始图像文件经过计算处理以校正系统像差,然后进行光谱提取以消除串扰,从而将单个生物标志物信号隔离到每个成像通道。然后使用MCMICRO软件计算单细胞和组织区域的特征。Orion仪器具有集成的明场模式,但本研究中使用的H&E图像也是使用Aperio GT450显微镜(徕卡)获得的,这是诊断应用的金标准。
图1
验证高倍、一次性荧光成像
为了测试Orion方法,收集了三组FFPE标本的图像:(i)人类扁桃体,(ii) 40例i-iv期结直肠癌(CRC)切除组织,(iii) TMA上可获得的多种肿瘤类型标本。该仪器包括了一个专用的自体荧光通道(Ex445nm/Em485nm,CWL),该通道提供了有关组织形态和结缔组织结构和血管成分的宝贵信息(图1b)。还被用于从IF通道中提取自发荧光,提高生物标志物的信噪比(SNR)。因此本文的图像代表了18层成像(16个抗体通道,自身荧光和核染色)加上H&E。为了量化光谱提取的有效性,我们对人类扁桃体的一些列切片进行了成像,每个切片都用与不同ArgoFluor荧光团结合的单个抗体染色,然后在所有通道中记录数据。在提取前,相邻通道间的光谱串扰平均约为35%,而在光谱提取后,这一数字减少了35倍至<1%。此外,Orion方法产生的单细胞数据在定性和定量上与IHC和CyCIF等既定方法产生的数据相似,并与多种肿瘤类型兼容,包括癌、淋巴瘤、胶质瘤、肉瘤以及正常和非肿瘤性疾病组织。
IF和H&E图像的综合分析
Orion方法可以实现同细胞H&E和IF比较(图2a),而现有方法需要使用邻近组织切片。与单独检查H&E图像相比,从IF中获得的分子标记能够更完整地枚举淋巴细胞;例如CD4、CD8 T细胞和B细胞谱系中的细胞在H&E上是相似的,但在IF上以明显区分(图2a中的箭头)。相反,在H&E图像中,一些细胞和细胞状态更容易根据形态学特征而不是免疫荧光标记来定义;包括嗜酸性粒细胞、中性粒细胞,在IF图像中无法分型,但其形态在H&E数据中具有高度特征性,以及有丝分裂的前期、中期、后期和末期(图b中的箭头和虚线)。为了量化H&E和IF图像中互补信息的数量,该研究计算了40个CRC标本数据集中无法使用IF图像分配明确身份的细胞数量(通过核分割识别),发现其占总细胞核的比例从6.5到42%不等(中位数= 16%)(图2c)。之前已经观察到类似比例的“无法识别”细胞,即使使用40-60 plex CyCIF成像,并推测这些细胞要么对panel中包含的所有抗体标记均为阴性,要么具有难以分割的形态。因此,利用先前发表的基于H&E数据训练的ML模型来识别Orion IF图像中缺少标签的细胞,并发现>50%的细胞被预测为平滑肌、间质成纤维细胞或脂肪细胞(图d)。病理学家通过目视检查H&E图像证实了这些预测(图2e)。还鉴定了标本中上皮区域被pan-ck、E-钙粘蛋白和免疫标记物染色较弱而难以通过IF识别。H&E图像检查显示,这些细胞对应于锯齿状腺瘤,而附近浸润性低级别腺癌细胞的pan-ck和E-钙粘蛋白染色强烈。锯齿状腺瘤和腺癌中细胞角蛋白亚型的差异染色之前已经描述了,推测它可能在标本C26中也反映了克隆异质性。得出的结论是,与单独使用任何一种数据相比,同一组细胞的H&E和IF图像的可用性大大增加了可以识别的细胞类型和状态的比例。对于不存在特定分子标记的细胞(例如间质成纤维细胞)或由于肿瘤亚克隆性而丢失的细胞,以及高度拉长或具有多核而难以分割的细胞尤其如此.
图2
识别预测疾病进展的肿瘤特征
在结直肠癌(CRC)中,根据免疫浸润程度和类型出现了一项临床试验Immunoscore®,它可以预测多中心队列研究中的疾病进展(通过PFS或OS来衡量),并在三期临床试验中可预测III期癌症复发时间。免疫评分使用免疫组化(IHC)来评估肿瘤中心(CT)和浸润边缘(IM)的CD3和CD8阳性T细胞的数量;在免疫评分中被定义为浸润边界两侧360 μm的区域;在本研究中,距离边界±100 μm)。风险比(HR;肿瘤在CT和IM上均含有很少免疫细胞的患者(免疫评分= 0)与肿瘤在两个区域中都含有许多细胞的患者(免疫评分=4)之间的进展速率差异报道为0.2,评分越高生存率越长。这是一个具有临床意义的差异,可用于指导关键的治疗决策,例如,是否在手术后进行化疗。
利用Orion数据开发了一种自动化方法,以PFS作为生存指标来概括免疫评分的关键方面。首先检测肿瘤-基质界面并生成符合CT和IM标准的界线(肿瘤边界周围±100 μm;图3)。通过模型确定单细胞中CD3和CD8阳性,在所有40例CRC病例中,每个区域(CT或IM)的每个标记物(CD3或CD8)的中位数阳性分数用作分配亚分0或1的截止值;将四个子分数的总和作为图像特征模型1(IFM1;图3b)。接下来,使用免疫评分的底层逻辑来利用多个Orion通道。共使用13个免疫聚焦标记生成约15,000个标记组合(IFMs),每个标记组合由CT和IM域内的四个标记组成(图3d)。每个CRC病例的评分根据中位数强度二值化为高分和低分。当计算HRs时,我们发现近2500个IFMs在性能上超过IFM1(4b和4c)。最优模型(IFM2)的HR = 0.0785 (图3d和3e),由CT中的α-SMA+细胞和IM中的CD45+、PD-L1+和CD4+细胞组成。留一重抽样显示,IFM2明显优于IFM1,并且在HR方面表现出稳定的排名。500倍的自举也证实了IFM2的风险比分布明显低于IFM1(图3f)。
H&E图像的组织学检查显示,进展缓慢的IFM2高的肿瘤有广泛的淋巴组织细胞慢性炎症,包括肿瘤浸润边缘的大淋巴样聚集体和三级淋巴样结构(TLS),而IFM2低的肿瘤有相对较少的淋巴样聚集体,没有TLS (图3g)。IFM2 -低的肿瘤也比IFM2 -高的肿瘤更具侵袭性,但评分与组织学亚型(例如常规形态与粘液形态)无关,与组织学分级(低级别与高级别癌)无关。因此,IFM2有可能捕捉到侵袭性肿瘤边缘周围免疫微环境的过度活跃和肿瘤相关成纤维细胞的潜在失活。因此得出结论,Orion数据可用于自动化先前描述的基于单通道IHC图像的生物标志物,并识别出明显优于它们的新标志物组合。
图3
识别新的疾病进展标志物
作为一种无偏自下而上的识别新进展模型的方法,我们使用了一种概率建模方法(LDA),可将混合实体的复杂组合减少到不同的组件群落(“topics”)。该研究使用H&E数据和ML/AI模型将CRC标本分为肿瘤和邻近正常组织,并在肿瘤区域细胞的单个IF标记水平上进行LDA(图5a)。这产生了12个在数据集中重复出现的空间特征(topics)。病理学家对图像的目检证实了这一标记概率与不同topic的计算结果相匹配,并且每个topic的频率分布在CRC样本中有时变化很大(图5b)。在40个CRC队列中,topic与PFS之间的最强相关性发现,topic7为-0.52 (p < 0.001),包括pan-ck和E -钙粘蛋白阳性,免疫细胞的贡献很小,topic11为+0.57 (p < 0.001)。包括CD20阳性,CD3、CD4和CD45的少量贡献(图5b-5f)。相反,涉及增殖标志物Ki-67+(topic 6)、PD-L1阳性(topic 9)或免疫细胞标志物(CD45+或CD45RO+;topic 3和10)与生率的相关性很小或没有相关性。
图4
LDA通过对高倍IF数据的直接分析,发现了一种不同于免疫浸润的肿瘤固有特征,这种特征与患者生存率低显著相关。Topic 7的主要分子特征是泛细胞角蛋白和E -钙粘蛋白阳性,但Topic 8在组成上相似,但与PFS无关(r = 0.01;Fig. 4c),为了识别与这些主题相对应的肿瘤组织形态学,将IF的标签转移到相同的H&E图像上,在H&E数据上训练卷积神经网络(CNN),并检查得分最高的肿瘤区域。在Topic 7的病例中,这些区域很容易被识别为具有间质浸润的低分化/高级别肿瘤区域(图5a和5b)。相比之下Topic 8主要由肠黏膜组成,其形态基本正常,部分区域有分化良好的肿瘤(图5b)。当检查Topic 7比例较高的标本的Orion和CyCIF图像时,发现E-钙粘蛋白与泛细胞角蛋白的比例相对于正常黏膜或Topic 8较低 (Na、K-ATPase表达也低)。这些都是细胞经历上皮-间质转化(EMT)的特征,这与CRC的进展和转移有关。然而在Topic 7阳性细胞中未观察到EMT的一些特征:增殖指数高(40-50% Ki67和PCNA阳性),EMT标记物和转录因子ZEB1的染色低(使用CyCIF数据评估时) 。因此,尽管Topic 7的分子和形态学特征彼此一致,但H&E形态学更容易解释CRC进展的长期特征。之前已经观察到,可解读性增加了对潜在生物标志物的信心,并显著提高了其临床转化的机会。
只有约1 / 3的患者IFM1评分高,IFM3评分低(两者结合与最长的PFS相关;图5d),因此我们认为将两种模型联合应用是有效的。使用复合模型(IFM4),我们观察到进展性和非进展性CRC患者之间几乎完全区分,HR = 0.045 (图5e)。这表明,自上而下和自下而上的分析中产生的癌症的免疫学和肿瘤内在特征可以有效地结合起来,生成具有高预测价值的预后模型。值得注意的是,在生成IFM1-3或高性能的IFM4混合模型时,没有进行参数调整。免疫评分的经验表明,使用更大的患者队列进行参数调整可以进一步提高性能。
图5