深度学习在头影测量中的应用研究进展

2024-1-23 15:01  来源:口腔疾病防治
作者:曹凌云 颜家榕 汤博钧 赵婷婷 花放 贺红 阅读量:3335

    自1931 年由Broadbent 提出以来,头影测量(cephalometric analysis)技术不断发展、完善,逐渐成为口腔正畸和正颌外科临床诊疗过程中不可或缺的环节。临床医师通过对头颅侧位片或正位片上软硬组织标志点的识别,具体角度、距离和比率的测量计算,来实现对患者颌面畸形的判断与严重程度的分析、生长趋势和生长潜力的评估以及对腺样体肥大的诊断等。
    传统头影测量需医师在硫酸纸上手工定点、描记、测量,不仅耗时费力,而且可能因视觉因素、经验不足等产生误差,导致重复测量结果可能存在不一致。目前,临床上多采用计算机辅助的半自动头影测量,由医师手动识别相应的解剖标记点,由软件完成测量。然而,无论是传统头影测量还是半自动头影测量,解剖标志点的寻求仍然依赖正畸医师手动执行,经验不足的医师可能存在定位不准的问题。
    近几年,众多研究聚焦于借助人工智能(artificial intelligence,AI)实现全自动化的头影测量,以提升临床效率,并减少主观因素的影响。AI是指通过机器模拟人类问题处理和决策制定能力,其优势在于能够快速处理多种数据,减轻人工负担的同时提高稳定性和准确性。深度学习(deep learning,DL)是AI领域最热门的研究方向之一。DL 以神经网络为基础,模拟人脑神经元结构,各“神经元”间相互连接、层层递进,能有效处理多种复杂信息。
    不同于传统AI 算法,DL 无需人为设计复杂的数学模型,在提供学习数据的前提下,DL可自动进行训练学习,并在反复校正后找到输入和输出之间的各种复杂的非线性关系,通过“学习”已有数据形成“经验”来实现对未知数据的预测。卷积神经网络(convolutional neural network,CNN)是一种包含卷积计算,并具有深度结构的DL模型,在大型图像处理中表现出色。
    如今,随着医学影像数据的爆炸式增长和计算机硬件的不断提升,各类DL算法在医学影像中的研究得到了飞速发展。有研究表明,与其他AI算法相比,以CNN为主要代表的DL算法,在头影测量定位分析方面展现出更高的可靠性和准确性。
    1.基于深度学习的自动定点
    1.1 头颅侧位片自动定点
    基于头颅侧位片的头影测量是正畸和正颌外科临床上最常采用的一项技术。然而,颅颌面区域结构复杂、个体差异大,而且左右两侧解剖结构的重叠,对于标志点的准确定位往往是头影测量过程中的难点。研究者将经专家标记的头颅侧位片来训练DL 模型,以期通过DL 对专家定位的“学习”,来实现头颅侧位片的自动定位。
    对DL模型精确性的评估往往是将模型预测点的位置与专家定点的位置进行比较,测量两者之间的距离(mm/像素),以平均距离作为衡量标准,或以距离<2 mm 点作为“成功定位点”,计算其比例作为定点的准确率。Arik 等以CNN 为基础成功构建了头颅侧位片自动定点模型。该模型实现了对19个解剖标志点的自动定位,定点的准确率高达76%。
    Nishimoto等利用互联网收集219张头颅侧位片,以像素为衡量标准,其DL模型对10个解剖标志点的预测误差的平均值和中位数分别为17.02 像素和16.22 像素。该研究还将专家与DL模型对∠SNA、∠SNB等角度与SN 等距离的测量结果比较,结果显示所有测量值之间均无显著差异。Kim 等开发了一种基于网页的DL平台,实现了对23个解剖标志点自动定位,其定点的平均误差仅为1.37 mm。
    Oh等将多种AI 技术与CNN 相结合,对侧位片进行预处理以强化其解剖轮廓等特征后再进行CNN的自动学习,其准确率高达82%,对每张侧位片的分析时间仅需0.15 s。Lee等开发出了一种基于贝叶斯CNN 的人工智能模型,该模型在自动定点的基础上给出了各标志点的95%置信区间,其准确率亦高达82%。Zeng 等利用多级联CNN,将三级CNN(align-net、proposal-net、refine-net)相结合,分别实现影像一致性特征的提取、结构的标定对齐和标志点的粗定位、以及标志点的精细调整。
    在2个测试数据集中,该模型与金标准定点平均误差仅为1.34 mm 和1.64 mm。Kim 等以来自多中心不同质量的头颅侧位片为训练数据集来训练多级联CNN,以提高模型对于不同侧位片的识别能力,研究结果显示其平均误差仅为1.36 mm。
    1.2 头颅正位片自动定点
    头颅正位片也是正畸和正颌外科经常使用的影像学检查之一。相较于侧位片,头颅正位片更能反映牙颌面横向上存在的问题,如牙弓宽度不调、颌骨宽度不调、下颌偏斜等。与侧位片类似,正位片的头影测量同样依赖于解剖标志点的定位和对距离、角度、比例的测量。Muraev等构建了基于DL的正位片自动定点的人工智能模型,其以300张正位片为训练数据集,30张为测试数据集,并进一步将标志点根据定点难度分为高、中、低3 个等级分别进行研究。
    该模型自动定点的总体误差仅为2.87 mm,低于初学者定点误差(3.61 mm),与普通医师(2.85 mm)、专家(2.47 mm)定点误差相似。另外,研究者发现,虽然初学者总体误差高于DL模型,但其对于低难度标志点定位的准确率高于DL 模型。Gil 等同样构建出了基于CNN的正位片的自动定点模型。研究者收集来自韩国9所大学医院的共计2 075张不同质量头颅正位片作为训练数据集、343张作为验证数据集和99 张作为测试数据集,结果显示该模型自动定点的绝对误差仅为1.52 mm,总体成功率为83.3%。
    2.基于深度学习的自动诊断分析
    无论是基于头颅侧位片还是正位片的头影测量,其目的都是将基于X 线的图像信息转化为数据,以判断患者在矢状向、垂直向、横向的颅颌面关系,得出相应诊断结果、提出治疗计划和评估治疗效果。近些年来,不少研究将DL的范畴进一步推进至自动定点后的诊断分析,实现基于头颅正侧位片的“一步式”诊断。Yu 等以CNN 的方法,利用5 890 张头颅侧位片、对应患者基本信息和专家的具体诊断建立了骨型分类诊断系统,该模型实现了对垂直向(高角、正常、低角)和矢状向(骨性Ⅰ类、Ⅱ类、Ⅲ类)一步式自动诊断,其诊断结果具有90%以上的敏感性、特异性和准确性。
    Yim 等则利用CNN 进一步实现了对正常覆、开、深覆的诊断。该研究以1 993张来自2所不同医院的头颅侧位片为训练数据集,以181张来自于其他8所不同医院的头颅侧位片为测试数据集构建并测试CNN,结果显示,该模型在高角/低角/正常(88.2%),骨性Ⅰ/Ⅱ/Ⅲ类(88.8%),深覆/正常覆/开(83.7%)的判断上均取得了较为满意的准确率。Lee 等的研究则聚焦于利用CNN 模型实现对患者是否需要正颌手术的自动判断。作者收集了333例患者资料,其中159例患者仅接受了正畸治疗,174例患者接受了正畸正颌联合治疗。
    研究者以侧位片上50 个解剖标志点为参照,分别使用基于CNN 的Alexnet、MobileNet 和Resnet50 三种不同程序构建自动诊断模型,判断患者是否需要联合正颌手术,3 种模型分别实现了96.4%、95.4%、95.6%的预测准确率。Shin 等则进一步将头颅侧位片和正位片相结合来训练CNN 模型,综合判断患者是否需要联合正颌外科手术,该模型预测准确率达到95.4%,敏感性和特异性分别达到84.4%、99.3%。
    3.基于深度学习的腺样体肥大自动诊断和气道分析
    腺样体位于鼻咽部顶部与咽后壁处,是咽淋巴环的一部分。生理情况下,腺样体在6岁时开始萎缩,10岁时完全消失。然而,频繁的上呼吸道感染可导致腺样体病理性肥大。儿童和青少年腺样体肥大的患病率高达42%~70%,是儿童上呼吸道阻塞和阻塞性睡眠呼吸暂停最常见的原因之一。
    近年来已有研究证明,侧位片在诊断腺样体肥大方面具有较高的准确性。Zhao 等收集901张6~12岁儿童的头颅侧位片,在头颅侧位片上确定4个腺样体相关的解剖标记点,通过计算腺样体大小与鼻咽间隙大小之比来判定患者是否存在腺样体肥大,建立了一种基于CNN 的腺样体肥大自动分析诊断模型。该模型对腺样体肥大的自动诊断具有较高的敏感性(90.6%)、特异性(93.8%)和准确率(91.9%)。
    Shen等利用688例患者的头颅侧位片,构建了基于CNN 的腺样体肥大自动诊断模型,其准确率高达95.6%。Liu 等建立了一种以DL 为基础的VGG-Lite 腺样体肥大自动诊断模型,该模型对于侧位片的分析仅需4.2 s,且具有较高的敏感性(89.8%)和特异性(88.2%)。Yao等通过2个不同类别训练数据集对CNN模型的训练,首次实现了在自动评估腺样体肥大程度的同时自动标记和分割侧位片中的气道部分。
    4.基于深度学习的颈椎成熟度自动分析
    颈椎成熟度(cervical vertebra maturation,CVM)分析法是基于第二(C2)、第三(C3)和第四(C4)颈椎的形态来判定颌骨生长潜力的一种方式,由6个阶段组成,即颈椎成熟期1~6(cervical vertebra stage 1~6,CVS 1~6)。C2、C3、C4 在头颅侧位片中清晰可见,以CVM 分析法确定患者骨龄可以避免额外的X 线辐射,已被证明具有很高的准确性和可重复性,目前广泛应用于正畸临床过程中。
    Makaremi 等开发出一种能够通过头颅侧位片自动判定患者CSV1~6 的DL 模型。研究者以经过专家标记的300 张侧位片作为训练数据集,200 张作为验证数据集,150 张作为测试数据集构建该模型。在训练和验证过程中,该模型实现了95%的准确率,但在测试数据集中,其准确率降为85%。此外,Kim等利用CNN构建CVS自动分类模型,共计600张使用头颅侧位片,CVS每期仅100张,总体准确率仅为62.5%。
    Seo 等利用来自于6~19岁患者的头颅侧位片构建了6种基于CNN的自动分类模型,每种模型的准确率均达到了90%以上,其中Inception-ResNet-v2 模型的准确率高达94.1%。Zhou等利用CNN实现了CVM自动定点和CVS分类,该系统对头颅侧位片C2、C3、C4的标记点的自动识别实现了较高的准确率。系统与检测者之间的误差仅为0.36 mm,低于检测者之间的误差(0.48 mm),而对于CVS 分期的判定准确率高达71%。
    5.小结
    目前各类DL算法在头颅侧位片自动定点方面的研究已较为成熟,其定点准确率多已达到80%以上,且与金标准之间的差异大都在临床可接受范围内。当前相关研究多聚焦于通过不同来源的大样本来提高DL的稳定性和普适性。然而,针对正位片测量、定点后的诊断分析、治疗计划、效果评判等的研究相对较少,采用DL实现自动骨龄判断、气道分析、腺样体肥大诊断等的研究也较为局限。后期研究应在进一步开拓研究范围、提升算法的同时注意数据集的丰富程度,并将DL技术与其他AI 技术适当结合,从而进一步提高算法的准确性、稳定性和普适性。

编辑: 陆美凤

网友评论