职场文秘网

首页 > 心得体会 > 学习材料 / 正文

超声心动图质量对左心室内膜勾画质量的影响研究

2023-01-16 13:25:06

刘未央,张培芳,高雨霏,陈 煦,林锡祥,杨菲菲,汪安安,何昆仑

1 北京安德医智科技有限公司,北京 101300;
2 医疗大数据应用技术国家工程研究中心,北京 100853;
3 解放军总医院医学创新研究部 医学大数据研究中心,北京 100853;
4 解放军总医院第四医学中心 心内科,北京 100048

超声心动图是诊断心脏结构和功能的一线影像学手段,在临床应用广泛。但由于超声心动图需要手工测量,参数众多,人力不足[1-8]。近年来人工智能技术,特别是深度学习神经网络,被广泛应用于超声心动图智能识别领域,包括心腔结构的自动分割、心脏参数的自动获取以及心脏疾病的自动诊断,大大提高了超声心动图的诊断效率,临床应用前景可观[1-3,6-7]。研发自动识别超声心动图特征的AI模型时,需要超声医生对大量超声心动图影像进行精确和分割轮廓勾画,AI通过学习的准确率可以达到三甲医院高年资超声医生水平。然而,AI模型的性能主要受超声图像勾画质量的制约,直接影响AI模型在临床实践中的成败。目前未看到针对超声心动图心腔勾画质量的相关研究,尤其是勾画质量定量分析的研究[1,3,6,8]。本文通过研究超声心动图影像的左心室内膜分割勾画质量,并对对勾画质量进行客观、精确的定量评估,分析图像质量对勾画质量的影响以及医学影像分析师再培训对勾画质量的影响,并提出控制“人为差异”的质控方法,为类似超声心动图AI研究提供参考。

1研究对象 从解放军总医院病例库中随机选取2021年6 - 8月442例患者的超声心动图心尖二腔(apical 2-chamber,A2C)和心尖四腔切面(apical 4-chamber,A4C)影像(包含Phillips等多机型)。442例患者的影像资料不包括年龄和性别信息。为了粗略估计他们的性别和年龄分布,课题组选取2021年10 - 12月超声心动图病例库的分布[总共3 753例,男性2 059例,占54.86%,女性1 694例,占45.14%,中位年龄60岁(1 ~ 100岁)]作为参考。

2超声影像评价人员分组 课题组选取3名三甲医院高年资超声心动图医生。第一名是副主任技师,有18年超声心动图临床经验;
第二名是技师,有12年超声心动图临床经验;
第三名是主治医师,有12年超声心动图临床经验。课题组同时选取4名被解放军医学院聘用的医学影像分析师(女性)。她们主要分析X线片和CT成像以及磁共振和超声心动图影像,在影像分析领域有至少3年以上工作经验,具备基础医学知识,在标注任务之前进行了3个月的超声心动图专业培训。

3数据集构建 如图1所示,由三甲医院高年资超声医生把原始超声图像根据质量分成三个等级(好、中、差)。分级标准:左心室内膜边缘显示完整,图像对比度好,无明显伪影,评为“好”;
左心室内膜边缘显示严重缺失,噪声大,有明显伪影,评为“差”;
介于“好”与“差”之间的图像,评为“中”。图像质量标签的建立过程:高年资医生用LabelMe软件打开一个超声心动图A2C或者A4C切面视频,通常含3个完整心动周期,约100帧图像;
高年资医生根据经验找出拥有最高质量的一个心动周期影像,给这段影像一个质量标签(好、中、差)。

图1 好、中、差三个等级图像质量的原始图像和双轮廓勾画图像对比范例图Fig.1 Example diagram of comparison between original image and double contour sketch image with good, medium and bad quality

4轮廓勾画参考标准 超声心动影像的人工勾画质量除了受超声图像质量影响,还与医学影像分析师对超声心动图的认知、经验等密切相关。对于左心室内膜的轮廓勾画,目前没有统一的标准。因此,为了研究医学影像分析师轮廓勾画水平的量化方法,请3名三甲医院高年资超声心动高年资医生分别对每组超声心动图数据的A2C和A4C切面视频进行轮廓勾画,包括选取舒张末和收缩末期相,对相应期相的超声图像勾画左心室内膜。每例轮廓勾画由另外2名高年资医生(非轮廓勾画高年资医生)审核,当2名审核高年资医生一致同意时该轮廓勾画数据成为参考标准;
当2名审核高年资医生的意见不一致时,由1名更高年资的仲裁高年资医生面对面共同讨论决定,最后形成轮廓勾画参考标准。他们标注全部442例影像数据集。医学影像分析师的左心室内膜勾画质量将以此参考标准为基准进行评估。

5勾 画 质 量 评 估 指 标 在AI分 割 任 务 中,Dice值通常用来衡量AI模型与参考标准的差异,同理也可以用来衡量人工轮廓勾画与轮廓参考标准的差异,是描述轮廓相似度的一种指标[9]。Dice值定义如下:其中A代表人工轮廓勾画左心室内膜轮廓内的面积,B代表参考标准左心室内膜轮廓内的面积。Dice值代表两个轮廓的重合度,Dice值越高,勾画质量越高,Dice值最大值为1。

6左 心 室 射 血 分 数(left ventricular ejection fraction,LVEF)计算方法 LVEF是超声医生用来诊断心脏疾病和评价心脏功能的关键指标之一,基于二维超声心动图计算LVEF的最准确方法是双平面辛普森(Simpson)法[3,8,10]。超声医生需要对相应切面视频通过目测找出舒张末和收缩末图像,手动描记左心室内膜轮廓,根据双平面辛普森法计算舒张末容积(EDV)和收缩末容积(ESV)[3,11-14],如下公式所示:

其中n代表左心室横截线的个数(如取值20),ai代表A4C切面左心室横径长度,bi代表A2C切面左心室横径长度,L代表A4C切面左心室纵径长度。我们可以通过左心室内膜的人工轮廓勾画来计算LVEF,并用医学影像分析师的轮廓勾画生成的EF(即LVEF)与参考标准轮廓勾画生成的EF的误差来衡量医学影像分析师勾画质量[15]。

7培训过程 A2C切面和A4C切面的左心室内膜轮廓勾画培训过程如下。首先,由三甲医院高年资超声医生讲述如何识别左心室二尖瓣的打开和关闭、乳头肌、腱索和正常心肌,然后勾画左心室内膜轮廓。医学影像分析师按照高年资医生的讲解对左心室内膜进行勾画,在LabelMe软件中,从左心室内膜边缘的瓣根部出发,运用鼠标沿顺时针依次勾画内膜边缘点,直到最后一个点与第一个点重合,形成闭合的左心室内膜轮廓。高年资医生对医学影像分析师的勾画结果进行逐一审核并指出问题,提升医学影像分析师的勾画准确性。第一次培训,高年资医生指导医学影像分析师勾画100例数据,学习并分析勾画差异的原因,这个过程持续两个星期,考核合格后医学影像分析师开始第一次勾画测试(442例数据),形成的轮廓勾画数据称为“第一次标注”。针对其中存在的共性和普遍问题,进行第二次培训。高年资医生继续指导医学影像分析师分析另外100例数据,过程持续两个星期,考核合格后进行第二次勾画测试(442例数据)。在两次培训后考核医学影像分析师勾画图片计算出来的EF值与高年资医生轮廓勾画图片计算出来的EF值的接近程度。每名医学影像分析师在“第一次标注”的图像质量分布和“第二次标注”的图像质量分布是一致的。培训流程如图2所示。

图2 勾画质量控制流程(标注人员为医学影像分析师,标注数据为超声心动图影像)Fig.2 Flow chart of contour delineation quality control process(Labeling people are medical imaging analysts, and labeled data are the echocardiographic images)

8分析指标 1)考察图像质量(好、中、差)对医学影像分析师勾画质量的影响。2)考察医学影像分析师的再培训对其勾画质量的影响。

9统计学方法 将所有医学影像分析师经过两次培训后的舒张末(ED)轮廓勾画与参考标准相比,并且按照3个图像质量评级(好、中、差)分别进行统计,计量数据以Md(IQR)、最大值和最小值表示。

1超声图像质量对医学影像分析师勾画质量的影响 如图3所示,经过第二次培训后,总共有404例患者的影像被医学影像分析师标注,图像质量分布“好”45例、“中”158例、“差”201例。舒张末Dice中位数随着图像质量降低而显著降低,“好”图像质量对应的Dice中位数为0.941,“中”为0.936,“差”为0.928。随着图像质量按照好、中、差降低,舒张末Dice值的四分位距越来越大,“好”对应的四分位距为0.022,“中”为0.039,“差”为0.040。医学影像分析师经过两次培训后的收缩末(ES)轮廓勾画轮廓与参考标准相比随着图像质量降低并不呈正比例降低,“好”图像质量对应的Dice中位数为0.918,“中”为0.92,“差”为0.902,而且收缩末Dice中位数显著低于舒张末Dice中位数。随着图像质量(好、中、差)降低,收缩末Dice值的变化幅度也不呈比例变化,“好”对应的四分位数为0.059,“中”为0.048,“差”为0.062。提示了对于收缩末期,高级医生与医学影像分析师勾画的差异与图像质量无关。

图3 与参考高年资超声医师相比,医学影像分析师两次培训后在好、中、差图像上勾画左心室内膜轮廓4的Dice值的箱形图。(a)表示舒张末期相的Dice值,(b)表示收缩末期相的Dice值Fig.3 Boxplots of Dice coefficients between labelers and experienced sonographer for left ventricular endocardial border length delineation by image quality at end-diastole (a) and end-systole (b) after the two training sessions

2医学影像分析师再培训对勾画质量的影响 如图4所示,所有箱形图的纵坐标轴表示EF差值(轮廓勾画所得的EF值-参考标准EF值,用∆EF表示),其下限和上限被设定为-70%和30%,4名医学影像分析师以a、b、c、d表示。第一次培训后,a标记样本为81个,b标记样本为82个,c标记样本为81个,d标记样本为106个。第二次培训后,a标记样本为139个,b标记样本数量为72个,c标记样本为51个,d标记样本为58个。每名医学影像分析师标记样本中“好”、“中”和“差”分布趋势一致。由第一行箱形图可见,第一次培训后4名医学影像分析师的∆EF中位数分别为-6.488%、-10.106%、-7.772%、-6.702%;
由第二行箱形图可见,第二次培训后4名医学影像分析师的∆EF中位数分别为0.423%、-4.403%、-4.208%、-0.686%,更加接近理想的零值。由此可见,第二次培训提升了所有4名医学影像分析师的∆EF中位数,其中3名提升大约6%,1名提升3.6%。在∆EF四分位差方面,第一次培训后4名医学影像分析师分别达到14.542%、15.796%、17.489%、15.486%,第二次培训后分别达到10.277%、12.245%、11.12%、7.562%。由此可见,第二次培训缩小了所有4名医学影像分析师的∆EF四分位差,分别为4.3%、3.6%、6.4%、7.9%。

图4 四名医学影像分析师在第一次(上)和第二次(下)培训后轮廓勾画所得的EF值与参考标准EF值的差值箱形图。每列对应一名医学影像分析师,以a、b、c、d表示Fig.4 Ejection fraction (EF) difference between labelers and reference for four different labelers, and the first row indicates contour delineation quality after the first training and the second row indicates contour delineation quality after the second training. Each column corresponds to one labeler, denoted by medical imaging analyst a, medical imaging analyst b, medical imaging analyst c, and medical imaging analyst d

3不同超声图像质量的轮廓勾画范例 如图5所示,a组(好)图像对比度高,边缘清晰,医学影像分析师的两次勾画轮廓与参考标准轮廓无明显差异。b组(中)图像有明显的晃动伪影,且左心室内膜显示不完整,医学影像分析师第一次勾画轮廓与参考标准差异大,而第二次勾画轮廓与参考标准差异明显缩小。c组(差)图像左心室内膜模糊不清,显示不完整,且有更加明显的伪影,医学影像分析师的第一次勾画轮廓与参考标准差异很大,虽然第二次勾画轮廓更加接近参考标准,但差异依然偏大。

图5 医学影像分析师好、中、差图像质量分级的轮廓勾画示例:原始(左上)、参考标准(右上)、第一次培训后轮廓勾画(左下)、第二次培训后轮廓勾画(右下)A:“好”图像质量的轮廓勾画范例(收缩末);
B:“中”图像质量的轮廓勾画范例(收缩末);
C:“差”图像质量的轮廓勾画范例(舒张末)Fig.5 Examples of labeled data with different image quality: original (top left), the reference contour delineation by experienced doctors (top right), the post-first-training contour delineation (bottom left), and the post-second-training contour delineation (bottom right)A: contour delineation example of "good" image quality (end systole); B: contour delineation example of "medium" image quality (end systole); C: contour delineation example of "bad" image quality (end diastolic)

本研究首次通过多维度对比研究,定量评价了图像质量对勾画质量的影响,定量评估了针对性的轮廓勾画再培训后医学影像分析师的勾画质量提升效果。对于图像质量对勾画质量的影响,图像质量越好,舒张末Dice值的中位数和四分位数间距越好。然而,收缩末Dice值不同于舒张末Dice值,收缩末Dice值较舒张末Dice值明显偏低,收缩末Dice值对于“好”图像质量和“中”图像质量没有显著区别。

本研究发现,舒张末左心室内膜轮廓由于心肌组织较为松驰,超声图像的心肌心腔对比度下降,医学影像分析师对内膜轮廓的判断受图像质量的影响明显;
加之舒张末左心室面积最大,即使小的轮廓误判也会造成左心室面积的绝对值有明显的改变(导致Dice值的明显改变),因而导致舒张末Dice值对图像质量很敏感。相反,收缩末心肌组织较为密集,超声图像的心肌心腔对比度偏高,“好”和“中”的图像质量在收缩末趋同,只有“差”的图像才会导致医学影像分析师对收缩末内膜轮廓的明显误判。同时,收缩末Dice中位数较舒张末Dice中位数偏低的原因是医学影像分析师对收缩末内膜轮廓的判断出现了系统性的偏差,普遍比参考标准偏小。

在研究医学影像分析师轮廓勾画再培训对勾画质量的影响过程中,我们有3个发现:1)医学影像分析师的∆EF普遍为负值,说明医学影像分析师的EF值普遍较高年资医生的参考标准偏低,此为系统性偏差;
2)轮廓勾画再培训提升了4名医学影像分析师与参考标准的∆EF,其中位数提升3.5% ~ 6.0%,其四分位数间距提升3.5% ~ 7.9%;
3)轮廓勾画再培训对4名医学影像分析师的提升效果各不相同,医学影像分析师(d)的提升效果最显著(∆EF中位数提升6%,∆EF四分位数间距提升7.9%)。

我们发现,医学影像分析师在培训的两个月轮廓勾画水平进步迅速,但培训过后继续更多的训练,轮廓勾画水平提升缓慢。根据Yang等[1,7,15-16]研究,深度学习模型训练中依赖大量的标签化数据,这就需要花费大量时间进行轮廓勾画,且如果数据有限或算法复杂,则可能会过度拟合,导致预测偏差。

图像质量差的超声心动图往往是由于患者病情复杂、患者特殊身体条件、采图医生操作技能、采图探头和超声信号处理算法的局限性等造成的。这些质量偏差的超声心动图在临床上占比偏大,所以不能从本研究中排除[17-18]。如何获得这些超声心动图勾画的参考标准是超声心动图AI研究的难点之一。超声心动图AI产品的临床价值在于,通过学习三甲医院高年资超声医生对超声心动图的判读,从而达到高年资超声医生的水平,将超声医生从繁重的重复性工作中解脱出来,大大提高临床效率,解决普遍存在的人为差异大的问题。所以本研究中采用了3名高年资超声医生对左心室内膜的一致轮廓勾画为参考标准,是课题组在权衡各种条件限制后找到的最优方案。

本研究存在一定的局限性。首先,对于人眼观察来判断三个图像质量分级(好、中、差),这种主观性判断不够科学、精确。未来课题组还将定义多个图像质量鉴别标签,研究多维度、定量化地表达超声图像质量等级,从而更加科学地提高医学影像分析师的勾画质量,研发超声影像质量领域的AI算法。课题组还将针对不同厂家设备和不同机型的超声图像进行轮廓勾画的质量评价。根据Yang等[7]研究,在数据采集方面,不同疾病超声图像采集的切面和数目不同,视频长度也有差异,因此建立标准化的超声心动图图像采集流程至关重要。在准确的超声心动图轮廓勾画数据集的基础上,课题组将研究心腔轮廓分割AI模型[5-7],进而还有针对多种任务的模型,包括图像质量分类模型、切面快速识别模型、心脏疾病鉴别诊断模型等。

本研究花费最少时间、投入最小成本,考察了图像质量对超声医生勾画质量的影响;
课题组能够快速得知医学影像分析师的培训效率。我们把图像质量分类为好、中、差三个档次分别进行轮廓勾画评估,医生在短时间内就完成了442例样本的质量分类。在接下来的培训流程设计中,应更加有效地培训尽可能多的医学影像分析师,为判断超声轮廓勾画医生数量的需求和培训程序的进一步优化提供了理论指导。

利益冲突:作者没有利益冲突需要声明。

猜你喜欢 年资勾画心动图 情景模拟教学法在老年科低年资护士带教中的应用中国高等医学教育(2022年7期)2022-10-16对比增强超声肝脏影像报告及数据管理系统对肝脏局灶性病变的一致性研究影像研究与医学应用(2022年12期)2022-07-18王新房:中国超声心动图之父疯狂英语·初中天地(2022年2期)2022-07-07心电图与超声心动图在高血压性心脏病诊断中的临床意义中国典型病例大全(2022年11期)2022-05-13超声心动图评价二尖瓣置换术后瓣膜功能的临床应用中国医药科学(2022年5期)2022-05-05放疗中CT管电流值对放疗胸部患者勾画靶区的影响现代仪器与医疗(2021年6期)2022-01-18不同年资护士职业倦怠状况调查分析健康护理(2021年5期)2021-09-10某三甲医院ICU护士对2016年脓毒症与脓毒性休克处理国际指南认知情况的调查分析中西医结合心血管病电子杂志(2019年9期)2019-05-28观虎跳峡东坡赤壁诗词(2019年1期)2019-04-30找一找小学生导刊(低年级)(2016年6期)2016-07-02

Tags: 质量   内膜   勾画  

搜索
网站分类
标签列表