基于注意力机制的骨龄评估方法

2022-06-09 06:59:25   文档大全网     [ 字体: ] [ 阅读: ]

#文档大全网# 导语】以下是®文档大全网的小编为您整理的《基于注意力机制的骨龄评估方法》,欢迎阅读!
骨龄,注意力,评估,基于,机制
基于注意力机制的骨龄评估方法

作者:李 熊科宇 姚其超

来源:《中国新通信 2018年第23



一、骨龄评估方法现状

1.1 现状

目前的骨龄预测主要依靠医生对于X 光照片的人工解读,凭借骨骼生长的惯有规律进行分析,属于统计学和人工经验应用。对于生长环境及年龄不同的人来说,存在一定的误差。2008 年发布的《中国人手腕骨发育标准- 中华05》被广泛接受,并提出了诸如RC 图谱法的新方法。

1.2 计数法

计数法是通过观察单个或多个部位继发骨化中心出现的时间等特征来人为估计骨龄的一种方法。上个世纪五十年代左右刘惠芳、顾光宁等先后报道了我国儿童的骨化中心出现和干- 闭合的年龄, 并提出了我国儿童骨龄计数法的标准。[1] 因为这种系统误差较大,如今已很少被使用。

1.3 图谱法

图谱法是将目标X 光片与标准照片进行比对的方法,制作标准片需要找出相同人群在相同骨龄下的共有特征。历史上比较著名的图谱有G-P 图谱、顾氏图谱等,通过对于不同标准图谱的比较可以发现大洲间乃至于国家间人民骨骼发育情况的差异。

1.4 计分法

计分法是将手腕骨骼的发育过程进行分级,对不同骨骼进行评分相加得到总分,最后依据各个年龄的骨成熟度得分中位数曲线得出评估结果。

二、机器学习与注意力机制的基本原理

2.1 深度学习的基本概念

深度学习是人工智能领域一项具有革命性的研究成果,深度学习专注于研究计算机模拟人类的学习行为,通过模拟来学习新的知识,不断改善自己的知识结构和自身性能。深度学习基础在于对于人工神经网络研究,尝试模拟人类大脑皮层以及神经对于信息的处理方式,通过训练对信息赋予不同的权值,将原始信息从低级到高级进行分类,使计算机得以处理并提取有用信息。目前,深度学习是人类现有最接近人脑思考方式的方法,被誉为2013 年突破性技术之首。

2. 2 全卷积网络FCN

20 世纪六十年代,Hubel Wiesel 通过研究猫的大脑皮层上局部敏感和方向选择的神经元时发现了独特的神经网络结构可以降低反馈神经网络的复杂度,于是提出了卷积神经网络概念。卷积神经网络是一种端对端的学习模型,将参数通过梯度下降的方法进行训练。相比于传统的给出参数特征进行学习的方法,CNN 可以通过学习自动寻找到特征,降低出现过拟合的可能性。目前CNN 作为神经网络的一个重要分支,被广泛运用于图像识别。




卷积神经网络一般由输入层、卷积层、池化层、全连接层、输出层组成。通常,一个CNN 神经网络会在卷积层后连接若干个全连接层。如上图,最后会将卷积层产生的特征图映射成一个有特定长度的代表特征的向量。经典的CNN 结构AlexNet 会期望得到输入图像的一个数值描述,从而得到目标的特征。这些特征往往对事物的大小等因素依赖较低,有助于提高准确率。

而在2015 年由Jonathan Long 提出的全卷积网络图片的每一个像素进行分类,相比于CNN 得到的固定长度的特征向量,FCN 可以支持任意尺寸的图像,通过反卷积层使其恢复到和原图像相同的尺寸。每一个像素都会产生预测提高了准确度。

2.3 注意力机制

注意力机制是深度学习下的分支,依赖于神经网络,目前被光分运用于自然语言处理翻译、图像识别、语音识别等各种任务,属于深度学习的核心技术之一。在图像识别领域,注意力机制模拟了人类在观察事物时习惯于通过主要特性对目标做出判断。

人类视觉会通过快速扫描全局图像分析得到需要重点关注的区域,一般也叫做注意力焦点,从而对此投入更多注意力,过滤掉无用信息。注意力机制被巧妙地运用到深度学习上,计算机通过对于目标图像的训练,可以自动找到需要关注的焦点,完成图像识别的任务。

三、骨龄评估方法建模应用

3.1 注意力机制选用的原因

我们注意到传统的骨龄评估方法主要在于利用X 光片的显著特征与标准片比较,下图一的关键部位和图三的深度学习结果基本吻合。图三的不同颜色区域代表了计算机对不同区域的权重值不同,暖色调的颜色代表较高的权值。正是因为这个特性,注意力机制可以很好地代替肉眼估测。并且在计算机的高算力下,可以达到小时内处理上万张样图。

注意力机制可以自动寻找到焦点位置,因此非常适合替代通过人为图像比对估计得出结果。

3.2 具体应用

我们收集了手部X 光片共计12000 张,由于数据量较大,我们降低了图片的分辨率通过jpg 格式保存。每张照片都记录了对应的真实骨龄。经过简单的数据统计,得下下图的结果,每张照片的骨龄以月份的形式表示。

学习的时候, 我们导入了Keras 库提供的预训练VGG16 模型,VGG16 是一种基础的神网络模型。在完成预训练后,我们在VGG16 网络的基础上构建局部卷积网络,在最后的输出层,我们使用GAP 模型二维池化。由于数据量非常大,最后我们将图片分批加载到内存进行模型的完善。注意力模型由于可以让计算机自行寻找图像特征,我们在调参后只需要等待计算机的运行。

最后的预测结果如下,FCN 可以忽略输入图像大小,最后会自动转换得到特征向量,在图片的不同位置的特征都可以被捕获到。可以看出,预测的结果和原骨龄较为符合。我们使用9000 图片进行训练,3000 图片进行预测后,发现偏差在30% 左右。

四、关于骨龄评估模型可优化性通过这样的方式评估骨龄存在一定的系统误差,本次图片识别采用的是低分辨率的图片,并且测试人的地区分布广泛。如果可以从提高图像清晰度、分人种地区进行训练、优化模型等方面进行调优,相信准确度会有一定提高。




我们认为,在实际应用的过程中,如果可以在不同地区分别进行建模预测,注意力模型将得到更好的效果。

五、结语

本文仅通过对高级神经网络计算机图像识别上的应用作出初步探索,一定程度上说明了注意力模型在医学图像识别上的成效。同时,还有诸如UNET 等算法也在医学上取得不菲的影响。骨龄识别的准确性也存在很多方面可以提高。我们希望医学可以跟紧大数据时代的潮流,利用图像识别、决策树等方法对病症诊断以及发展预测起到辅助作用。如果医疗数据可以在保证隐私的情况下建立多地的共享平台,积极允许第三方专业公司的投入,相信行业会有很大改观。


本文来源:https://www.wddqxz.cn/37c3e0615bfafab069dc5022aaea998fcc2240bd.html

相关推荐