斯坦福大学提出:影响 MRI中语义分割的因素思考(含网络架构,训练损失函数和训练数据特征)
- 2019 年 12 月 31 日
- 筆記
前戏
【导读】今天分享一篇斯坦福大学刚出的论文,本文量化了磁共振成像中与CNN分割性能相关的三个因素的影响:网络架构,训练损失函数和训练数据特征。
注:本文背景虽然是医学图像,但实际应用可以扩展到图像分割的任何领域。论文中所讨论的 U-Net、SegNet和 DeepLabv3+三个网络结构都是常见通用的算法。
正文
《Technical Considerations for Semantic Segmentation in MRI using Convolutional Neural Networks》

arXiv: https://arxiv.org/abs/1902.01977
github:None
作者团队:斯坦福大学
注:2019年02月07日出的paper
Abstract:磁共振 volumes 的高保真语义分割对于估计临床和研究应用中的组织形态测量和 relaxation 参数是至关重要的。虽然手动分割被认为是黄金标准,但深度学习和卷积神经网络(CNN)的最新进展已经显示出有效的软组织自动分割的希望。然而,由于深度学习的随机性和训练网络中的大量超参数,预测网络行为具有挑战性。在本文中,我们量化了与CNN分割性能相关的三个因素的影响:网络架构,训练损失函数和训练数据特征。 我们评估这些变化对股骨软骨分割的影响,并提出对CNN架构和训练方法的修改,以便有效地训练这些模型。
网络结构
(A) U-Net
(B) SegNet
(C) DeepLabV3+

Three encoder-decoder fully convolutional network architectures

Volumetric 结构
在这个实验中,我们训练了2D、2.5D 和3D U-Net 网络结构用于股骨软骨分割。
损失函数
论文在类别不平衡的情况下选择了常用于分割的四种损失函数用于比较:
- general cross-entropy losses
- soft Dice loss
- weighted cross-entropy (WCE)
- focal loss (γ=3)
数据预处理和数据增广
详见论文
实验结果
网络结构比较

下图显示了样本切片上U-Net,SegNet和DeeplabV3 + 网络结构的性能比较。所有三种基本结构在包含厚软骨结构的切片中保持高保真度(下图A)。 然而,所有网络在包含全层软骨损失和剥去软骨下骨,边缘切片和内侧 – 外侧过渡区域的切片中具有更差的性能(下图B,C)。 尽管这些区域的准确度较低,但这些网络准确地分割了具有由病理学引起的异质信号和具有相似信号的解剖结构接近的切片(下图3C)。

Sample segmentations from three FCN architectures (U-Net, SegNet, DeeplabV3+) with true-positive (green), false-positive (blue), and false-negative (red) overlays
Volumetric 结构比较

Performance bar graphs and depth-wise region of interest distribution
损失函数比较

A summary of performances of networks trained on (A) binary cross-entropy (BCE), (B) soft Dice, (C) weighted cross-entropy (WCE), and (D) focal losses
数据增广对比和FOV Generalizability对比
详见原论文
注:论文实验对比很全面,实验结果和相关调参、训练技巧和结论可以扩展到图像分割的任何领域。