Carvana Image Masking Challenge on Kaggle
车辆边界识别与车辆分割的解决方案.9th place (top 1.2%) on Public Leaderboard
31th place (top 4.2%) on Private Leaderboard
团队成员:Chia-Hao Hsieh 和 Shao-Wen Lai
1. 竞赛问题
自动从图片中移除背景,精确分割出车辆及其边界.
2. 数据
- 训练数据
- 测试数据
- 张测试图片
3. 评估 Evaluation
采用平均 Dice 相关系数(mean Dice coefficient) 作为评估标准.
Dice 相关系数用于对比预测分割结果和其对应的 groundtruth 分割标注间的像素级一致性.
${\frac{2 * |X \cap Y|}{|X| + |Y|}}$
其中,X 是预测的像素集,Y 是 groundtruth 标注像素值.
如果 X 和 Y 都是空集,则 Dice 相关系数设为 1.
4. 解决方案
该解决方案采用了 U-Net 模型的 5 个改进版本的集成. 模型采用 1280x1280 尺寸作为输入图片尺寸.
损失函数采用 Soft Dice Loss 和二值交叉熵(Binary Cross Entropy Loss).
网络训练时,数据增强包括,翻转(flipping),平移(shifting),缩放(scaling),HSV 颜色增强(color augmentation) 和 fancy PCA.
单台 P5000 GPU 的机器,训练单个模型大概耗时 60-80 小时;测试耗时约 6-8 小时.
4.1 最佳表现的单模型
4.2 结果
最佳的模型集成得到的结果为:
- 0.997191 mean Dice coefficient on Private Leaderboard
- 0.996899 mean Dice coefficient on Public Leaderboard.
最佳单模型的结果示例: