北京玩星汇聚科技有限公司 - 爱分割-aisegment.com 所高质量标注并开源的一份人像抠图(matting) 数据集.
该数据集为目前已知最大的人像matting数据集,包含 34427 张图像和对应的matting结果图. 数据集中的原始图片来源于Flickr、百度、淘宝. 基于该数据集所训练的人像软分割模型已商用.
Github - aisegmentcn/matting_human_datasets
公司官网:www.aisegment.com ,可体验语义分割效果.
1. 数据集下载
数据集分享在百度网盘(国内):
链接:https://pan.baidu.com/s/1R9PJJRT-KjSxh-2-3wCGxQ
提取码:dzsn
MEGA(国外):
数据集文件为:matting_human_half.zip
,解压后其目录结构为:
- matting_human_half/
- clip_img #人像图片(半身),.jpg 格式
- matting #人像标注,.png 格式
2. 数据集示例
该数据集中,图片是经过人脸检测和区域裁剪后生成了600x800的半身人像. 标注的人像 matting 图片为 png 格式,可以从 png 图片中提取人像的 alpha 图.
如:
#!/usr/bin/python3
#!--*-- coding:utf-8 --*--
import cv2
import matplotlib.pyplot as plt
png = cv2.imread('/path/to/matting/matting_xxx.png', cv2.IMREAD_UNCHANGED)
print(png.shape)
#(800, 600, 4)
png_img = cv2.cvtColor(png[:,:,:3], cv2.COLOR_BGR2RGB)
alpha = png[:,:,3]
plt.figure(figsize=(10, 8))
plt.subplot(1, 2, 1)
plt.imshow(png_img)
plt.title("Matting PNG img")
plt.axis("off")
plt.subplot(1, 2, 2)
plt.imshow(alpha)
plt.title("Matting Alpha img")
plt.axis("off")
plt.show()
3. 数据集截图
3.1. 人像图片 JPG 图片
3.2. 人像标注 PNG 图片
4. 更多
与阿里云市场联合推出的人像分割开放接口拥有数百家客户,每天处理数十万张照片,积累了海量的数据.
如果需要更多训练数据,可以与 aisegment 联系.