中国浦东“互联网+”大会日前在上海召开.
会议上,本周新站点的采访对象——宝尊TIC创新实验室技术总监郑叔亮先生,向大家揭露了‘图像分析算法’等AI赋能品牌服务的有趣例子.
1. 服装图像检测算法
对图像库中涉及服装部分的图像进行统计和分析,使用深度学习中的卷积神经网络(一种深度前馈人工神经网络可以进行大型图像处理)方法训练上装、下装、全身服装的检测模型;
当每次输入新的图片时,服务器通过检测模型,输出可能的服装类型并最终实现定位服装位置.
在每个卷积层中,看似由许多个二维图片叠在一起的数据都是以三维形式存在的. 每一组可称为是feature map(特征映射). 彩色图片输入层后,层与层之间或有若干卷积核,上一层与每个feature map(特征映射)每个卷积核做卷积,从而产生下一层的feature map(特征映射).
这个过程中经历了不断地重塑、softmax函数运算和修整等等处理,最后再进行新的铆接整合,得出对图像的检测结论,有了数据的采集.
需要注意的是:
[1] - 如何区分模特图与平铺图;
[2] - 如何判断模特图中,人体部位对属性区分的影响;
[3] - 多标签的分类也是个难点,也是考验其精准度的体现.
服装检测算法结果:
2. 相似服装推荐算法
根据前述服装检测算法的输出结果,对每件服装进行各类特征的分析和其特有的属性检测. 并以此为依据,依次建立服装的特征库(比如面料、廓形、色彩、流行趋势等等细分到各类细节). 由此,每次输入服装图片时,服务器都能在服装特征库中搜索出最相近的服装. 随后,找到包含这些服装的图片,将最符合的图片推荐给有需求的用户.
输入彩色影像图片后,开始一个复杂的高级特征对比过程,(卷积过滤继而开始局部对比那些标准和样本池)逐级递进,最终输出标签,回到集合库内传递分类.
需要注意的是:
纹理、颜色、轮廓、种类等不同信息的是需要综合考量的,这是一个整体化的搜索过程.
宝尊TIC创新实验室半年内大概处理了几十pb的数据量.(每1pb等于1000TB,1TB是1000GB)并运用其开发的技术服务于市场上Top1000的头部客户.