原文:EB2.2强力来袭,全新搜索算法带来图像搜索新体验 - 2017.07.15

来源:广州衣布到位信息科技有限公司 - 微信公众号

衣布到位APP(以下简称EB)自2016年7月上线以来,目前已经掌握了广州中大布匹市场90%以上的面料数据,通过智能大数据图像搜索技术, 实现“以图搜图”,用户只需对准面料拍照,系统就会帮你找到相同或相似的面料,相较于以往的文字搜索能够更快捷精准地匹配想要的结果.

面料是一种很难用语言描述的产品,通过图像搜索是纺织服装行业刚性需求,但面料属于柔性物体,其结构随时都会产生无规则变化,如折叠、褶皱,图像都会受到影响,且不得不考虑拍摄光线及角度因素产生的误差. “拍照找布”听起来貌似很简单,实现起来却不容易,需要深度学习人工智能识别技术和计算机视觉技术做支撑. 图像识别的精确度主要取决于训练的数据量、算法模型设计、计算力,前两者更为关键.

衣布到位APP正是基于行业需求研发而成,庞大的自有数据库提供了训练素材,并不断改进算法模型,达到精准化搜索效果. 2017年5月EB2.0上线,相较于此前的1.0版本,我们增加了多种搜索算法的精度. 首先,增加机器学习算法,根据图像特征关联进行机器拟人学习,实现精准匹配,提高了图像搜索精度;其次,实现了多维度精确筛选,通过大量面料数据为基础,把面料拆分成更细粒度标签,通过不同维度精准指向面料,取得了很好的识别效果.

但我们的研发并不止于此,为了让用户拥有更快捷精准地搜索体验,我们的技术团队丝毫不敢懈怠,不断加大研发力度,于2017年6月推出EB2.2,在面料色彩和结构纹理的精准度细节处理上取得了更大的突破.

此前,我们采用的是建立二十四维色彩空间与全局纹理相结合的算法,已经取得了不错的检索效果. 但其搜索结果存在色彩精准度上的细微差别,结构纹理的吻合度相对偏弱,细节抓拍不够清晰的缺点,我们就搜索算法做了进一步改进,力求实现“所见即所得”的可视化搜索体验.

依据人眼色彩感知的舒适度,我们提取MCMQ(Main Color Means Quantize)的主色调聚类算法,将图像所有的像素提取出来进行聚合,在一定色彩空间上将相同及相似的色彩聚合为一类,以此类推,计算出主色调成分,更加准确的表述出布料的色彩空间,在此基础上描述多色彩面料时就不会被布料的色彩组成所影响,结合新的主色调对比算法DBHSVC(Distance Between HSV Colors),色彩差异更加符合人类的色彩感知. 现在随便对着身上的衣服拍照,系统都能快速检索色彩匹配度极高的同款或相近面料,这些面料在人眼视觉上,色彩精度几乎无差别.

改进搜索算法后,面料的结构纹理也更清晰. 此前我们使用的切割图像与方向特征描述的算法,由于面料柔性结构的不稳定性,这种搜索算法不能准确的保留图像的细微边缘与角点的特征信息,容易丢失大量图像信息. EB2.2针对面料特性,采取SIFET和BOVW算法,从传统算法提取图像轮廓角点信息升级为提取面料图像的边缘信息,实现图像维度转换,真实还原图像结构中的角点与边缘特征. 在实时性与聚类性上,采用k-means聚类算法,符合布料实时性要求,且能适应一定光照,变形,仿射等真实拍摄环境下的图像搜索,降低了拍摄环境及面料结构变化产生的搜索干扰,搜索结果更为“原汁原味”. 现在用户利用APP拍照功能搜布,可以不惧光线及面料的呈现状态,结构纹理清晰可见.

Last modification:September 11th, 2019 at 03:37 pm