淘宝“明星同款”或要被AI抓出来打,阿里新研究专攻服装局部抄袭

      最后更新:2020-03-17 11:36:00 手机定位技术交流文章

      甘明来自瓦非寺
      量子比特报告|公开号码qbita

      阿里利用人工智能打击假冒商品,新的研究成果问世

      这一次,他们把重点放在了服装盗版上,并把难度值发挥到了最大:在复制过程中,盗版者修改了衣领和袖子等细节。例如,淘宝上的各种“同款明星”都可以很快锁定。

      背后的思想是基于服装区域表达的检索模型来学习和度量图像中服装的区域相似性。

      研究成果已被纳入CVPR 2020,并被选为口头论文。

      阿里安全图灵实验室表示,这项工作将使用阿里的原始保护平台,该平台将在阿里电子商务平台如淘宝和天猫上推出,以提供侵权检测能力。

      精剽窃魔高一尺,假道有多高一尺?

      就服装领域而言,虽然打击假冒伪劣商品的工作一直在进行,但盗版和剽窃的问题仍然普遍存在。此外,从网上到网下,剽窃变得越来越棘手,打击假冒商品的难度逐年增加。目前,在服装领域只有三种类型的剽窃第一类

      集中于图片盗用盗版者通常在未经授权的情况下使用或修改真正的品牌商品地图,例如在地图上添加他们自己商店的水印,或者进行一些图像处理(反转、缩放、拼接等)。)像

      这样的侵权和剽窃成本非常低,但是很容易被平台的图像检索系统锁定,然后很快就被“管理”

      的第二类是创意盗用,即不法商家直接抄袭原商家的整体产品设计和创意,制作相同或模仿的模型。

      等侵权成本稍高,但基于商品整体相似性度量的相同项目检索算法可以召回和治理它们。

      挪用公款的第三类是修改一些局部地区的服装,如制图,如改变领口的设计风格,或胸部印刷的布局,甚至改变服装的款式等。

      但是如下图所示,它仍然是从真品品牌服装的款式和设计元素中抄袭来的(左边是真品,右边是盗版),甚至被当成“金钱之星”出售这种盗版,

      ,成本最高,并且不容易被基于相同项目检索的传统算法锁定。在正常情况下,电子商务平台只能通过人工审查才能找到,打击成本很高。

      系统有没有办法自动锁定这种剽窃行为?这是阿里安全图灵实验室的最新研究方向。在

      之前,他们提出了一种基于属性感知的细粒度相似性学习方法的服装版权算法来锁定局部剽窃,该算法已被AAAI2020收录

      现在他们提出了一种新的思路,基于服装区域表达的检索模型,对图像中的服装进行区域相似性学习和度量,从而实现更有效的防伪

      “盗版服装图像”检索算法精确到袖子和衣领

      “盗版服装”的定义是从原始服装设计和款式整体复制的服装样本,并在一个或两个区域进行修改,以避免被同一服装的现有检索模型筛选

      Ali的研究人员将图像中的服装分为五个区域,包括衣领、胸部、腰部和两个袖子区域,并对四种类型的服装(短袖t恤、长袖夹克、外套和连衣裙)进行了实验。每个服装区域的划分如下图所示:

      在算法设计中,提出了服装关键点引导的区域注意机制

      首先使用服装关键点估计分支来预测服装关键点,即分布在服装图像每个关键位置的点,如领口、袖口、肩部、腋下等。

      每种服装的关键点的数量和分布有所不同,每件衣服的关键点在25到40之间。根据这些关键点,该算法可以将服装图片划分为多个区域,如衣领、袖子、胸部、腰部等。通过感兴趣区域汇集思想引入

      区域划分信息,将集成的服装图像特征解耦成多个区域特征表达式,独立学习和度量特征相似度。

      同时,服装关键点结合区域表情可以作为一种注意机制,引入到图像检索网络中。增加关键部分的特征权重,减少非关键部分的权重,从而提高模型对关键部分的判别能力

      服装关键点估计分支和图像检索分支使用同一个HR-Net骨干网络,其多级并行结构在保持高分辨率的同时获得多尺度特征。

      在损失函数的选择上,关键点估计分支采用均方误差损失函数,检索分支采用区域化设计的三重损失函数然而,损失函数的值不再是整个图像范围的特征三重差,而是每个区域的特征差的累积结果。

      方法的框架如下图所示。该网络可分为服装关键点估计分支和服装检索分支。该检索网络包括相同服装检索和盗版服装检索两种输出形式:

      通过对平台侵权服装样本的分析,阿里研究人员发现不同类型的服装在不同区域容易受到盗版。因此,仅仅解耦服装图像特征的相似性度量过程是不够的。还需要为每种服装的多个区域设置不同的权重,并进行加权区域相似度计算,以召回更多的盗版服装样本。

      因此,基于该平台的盗版服装数据,他们建立了一个名为“时尚服装数据集”的数据集。在这个数据集中,每组“原始服装”的查询图像对应于图库中的多个“盗版服装”图像,数据涵盖了四类样本:短袖t恤、长袖夹克、夹克和连衣裙

      在该数据集上,他们在深度时尚2数据集上预先训练的检索网络上执行微调训练,并使用坐标上升算法迭代优化不同服装类别的每个区域的权重值,以减少损失函数值

      “盗版服装”检索训练过程的损失函数也是基于三元组损失函数设计的。最后,经过训练的盗版检索网络可以根据上图中的输入服装图像在输出中的绿框中检索盗版服装样本

      防伪效果如何?在论文的实验部分,阿里的研究人员在没有失去甚至超过之前的SOTA

      的情况下,首先在“时尚剽窃数据集”上评估了该算法的“盗版服装图像”检索能力

      除了本文提出的方法外,他们还建立了两种方法进行比较:一种是传统的检索方法,它使用相同的骨干网和三重损失函数,但不包含区域特征学习和表达的机制;另一种是包含区域化特征的表达机制,但评价指标是使用通过非微调训练获得的区域权重的mAP

      从表中的结果可以看出,本文所用的方法在所有服装类别中都取得了最佳效果

      除了上述“盗版服装检索”的评价实验外,他们还对Deepfashion系列数据集进行了服装关键点估计和同一服装图像检索任务的实验。

      在服装关键点估计部分,阿里研究人员对当前高复杂度的深度时尚2数据集进行了评估。与现有的匹配-RCNN、CPN、简单-基线等方法相比,服装关键点估计模型在每个子集上的mAP结果最高:

      。在同一个服装检索实验中,他们选择了时尚网、匹配-RCNN、印刷电路板等方法进行比较,并分别对深度时尚和深度时尚2进行了实验

      ,其中深度时尚主要针对店内检索场景,深度时尚2针对消费者到店场景评价指标分别为顶级生态和顶级安全。

      的结果如下图所示。阿里方法在深度时尚数据集上取得了与SOTA方法相似的结果,在深度时尚2数据集上的结果明显优于现有的基线方法。

      来自阿里图灵实验室

      共有5名研究人员参加了研究,他们分别来自阿里巴巴、浙江工业大学和阿里巴巴-浙江大学前沿技术联合研究中心

      第一作者伊宁朗、第二作者袁禾、第三作者杨帆均来自阿里安全图灵实验室。阿里安全图灵实验室的负责人薛辉是这篇文章的通信作者。浙江工商大学的董剑锋也是本文的作者之一。

      阿里安全图灵实验室于2016年正式成立。它的前身是阿里安全基础算法团队。它主要从事安全和风险人工智能系统的研究和开发。其核心技术包括计算机视觉、自然语言处理、生物识别、地图计算、异常检测和分析等。到2018年,它已经申请了50多项专利。

      目前,他们仍在大规模招聘,包括研究实习生和正式研究员。如果你感兴趣,你可以注意下面的~

      -end-

      量子位QBITAI。标志

      关注我们,并首先了解

      的最新技术发展

      本文由 在线网速测试 整理编辑,转载请注明出处,原文链接:https://www.wangsu123.cn/news/1601.html

          热门文章

          文章分类