最后更新:2020-03-26 13:08:06 手机定位技术交流文章
机器之心原创
机器之心编辑部
两个新功能和四个主要升级。百度闫飞电脑视觉模型基地近日迎来全面升级此外,百度这次为PaddleCV增加了15个工业应用算法,并增加了35个高精度预训练模型。
随着防控措施效果的显现,新的疫情在全国范围内得到控制。当我们走进地铁和车站,甚至许多居民区和超市,我们会看到口罩面部检测系统和红外测温系统,这些都是人工智能在疫情控制中给予的独特帮助。
人工智能在抗击疫情过程中所做的贡献,离不开先进算法的持续开放源代码的深入学习。早在2月份,百度就推出了第一个面具人脸检测模型,并发布了一些预训练模型,这些模型可以满足您部署到服务器还是移动终端的需求
我们会发现这种预培训模式太容易使用了。例如,使用PaddleHub,只需一行命令就可以将它部署到服务器上。然而,不仅是赛马场,整个赛马场都非常有用。否则,开发人员很难在短时间内用它开发和开放源代码“防疫模型”。

近日,百度全面正式升级PaddleCV。顶级车型已经发布,普通车型已经加速。它已经是一个拥有73个顶级视觉算法和203个预训练模型的大家庭。在
PaddleCV的新浪潮冲击
之前,机器的心脏被引入。与TensorFlow或PyTorch相比,Paddle拥有最大的官方模型库,这意味着飞桨团队将花费大量精力维护这些模型,以确保它们的最佳性能、最新的API和最佳可用性。PaddleCV是一个开源项目,包括可视化算法、模型和工具。
在本次PadleCv更新中,PadleCv增加了15个算法、35个高精度预训练模型、两个新的3D视觉能力和PLSC超大规模分类模型,这些在工业实践中被广泛使用。
PaddleCV地址:https://github . com/paddle/models/tree/release/1.7/paddcv

,如上图所示。整个PaddleCV已经从底部工具更新到顶部包,其中PaddleDetection已经被更新并且添加了一系列算法模型。例如,增强版的YOLOv3比原始版本的MAP提高了10个点,并且添加了COCO最佳检测模型CBNet等。
同时,PaddleSeg也有许多更新,如增加了实时语义分割模型快速SCNN和基于HRNet的高精度图像分割模型。对于非常流行的DeepLab V3+,快速SCNN的速度是它的两倍多
两个新版本
PaddleCV新版本3D点云视觉算法。也许在我们的印象中,3D视觉还处于研究阶段,但这两种模型已经通过了多次工业测试,具有良好的稳定性和效果。给定一个3D点云,PaddleCV中的3D视觉模型可以完成目标检测并构建一个神奇的3D包围盒。

pointCNN分为两个阶段,类似于一般目标检测:从下到上生成3D候选边界框,并进行微调和细化以获得精确的3D边界框
的另一个新版本是PLSC,一个超大规模的分类工具。其“超大规模”是指数千万规模的分类任务,这对于大规模人脸识别或“面具人脸识别”非常重要PLSC
飞桨大规模分类库封装了大规模分类神经网络的实现,提供了一个简洁易用的高级API。用户可以通过五行代码实现千万类分类神经网络培训有多简单?请看下面的代码:
Fromplscimportentrif _ _ name _ _ = ' main ' ':ins = entry()ins . set _ class _ num(1000000)#设置类别的数量ins.train()一般来说,PaddleCV现在有73个算法方面的顶级视觉算法。如果这个数字不够直观,建议您查看一下PaddleCV的GitHub页面。模特的名单真的很丰富。除了最传统的图像分类模型之外,视频分类算法还有以下许多
桨式cv的型号已经很多了。压缩、部署和硬件对于充分利用它们是不可或缺的。现在,从培训到部署,借助服务器端和移动端的飞行桨的全部硬件平台能力,视觉模型可以在各种平台上着陆,包括百度的昆仑芯片。PaddleSlim为不同的模型提供了最佳的压缩方案,以适应不同的硬件,而PaddlesLim等工具真正以最佳方式在各种硬件上运行模型。
完整的PaddleCV和更新的内容阅读器可以检查GitHub地址。在本文的后面,我们将主要介绍PaddleDetection的更新内容,它在性能更新、顶级新模型和实际部署方面都取得了很大的进步。
YOLOv3:训练速度提高了40%
PaddleDetection旨在为行业和学术界提供丰富易用的目标检测模型在这次更新中,我们可以看到PaddleDetection优化了许多主流模型的性能,YOLOv3就是一个明显的例子。
在COCO数据集上,骨干网DarkNet作者在他的论文中使用的YOLOv3模型的验证精度mAP为33.0%,而基于DarkNet53的YOLOv3模型在以前的飞桨版本中已经发布,该模型的验证精度为mAP 38.9%
在最新的PaddleDetection库中,飞行桨对YOLOv3进行了以下改进,使验证精度mAP再次提高到43.2%,推理速度提高了21%此次升级还不断优化了数据预处理的速度,将整体训练速度提高了40%与最初的YOLOv3相比,百度的优化模型在地图上提高了10个点,所以准确率已经很惊人了。
和YOLO几乎是目前最常用的目标检测算法,每一种优化都非常有意义YOLO模型最早是由Joseph Redmon等人在2015年提出的,并在随后的论文中进行了修正

yolo的创新之处在于,它提出了一个一级检测的思想,即目标定位和目标识别一步完成,网络划定边界框后不需要预测。但它也有一定的缺陷:不擅长小目标检测。为了弥补这一缺陷,雷德蒙等人于2018年发布了YOLO v3。
架构中,YOLOv3采用了Darknet-53,借鉴了残差神经网络的思想,采用残差连接,以便更好的学习图像特征那么,为什么飞行桨队可以优化10分的准确性,同时提高训练推理速度呢?
首先,飞行桨队将YOLOv3主干网从暗网替换为ResNet50-VD型ResNet50-VD网络与升级前的DarkNet53网络相比,在速度和精度上有一定优势,ResNet系列更易于扩展。在PaddleDetection中,用户可以根据自己业务场景的特点,灵活选择ResNet18、34、101等不同的网络类型作为模型的骨干网络
ResNet-50是著名的目标检测骨干网,具有一定的性能优势而“虚拟发展”是基于这一网络的改进,如在培训中增加一些技能或进行结构性改进等。

ResNet-50的几种体系结构改进
另一方面,PaddleDetection引入了可变形卷积v2(简称DCNv2,可变形卷积)来替代原始卷积运算实验数据表明,使用ResNet50-VD和DCNv2后,模型的精度提高了0.2%,速度提高了21%左右
DCNv2同时考虑了速度和精度的平衡这种升级的YOLOv3模型使用DCNv2来代替主干网络中第5级的3×3卷积。
另外,PaddleDetection在FPN增加了DropBlock模块,提高了模型的泛化能力。与Dropout算法相比,DropBlock算法在丢弃特征时,只关注某个区域,更适合应用于检测任务,提高网络的泛化能力。

辍学与Dropblock
这样的机制显然有助于网络集中对某些区域进行退网,因此比随机退网具有更好的针对性。
进一步照亮了YOLOv3的飞桨,这表明这款PaddleDetection的开源让许多优秀成熟的老型号进一步提高了性能,从而在更多的图像场景中发挥了有效的作用。
CBNet:添加COCO最佳检测模式
PaddleCV。除了确保YOLO这个常用模型“与时俱进”之外,它还将添加一些经过实践检验的高质量算法。CBNet,具有最高COCO数据集精度的开源模型,以及开放图像V5目标检测竞赛的最佳单一模型,都已添加到此更新中。
CBNet是目前COCO数据集上最好的目标检测网络,其mAP在测试集上为53.3%CBNet通过组合相邻主干网之间的复合连接生成一个新的主干网,称为复合主干网。以ResNet结构为例。当级联数为2时,称为双重网,当级联数为3时,称为三重网

新添加到PaddleCV的CBNet基本模型使用ahlc(相邻高层组合)网络模式,即通过复合连接模块将助理主干的每个输出特性用作相邻主干的输入在本文中,AHLC是各种网络模式中最好的连接模式
除了添加新的基本模型外,还发布了单比例检测模型Cascadercnn-CBR 200-VD-FPN-DCnV 2-非本地,在COCO测试集上的准确度为53.3%。
PaddleSlim:将模型压缩到1.0
PaddleCV改进并更新了大量模型。如果这些模型真的应用到手机等设备上,它们仍然需要“瘦身”PaddleSlim现已进入1.0版。应用于SDK,在嵌入式设备上0.3秒就可以完成人脸检测、跟踪、活体检测和识别的全过程。
在前面的介绍中,YOLO v3已经得到了增强,对于PaddleSlim,它还可以提供定制的YOLO蒸馏方案,这可以刷新COCO检测任务的准确性下表详细描述了蛋黄的“瘦身”效果。在帕斯卡挥发性有机化合物数据集上,参数量减少了67%,计算量减少了69%,效果甚至提高了2.6%

pad lim 1.0也是成熟的标志。它在模型压缩方面做得非常好,所以1.0不会停留在知识提取、剪枝和其他压缩方法上。PaddleSlim 1.0开辟了更灵活的网络结构搜索网络连接存储应用编程接口,并预先定义了更丰富的搜索策略和搜索空间。只有通过搜索,才能为特定的任务实现更完美的结构。上图

显示了一次性网络结构搜索的原理。与以前的方法相比,一个V100图形处理器需要42天才能完成,而一次性只需要4天与V2移动相比,搜索到的网络计算量减少了20%
作为一个成熟的瘦身框架,必然会与部署联系在一起。我们的压缩模型不就是为了方便在各种设备上使用吗?PaddleSlim 1.0也考虑到了这一点。从培训、压缩到部署,该模型可以无缝地适用于各种硬件环境。

最后,基于飞板框架,开发人员现在可以快速使用主流算法直接开发全过程模型。即使是顶级的3D图像分类、语义分割和目标检测任务也能快速实现,模型精度也能保持在世界领先水平。百度飞板为我们提供了必要的开发和应用工具。
“新基础设施”在疫情进入消退期后,正成为各界关注的焦点。在以技术为核心的基础设施建设过程中,人工智能必将进入越来越多的
本文由 在线网速测试 整理编辑,转载请注明出处。