旷视天元深度学习框架全球首发!3个实习生写下一行代码

      最后更新:2020-03-28 13:43:58 手机定位技术交流文章

      [新智元介绍]刚才,中国的人工智能独角兽匡视宣布开放其深度学习框架MegEngine,试图为中国的人工智能应用创造一个新的基石。六年前,三名实习生在艰难创业期间,从第一行代码开始写作,并在全球人工智能竞赛中赢得了27个头衔。如今,天元是开源的,敢于与全球主流的深度学习框架如天元网竞争。这个绝密武器为开发人员解决了哪些棘手问题?

      刚才,中国人工智能领域的领军人物师旷召开了一次震惊业界的在线会议,并向全球开发者开放了其人工智能生产力平台Brain++的核心组件——多元智能引擎。天元也成为中国人工智能公司开发的第一个国内深度学习框架。

      天元项目负责人、研究院高级技术总监田指出,开源天元是一个集训练与推理、动态与静态于一体的行业级深度学习框架。它采用了在同一框架和系统中完全支持训练和推理的设计,使开发人员能够真正体验到“好的训练”、“动态训练”和“快速训练”。

      过去几年来,师旷在研发过程中遇到了许多棘手问题。这些痛点也是行业中常见的,这些痛点可以由天元来解决。

      匡田原架构具体分为五层:计算接口、图形表示、优化和编译、运行时管理和计算内核。在顶层计算接口上,天元配置了C++和Python接口,解决了不同框架学习接口和模型复制困难的问题。在图形表示层,天元内置了动态和静态转换功能,支持开发人员混合动态和静态图形模式进行编程。

      匡在用中文给自己的名字命名时,想到了很多关于MegEngine的事情。田说:最后选择的“天元”有很多含义。首先,“天元”是围棋棋盘的中心。一方面,我们希望用这种方式来表达多元智能引擎不仅是开放技术大战略计划中最核心的“布局”,也是整个人工智能产业解释人工智能基础设施如深度学习框架的关键和重要的一点。其次,在古代数学的概念中,“田原”代表一个一维方程,是复杂方程的基础。在古代天文学中,“天元”和“太一”指的是北极星,它是万物的起源和开端。总之,命名MegEngine为“天元”是希望该系统能够真正成为大家共同的基石,成为人工智能系统的重要组成部分,从而促进人工智能在各个领域更好的应用和落地。

      基于“深入学习,简单发展”的理念,天元有四大优势:

      1.训练和推理的结合

      匡田原不仅可以支持研究人员进行算法训练,而且训练得到的模型和产品可以直接用于产品的推理和包装。模型转换的消除不仅大大简化了算法开发过程,而且实现了速度和精度的无损迁移。即使该模型跨设备部署,天元仍能实现精确对齐。在部署过程中,天元还可以帮助开发人员自动删除冗余代码,实现自动模型优化。

      2.运动和运动的结合

      静态地图性能高,占用资源少,易于部署。动态图简单、灵活、易于调试和使用。匡田原综合了动态地图和静态地图各自的优势。在充分利用动态地图模型训练优势的同时,通过动静一键转换功能,以静态地图的形式完成制作和部署。此外,天元还支持动态和静态混合编程,更加灵活。

      3.兼容性

      师旷天元拥有Pythonic API,它对习惯使用Python进行传统机器学习的开发人员非常友好,具有较低的学习成本和易用性。同时,天元还支持PyTorch模块功能,可直接导入模型,移植成本低,模型复制方便。天元内置高性能计算机视觉算子和算法,可实现计算机视觉相关模型的训练和应用深度优化。

      4.灵活高效

      开放式天元具有强大的多平台、多设备适应性。通过组装和指令重排等技术,内置的天元操作员可以充分利用推理或生产环境中的多核优势,灵活调用设备的计算能力,特别适合大模型算法训练。

      孙健:师旷1400多名R&D员工全部被录用,天元就像我们的孩子。

      师旷首席科学家、该研究所所长孙健介绍了如何利用师旷天元做更好的研究。

      师旷有1400多名研发人员,他们都使用师旷天元发动机,并在数百种产品和数十种计算平台上使用这些发动机。孙健亲切地把天元比作他们的“孩子”,并介绍了这个“孩子”的三个特点和优点:

      第一个优势是框架和算法之间的合作。当前的计算平台差异很大,因此很难只设计一个网络来满足所有需求。师旷使用田原框架作为中间桥梁。根据不同设备的计算特点,协同设计网络结构和框架算子,以获得最佳性能。洗牌网是协同设计的结果。近年来,在终端上非常高效运行的神经网络的设计取得了优异的效果。

      第二个优势是高效的培训系统。在可可物体检测和识别挑战赛中,师旷在2017年、2018年和2019年连续三次获得冠军。其中一个主要优势是师旷·田原是一个快速训练系统。同步宽带网技术首次从框架中引入。它可以支持非常大的小批量训练,因此开放视觉可以以非常高的速度训练系统。

      优势3:大规模能力。孙健说,这与大规模的开放视图数据有关,并发布了Objects365V2的最新版本。这是世界上最大或更大的物体检测数据集,有365个普通物体,200多万幅图像和2800多万个手动标记的帧。

      人工智能业务的深度学习框架

      从2012年到2013年,AlexNet写了一套当时不叫框架的东西,而是一套可以在扩展的NV的图形处理器上运行的软件。后来,贾博士在伯克利制作了一个Caffe开源系统,成为第一代广泛使用的深度学习框架。

      MegEngine是基于计算图概念开发的第二代深度学习框架的训练演化。这种方法非常灵活,使得许多计算和推导完全自动化,使得整个编程更加容易。

      师旷在2014年基本上完成了MegEngine的开发,并借鉴了以前的开源软件。直到2015年,TensorFlow宣布开源,才发现每个人都通过各种方式达到了相同的目标,都基于计算图表。然而,当时TensorFlow发布的开源软件远非完美。师旷也和它做了比较,发现他做得更好,所以他一个接一个地坚持下去。到目前为止,师旷的内部版本已经迭代到8.0。开放视觉框架结合了深度学习和人工智能在实际应用中的许多问题。从实际问题出发,也是本框架的初衷。

      与谷歌、脸书等大型平台公司开发的深度学习框架不同,师旷是一家100%人工智能公司,师旷的深度学习框架是在其核心业务上成长的,因此人工智能公司的深度学习框架和平台公司的深度学习框架在考虑点、方向和方向上是不同的。师旷希望从这个方向为开发者提供实用的平台和便利的工具来指定人工智能。

      当前主流框架的开源时代、发展主题和框架特征

      目前,世界上主流的深度学习框架除了忽略新开放的天元之外,还包括蒙特利尔理工大学2007年推出的茶道,加州大学伯克利分校2013年推出的咖啡,谷歌大脑2015年推出的开源软件天梭流,谷歌人工智能研究员弗朗索瓦·乔莱特等人2015年推出的Keras,脸书2016年推出的开源软件MXNet,微软2016年推出的开源软件PyTorch,百度2016年推出的开源软件

      其中,TensorFlow和PyTorch是两个极端。PyTorch采用动态图进行灵活方便的调试,适合学术研究TensorFlow采用静态图进行部署,更适合工业应用。师旷希望为开发人员找到一个有利于调试和部署的解决方案。

      这一次匡将天元视为收入来源,可以说是国内深度学习框架的一剂强心针。与市场上主流的深度学习框架相比,师旷田原可以更快地开始,并且具有更低的学习和迁移成本。作为一个成功登陆人工智能的企业,实践是最宝贵的经验。与已经实现开源的框架相比,开源框架的最大区别在于开源是人工智能行业中唯一的企业。开源本身就是人工智能解决方案。开源框架最好从人工智能实践解决方案开始。

      天元是怎么出生的?

      众所周知,师旷是中国领先的人工智能企业之一。近年来,他包揽了世界上所有主要的个人简历比赛,并赢得了27次全球人工智能锦标赛。开放视图数据、算法和计算力这三个核心组件集成在脑++系统中。作为伴随师旷在人工智能行业6年实战经验的一个框架,天元不仅可以升级师旷,在人工智能竞赛舞台上增加Buff,还可以撑起师旷工程和生产的半边天。2020年,在当前的疫情下,匡为何突然选择披露镇宅的宝藏,与业界分享绝密武器?这也从天元的起源开始。

      清华宿舍开发的田原出生面算法,3名实习生写下框架的第一行代码

      师旷于2011年由清华的三名“姚班”学生创立。在早期,师旷使用传统的纸张方法进行算法研究和开发。2013年年中,深度学习刚刚兴起。师旷研究所开始尝试使用深度学习探测器。清华宿舍的一名实习生在头两周埋头苦干,开发了一套人脸识别检测算法,即使在昏暗的光线条件下也能准确地检测出人脸。算法前所未有的性能让四个人大吃一惊。师旷正式走上了神经网络解决一切的道路。

      那时,条件很艰苦。服务器、主板、视频卡和其他设备都需要从美国一个接一个地找回人体。第一台用来训练神经网络的机器是一个用手组装的4张牌游戏桌面。起初,师旷使用安蒂诺框架来编写模型代码,训练神经网络,并为每次训练运行编译几个小时。随着网络变得越来越大、越来越复杂,这个低效而耗时的框架不仅让人们崩溃,还限制了师旷一些顶尖人才的创造力。师旷的一些丹尼尔开始战斗并尝试各种方法,例如简单地在早期的开源框架(如Antano)上包裹一层代码来解决冗长的代码问题,以便“使炼金术工作更快”,但是训练效率仍然不能满足师旷的开发需要,于是炼金术程序被开发出来。

      2013年底,时任师旷研发负责人的曹志民提出,要建立一套自动化算法研发系统Cycle++,可以通过数据、培训和业务来实现。算法从研发到应用的自循环系统可以在不投入太多人力和时间的情况下实现(师旷·布雷恩的早期想法)。因此,2014年初,研究院的、、李、、魏明三位实习生的第一行代码写好了,不到半年,自主研发的第一版梅格引擎正式诞生。接下来,为了跟上师旷的发展进度,研究所与企业保持深入沟通,了解一线需求,重现企业所需的神经网络。在2015年年中,又花了六个月的时间完成了自我研究框架与师旷所有企业的整合。师旷业务线上的所有模型都被自我研究框架训练的版本所取代。

      2015年11月9日,谷歌正式发布并开放了开源软件TensorFlow。然而,来自师旷研究所的几名实习生坐不住了,因为他们惊讶地发现张量流接口和概念的设计思想惊人地一致。TensorFlow的开源对师旷的自我研究框架造成了巨大影响,也就是保留问题。既然大型工厂已经开辟了新的资源,师旷还需要坚持自己的框架吗?在这方面,开放愿景的内部变成了两派,并进行了长期的讨论。最后,决定通过科学方法做出决定。经过大规模评估后,开放视野研究人员发现新开放的张量流的性能并不理想,比开放视野自我研究框架慢10倍。这个结果使师旷更加坚定地走上了自学的道路。

      在27个全球人工智能竞赛冠军的背后,最高机密武器是“三位一体”脑++软件

      随着开放视图服务的加速扩展,开放视图自我研究框架在商业实践中的优势日益凸显,算法训练周期从3周缩短到5天。当时,张量流还没有解决多卡可伸缩性的问题,一张卡和八张卡的计算效率相差不大。然而,师旷的自我研究框架的效率接近线性加速比,所以他开始疯狂地购买八张卡的机器。那时,环境很恶劣。为了确保服务器在夏季的稳定运行,框架研发团队甚至要求制冰公司每天放置冰块进行物理冷却。然而,高速运行的服务器耗电太多,而且仍被建筑公司反复警告为“定时炸弹”。

      师旷从研发到商业的完全迁移到了自己的深度学习框架和自己的计算集群,标志着师旷数据、算法和计算能力三个核心组成部分的“统一”正式完成。从那以后,师旷人工智能生产力平台Brain++开始成形。

      从2017年到2019年,师旷依托师旷Brain++的大规模分布式培训能力和行业领先的分布式计算技术培训的超大规模深度学习模式,共获得27项全球人工智能竞赛冠军,开发了大量部署在云、移动和基于边缘的全计算平台上的先进深度神经网络,为个人网络、城市网络和供应链网络三种垂直场景提供了强有力的支持。

      为了加速人工智能技术的登陆,让更多的开发者和企业用户使用人工智能的“源动力”,师旷在2019年开始准备开源脑++的核心深度学习框架,并给MegEngine取了一个中文名字——天元。在此期间,框架研发团队可以说经历了一场浴火重生。最初打包的代码需要分解和重组,以适应大量开源用户的使用体验。

      给人们鱼比给他们鱼好。忽略开源深度学习框架的原因很简单,那就是,我希望把我使用的好东西分享给每个人,这样那些对学习人工智能和用人工智能改变世界感兴趣的开发人员可以更简单、更高效地使用人工智能来创建、实现人工智能+行业的成本降低和效率提高,并释放生产力。另一方面,框架代码的开放源代码意味着接受公众的检查,同时,它也能激励更多的技术贡献者更好地使用它。目前,为了进一步提高研究人员的培训便利性,MegEngine正在从传统的静态图计算模式向动态图计算模式转变。未来,随着天元的开源,脑++的所有功能将逐渐对外开放。

      深度学习很简单,在人工智能中为普通开发者创造“高炉”。

      师旷认为,如果我们想解决无限场景中无穷无尽的新问题,我们需要无限的算法。为了获得无限的算法,人工智能基础设施必须首先建立。在公众眼中,只有两样东西可以称为人工智能基础设施:人工智能芯片和人工智能底层的平台级产品。

      人工智能芯片显然是人工智能的计算平台,师旷的联合创始人兼首席技术官唐文斌对人工智能底层的平台级产品给出了一个具体的定义:人工智能生产力平台。在师旷,已经有这样一个生产力平台——brain ++了。

      Brain++是一个集成了数据、算法和计算能力的大型平台概念。其核心能力包括数据处理、清理和管理能力、计算能力共享、调度和分发能力,以及算法培训、推理和部署能力。它可以覆盖从人工智能生产(输出算法模型)到应用(实现算法工程封装)的所有环节。

      简而言之,脑++是匡作为人工智能创建的一套Visual Studio。这是一套开发工具。其目的是有效解决人工智能研发门槛高、成本高、效率低的问题,为工业、大学和科研各界提供一站式、全过程的人工智能专业解决方案。师旷在新闻发布会上提到,Brain++的功能将通过开源和开放形式逐渐与业界共享。

      该行业喜欢用“炼金术”作为算法研究的隐喻,因此数据是各种矿物或自然元素,例如金木的水、火和土壤,而框架是用于炼金术的熔炉,计算力是熔炉下的火。元素都不完整,炉子好不好,火不旺,这就决定了人工智能开发者能否实践一种新的人工智能灵丹妙药。

      从师旷的开源会议可以看出,师旷的庭院已经有了一套设备齐全的爆炸室,Brain++。今天,他们计划开放他们的高炉资源,供每个人免费使用。至于爆破用的原材料和木柴,他们可以根据用户的需要进行合作。

      开源并不意味着完美。研究院高级技术总监田表示,此次开源发布是天元阿尔法版,并计划在6月提供第一个里程碑式的贝塔版。在这个过程中,师旷呼吁更多的人来批评天元,给出建议和贡献代码。唐文斌指出:“也许下一代天元不是由师旷研发团队制造的,而是与您共同打造的测试版和官方版,所以我们也希望与大家一起构建一个更好的深度学习框架。”

      所有深入学习框架的存在都是为了方便开发者。天元站在他前辈的肩膀上,比蓝衣更胜一筹。它扩展了深度学习开源框架的新版本,并为开发人员提供了新的选择。

      天元开源地址和通信社区

      那么,这个高炉有什么用呢?

      会上,师旷宣布了天元在GitHub和OpenI的代码托管地址。与此同时,师旷发布了一个名为MegStudio的在线深度学习工具和一个ModelHub,以支持开发者开箱即用。其中,“模型中枢”汇集了世界顶级算法的一些预先训练好的模型,以及师旷研究所的一些最新技术和研究成果。师旷说,更多的SOTA型号正在增加。

      想尽快开始吗?

      天元多元深度学习框架官方网站:https://megengine.org.cn/

      GitHub开源地址:https://github.com/MegEngine/MegEngine

      本文由 在线网速测试 整理编辑,转载请注明出处,原文链接:https://www.wangsu123.cn/news/3116.html

          热门文章

          文章分类