别再让数据科学家管理Kubernetes集群了……

      最后更新:2020-03-11 11:41:02 手机定位技术交流文章

      的全文为2251个单词,预计学习时间为7分钟

      来源:Pexels


      生产机器学习存在组织问题


      这个问题是伴随其发生的副产品,因为生产机器学习的时间相对较短


      尽管经过几十年的探索,更成熟的领域(如网络开发)已经发展到了极致,但生产机器学习尚未进入这一阶段。


      ,例如,如果您的任务是为新成立的企业建立一个产品工程团队,负责开发web应用程序即使你没有组建团队的经验,你也可以找到许多关于如何建立和发展工程团队的文章和书籍。


      现在,如果您的公司是一家参与机器学习的初创企业你已经聘请了一位数据科学家来领导最初的工作,结果是显著的。机器学习和公司产品之间的关系越来越密切。数据科学家承担着越来越重要的责任。显然,机器学习团队需要发展。


      在这种情况下,没有太多关于如何组建生产机器学习团队的文章和书籍可供参考。


      是一种非常常见的情况,机器学习公司的新职责(尤其是基础设施)通常委托给数据科学家。


      错误


      机器学习和机器学习基础架构之间的差异


      来源:Pexels


      现在,平台工程师和产品工程师之间的差异很明显同样,数据分析师和数据工程师之间也有明显的区别。


      许多公司仍然缺乏机器学习方面的专业知识


      要理解区分机器学习和机器学习基础设施为何如此重要,研究它们各自的工作内容和所需工具将非常有帮助。


      为了设计和培训新模型,数据科学家需要:


      。花时间分析数据并在笔记本上进行实验。

      。考虑数据结构,为数据集选择正确的模型系统。

      ...使用编程语言,如Python、R、Swift或Julia

      。我对机器学习框架有自己的看法,比如PyTorch或TensorFlow。


      换句话说,数据科学家的职责、技能和工具将围绕操纵数据开发模型,最终的输出将是能够提供最准确预测的模型。


      机器学习基础设施与it完全不同。


      将模型投入生产的常见方法是将其作为微服务部署到云中要将模型部署为生产应用程序界面,工程师需要:


      。同时,他们应该注意分发文件、终端和云服务提供商的控制台,以优化稳定性、延迟和成本。

      。考虑诸如实例的自动缩放、模型的更新(假设应用程序接口没有崩溃)、图形处理器上的推理等问题

      。使用Docker、Kubernetes、Istio、Flask等工具,以及云服务提供商提供的任何服务或应用程序界面。


      下图显示了机器学习和机器学习基础设施之间的差异。它非常直观且易于理解:


      机器学习与机器学习基础架构


      直观地说,数据科学家应该处理左圆圈而不是右圆圈


      非专业人员管理基础架构有什么问题?


      如果您必须指定一个人来管理您的机器学习基础设施,但您不想让他全职做这项工作,那么只有两种选择:数据科学家,因为他们熟悉机器学习

      ,开发和运营工程师,因为他们熟悉通用基础设施。


      都有问题


      首先,数据科学家应该花尽可能多的时间做他们擅长的事情——数据科学尽管学习基础设施并不难,但基础设施和数据科学都是全职工作,将数据科学家的时间分配给这两项工作会降低工作质量。


      其次,公司需要专门负责机器学习基础设施的人员与托管web应用程序不同,在生产过程中提供模型需要有人专门负责这项工作,并且能够在组织内宣传机器学习基础设施。


      的事实证明这种宣传非常重要。作者接触过许多机器学习公司。令人惊讶的是,公司内部成员的瓶颈通常不是来自技术挑战,而是来自公司自身的挑战。


      例如,作者看到一些机器学习团队需要一个图形处理器(GPU)来进行推理-像GPT-2这样的大型模型基本上需要一个图形处理器来提供合理的延迟-但是无法获得它们,因为这些团队的基础设施是由一个更大的开发和运营团队管理的,他们不想将费用计入自己的账户


      有专门负责机器学习基础设施的人,这意味着公司不仅有能够不断改进基础设施的团队成员,还有能够满足团队需求的宣传员。


      那么谁来管理基础架构?


      机器学习基础设施工程师


      这样的标题可能不会被人认可。让我们先把标题放在一边。必须承认,生产机器学习仍处于发展的早期阶段,更不用说标题了。不同的公司可能会给他们不同的头衔:


      。机器学习基础设施工程师

      。数据科学平台工程师

      。机器学习生产工程师


      成熟的机器学习公司(如Spotify)正在寻找这样的职位:


      来源:Spotify


      网飞:



      如果人们希望将来拥有大量支持机器学习的软件,消除基础设施瓶颈是非常重要的——因此,人们需要将其视为真正的专业知识,让数据科学家专注于数据科学工作


      不要再让数据科学家管理库本内特斯集群...

      免责声明:以上内容均基于作者对机器学习团队的观察——而非行业学术调查。作者是Cortex的贡献者,Cortex是一个在产品中部署模型的开源平台。

      评论表扬关注

      我们分享人工智能学习和发展干货

      如转载,请留言,遵守转载规范

      本文由 在线网速测试 整理编辑,转载请注明出处,原文链接:https://www.wangsu123.cn/news/906.html

          热门文章

          文章分类