AI公司的练级之道：如何更具扩展性？

最后更新：2020-04-16 10:41:27 手机定位技术交流文章

全文由1370个单词组成，预计需要5分钟来学习。

机器学习似乎已经成为每个人追求的雄心勃勃的目标，超过80%的公司至少研究一个人工智能项目。

资料来源:unsplash

开始之前，最好问自己以下三个问题:

"这个机器学习模型有多精确？"

“培训需要多长时间？”

:“您需要多少培训数据？”

用户通常想知道新模型加载需要多长时间，以及在性能或推广方面有多有效。他们想要一种基于性能来衡量整体成本的方法。不幸的是，上述问题的答案不能解决这个问题。

它们甚至具有误导性。

模特训练只是冰山一角。获取正确的数据集以及清理、存储、聚合、标记、建立可靠的数据流和基础设施管道需要巨大的成本，但大多数用户和人工智能/移动实验室公司忽略了这一点。

根据最近的研究，该公司将80%以上的时间花在人工智能/移动实验室项目的数据准备和工程上。换句话说，如果大部分精力集中在建造和训练模型上，总的工程工作量和成本可能是预期的五倍。

此外，机器学习模糊了用户和软件开发人员之间的界限。

AIaaS或MLaaS已经开始出现。随着数据的增长，云模型也在不断改进。这就是为什么多边投资协定比SaaS更具挑战性。

资料来源:黄巴士底

机器模型从训练数据中学习，因此如果没有高质量的数据，模型就不能很好地工作。在大多数情况下，用户不知道生成或注释适当数据集的最佳实践。

当系统性能不佳时，用户通常会责怪模型。因此，人工智能/移动计算公司通常花费大量的时间和资源来培训用户并与用户合作以保证数据质量，这成为人工智能公司和客户的共同责任。

资料来源:unsplash

例如，为了在生产线上培训缺陷检测模型，计算机视觉公司需要与客户合作，在正确的角度和位置安装摄像机，检查分辨率和帧速率，并确保每个场景都有足够的正负培训样本。

有时机器人或车辆需要手动操作，因此使用机器人或自动驾驶汽车应用程序收集数据更加耗时和昂贵。

即使经过培训课程和阅读所有用户手册和指南，您仍然无法完全控制用户生成的数据。一家机器视觉相机公司告诉我，他们的工程师将手动验证所有数据，以确保其输入完整。

资料来源:unsplash

所有这些经常被忽视的额外培训、人工检查、数据清理和标记任务将为人工智能带来巨大的间接成本。这就是为什么需要构建更多可扩展的人工智能/毫升项目。那么如何解决这个问题呢？

1.可扩展性是关键。

确定大量客户愿意购买的正确用例，并使用相同的模型架构来解决它们。最后，您需要为没有标准产品的不同公司构建和培训不同的模型。

2.尽可能提供自助服务。

尽可能自动化培训和数据管道，以提高运营效率并减少对人工的依赖。与内部工具或自动化相比，公司更重视对开放客户可见的功能，但前者将很快获得回报。您需要确保为内部流程自动化分配足够的资源。

3.最后，确定并跟踪成本，尤其是隐性成本。

工程师花了多少时间来清理、过滤或聚合数据？他们花了多长时间来确保第三方正确完成评论？他们需要多长时间来帮助客户设置环境并正确收集数据？其中有多少可以自动化或外包？

资料来源:unsplash

通往训练的道路可能既艰难又漫长，但迟早会有一些问题需要面对。

评论、表扬和关注

让我们分享人工智能学习和发展的干货。

如果重印，请在后台留言并遵守重印规则。