最后更新:2020-03-30 11:52:34 手机定位技术交流文章
全文由1848个单词组成,预计需要6分钟来学习。

资料来源:Pexels
无论你是机器学习的初学者还是中级程序员,你都可能被这个问题迷惑。如何创建备忘单?你能从这篇文章中学到什么?
在机器学习中,没有一个解决方案能解决所有的问题。由于算法的多样性,很难找到正确的算法来解决问题。
然而,没有必要担心。在本文中,我们将介绍如何使用备忘单来简化机器学习方法。您可以使用备忘单来选择适合解决问题的正确算法。

以下是一个备忘单——你需要理解机器学习的技巧。

备忘录使用指南

选择算法时要考虑的因素
有几个因素会影响你的选择。有些特殊的问题需要特殊的解决方法。例如,推荐系统可以用来解决这样的问题。虽然有些类型的问题是开放的,但它们需要反复试验。监督学习、分类和回归是开放问题的解决方案。
1.您希望对数据执行什么操作-分类、回归还是聚类?
2.大小:选择算法时,数据集的大小(不管大小)非常重要。
3.质量:数据集发生了多少变化,数据集是否平衡。
4.数据性质:我们标记数据了吗?模型的输入和输出是如何表示的?
5.时间可用性:你需要多少时间来建立和训练模型。有些模型可以建得更快,但精度不太好。
6.速度或精度:对于可用于生产的模型,您可能对精度有更高的要求,但有时更快的工作模型可以满足您的需求。
如果您想使用备忘单,只需查看图表上的选择选项卡,然后移动到回答问题的箭头。例如:
如果您想减少维度的数量并且不需要主题建模,请使用主成分分析。
如果你想预测一个变量的值并需要更高的精度,你应该尝试使用“随机森林”、“神经网络”或“梯度提升”树。
如果您没有标记数据并希望执行聚类,可以使用k近邻聚类算法。
选择正确的算法
值得一提的是,即使是经验丰富的数据科学家,如果不尝试其他算法,也无法知道哪种算法效果最好。条条大路通罗马,这份备忘录可能不是解决问题的唯一方法。备忘单只希望根据已知的因素为你提供可以使用的算法的指导。

机器学习算法的类型

资料来源:胡志
1.监督学习
监督学习算法是对操作的直接监督。我们使用数据来教授或训练机器,这意味着数据被标上正确的答案。算法用于分析训练数据并获得输入输出映射函数。然后,训练数据可以被一般化,并且该函数可以用于预测未知输入的输出。监督学习主要用于以下两类问题。
分类:在分类问题中,你需要找到输入数据的类型。例如,将图像分类为“狗”或“猫”
回归:在回归问题中,输出是一个实值。请尝试根据输入预测变量的值。
2.半监督学习
监测学习需要使用有标记的数据,如果其他人没有参与类似的项目,这可能很难找到或生成。在半监督方法中,我们使用一些标记数据和未标记数据。
如你所见,数据没有被完全标记,这就是为什么它被称为半监督学习。通过将标记数据和未标记数据相结合,可以提高模型的准确性。
3.无监督学习
无监督学习适用于未标记的数据。机器必须在没有任何监督的情况下找出数据中的模式、相似性和差异,执行聚类并降低维度。
聚类:根据一些标准和相似性,将数据分成一个或多个聚类。例如,客户根据他们的购买行为进行分组。
降维:一些数据特征或维度可能不用于模型训练。使用一些算法,我们可以避免考虑维数和不相关的特征。这个过程叫做降维。
4.加强学习
强化学习可以根据来自环境的反馈来优化代理。当机器做出正确的决定并惩罚其错误的决定时,机构会奖励它。这项研究并不要求我们事先收集数据,然后整理数据。该系统是自我维持的,并试图在现实世界中完善自己。AlphaGO是一个基于强化学习的计算机程序,打败了世界上最好的围棋手。

尾注

资料来源:Pexels
机器学习问题可以通过多种方式解决,您可以根据多种因素选择算法,如准确性、客观性、数据大小和数据属性。您还可以参考备忘单,并快速开始构建模型。一旦问题得到解决并获得结果,就可以进一步探索不同的算法,以找到最适合特定问题的最佳算法。

评论、表扬和关注
让我们分享人工智能学习和发展的干货。
如果重印,请在后台留言并遵守重印规则。
本文由 在线网速测试 整理编辑,转载请注明出处。