最后更新:2020-05-09 11:35:38 手机定位技术交流文章
在本文中,让我们先了解归纳学习和直推学习的定义,然后介绍两种学习方法的区别,最后给出一个例子。

理解定义
感应的
归纳是从观察到的训练案例到一般规则的推理,然后应用于测试案例。
归纳学习和我们通常知道的传统的有监督的机器学习是一样的。我们基于标记的训练数据集建立和训练机器学习模型。然后我们使用这个训练好的模型来预测我们测试数据集的标签。
转换
转换是从观察到的特定(训练)案例到特定(测试)案例的推理。
与归纳学习相反,换能学习技术预先观察所有数据,包括训练数据集和测试数据集。我们从观察到的训练数据集学习,然后预测测试数据集的标签。即使我们不知道测试数据集的标签,我们也可以在学习过程中使用这些数据集中的模式和其他信息。
示例性的转导学习方法包括转导SVM(TSVM)和基于图的标记传播算法(LPA)
有什么不同?
主要区别在于,在换能学习的过程中,你在训练模型时已经遇到了训练集和测试集。然而,归纳学习仅在训练模型时遇到训练数据,并将所学模型应用于从未见过的数据集。
转导不能建立预测模型。如果一个新的数据点被添加到测试数据集中,我们将不得不从头开始重新运行算法,训练模型,然后用它来预测标签。另一方面,归纳学习建立了一个预测模型。当遇到新的数据点时,不需要从头开始重新运行算法。
简而言之,归纳学习试图建立一个通用模型,其中任何新的数据点都将基于一组观察到的训练数据点来预测。在这里,您可以预测除点之间的未标记点之外的任何点空。相反,换能学习建立了一个适合于训练数据点和测试它所观察到的数据点的模型。该方法使用已知标记点和附加信息来预测未标记点的标记。
在引入新数据点的情况下,转换学习的成本可能非常高。每次有新的数据点时,都必须重新运行。另一方面,归纳学习最初建立了一个预测模型,新的数据点可以在很短的时间内用较少的计算来标记。

示例演练
假设您有一组点,如图1所示。有四个标记点a、b、c和d。我们的目标是标记剩余的未标记数据点(无色),编号从1到14。如果我们在这项任务中使用归纳学习,我们将不得不使用这4个标记,并建立一个监督学习模型。

图1
乍一看,我们可以看到有两个独立的集群。在归纳学习中,由于我们只有很少的训练样本,很难建立一个能够捕捉到完整数据结构的预测模型。例如,如果使用最近邻算法,边界附近的点(例如,12和14)可以被着色为红色而不是绿色,因为它们比绿色点c和d更靠近红色点a和b(如图2所示)。

图2
如果我们有一些关于数据点的附加信息,例如基于特征如相似性的点之间的连通性信息(如图3所示),我们可以在训练模型和标记未标记点时使用这些附加信息。

图3
例如,我们可以使用转导学习方法(例如基于半监督图的标记传播算法)来使用所有标记和未标记点的结构信息来标记未标记点,如图4所示。沿着边界的点(例如12和14)比红色点连接到更多的绿色点,因此它们被标记为绿色而不是红色。

图4
请注意,由于我们在开始时遇到了所有的训练数据点和测试数据点,并且测试数据还包含一些有用的附加信息,因此我们可以应用转导学习方法,如标签传播。如果一开始没有测试数据点,我们将不得不采用归纳学习方法。
最后的
既然您已经对归纳学习和换能学习及其差异有了基本的了解,那么您就可以在开发下一个机器学习模型时使用这些知识了。
本文由 在线网速测试 整理编辑,转载请注明出处。