最后更新:2020-03-11 10:59:18 手机定位技术交流文章
推荐系统分析:猜猜你喜欢它吗?

每个人都是产品经理
1583757908本文将从最简单的概念开始,逐步解释推荐系统的开发过程和最新实践。从产品经理的角度,阐述了推荐系统所涉及的算法、技术和体系结构。本章是第一章,首先对保荐制度进行概述。
推荐系统是迄今为止应用了人工智能、大数据和云计算等尖端技术的最全面的产品场景之一。它是许多尖端技术的结晶,是数百项成就的复杂而微妙的集合。然而,在画出茧和丝之后,它和许多科学一样简洁而优雅。像“猜你喜欢”这样的功能已经伴随我们很多年了。但是这个功能是如何实现的呢?我想通过这篇文章和你谈谈。在介绍推荐系统之前,
简要介绍了人工智能技术
01解决人工智能问题的两种思路
人工智能算法涵盖概率、统计、高等数学、计算机、大数据等学科的知识,抽象而复杂本文并不打算对人工智能的内涵和外延进行定义解释,而是从一个更具体的角度来阐述这个问题。
机器智能和飞入蓝天是人类几千年来的梦想。此外,在直接仿生思维失败后,这两个前沿科学在改变思维方面取得了突破。
因为看到鸟会飞,制造飞机的第一个想法,就是模仿鸟的结构达芬奇是一位伟大的艺术家和熟练的工匠。他设计了一架非常聪明、像鸟一样的飞机,但它似乎没有任何用处。历史上第一个真正驾驶飞机飞入蓝天的人是莱特兄弟,他让飞机看起来最不像鸟。飞机的诞生是基于流体力学。
同样,在历史上,人工智能有两个主要思想:
是早期的主流思想:模仿人类学习的过程,向机器描述事物的特征,这样机器就能获得与人类相同的认知
根据这个想法,让机器识别一只猫类似于告诉机器一只猫有四条腿、两只眼睛、柔软的皮毛等因为人们就是这样认识猫的然而,这种想法始于1956年,经过10年的研究没有任何进展就被搁置了。
现在是另一种思维方式:让机器从数据本身学习,从而获得类似人类的认知。
因此,我们现在看到的人工智能术语的名称主要是机器学习、深度学习、强化学习等。
根据这个想法,我们需要通过给机器一系列图片和标记来识别哪些是猫,哪些不是猫。机器通过图像数据训练模型,然后使用训练好的模型来识别猫。
推荐系统的想法是一样的。通过让机器学习表示用户喜欢和不喜欢的数据,例如每个用户的点击、购买、分享、收藏和负反馈,机器可以知道用户的偏好,从而实现用户可能喜欢的项目的推荐。根据机器学习的思想,人工智能的实践可以简单地分为三个过程:数据、学习和决策
1。数据
首先,机器需要感知的对象必须通过数据这些数据可能是真实世界中的实际值,如温度、湿度、股票价格等。还有一些数字文件,如图像、声音等。
对于大多数数据,机器不能直接“读取”它们,但是我们需要使用算法从这些数据中提取特征例如,在深度学习图像识别领域,有必要使用多层神经网络来提取图像的基本特征。实践表明,高阶特征可以由低阶特征组成。在下图中,底层的正交边可以组合起来得到脸、汽车、大象和椅子。另一方面,通过多层神经网络进行特征提取后,任何图像都可以获得相似的基本特征。因此,可以简单地认为基本特征的不同组合形成不同的图像,并且可以通过提取图像的基本特征和组合参数来识别图像。
由于数据形式不同,推荐系统算法不能像图像识别算法那样通过叠加神经元层来直接提取特征推荐系统中的特征提取过程需要各种算法的辅助。如果推荐系统需要建立用户肖像和文章肖像,用户的偏好标签和文章的特征标签应该通过算法或规则很好地输入,计算权重,然后输入模型进行学习。
2。学习
此外,学习是一个机器通过算法和通过大量数据的连续迭代优化来训练模型的过程。
3。决策
最后,决策是通过训练好的模型等进行预测或分类。这些都更容易理解
4。概要
一个推荐系统,将由许多模型组成从用户肖像标签的预测模型到推荐的排名模型,它可以分解为数据→学习→决策的过程这是解决问题的方法。
,因为不同性别的用户在项目偏好上有很大差异对于许多平台来说,预测性别是必须的这是一个有监督的学习问题,我们可以这样解决:256个以上的数据首先,选择与用户性别相关的数据。让我们假设化身,昵称,手机型号,用户应用安装列表和点击记录被选中。然后选择出用户数据和已知性别数据中的这些字段。研究选择一个模型进行学习和拟合通常,可以选择逻辑回归模型或决策树模型进行拟合预报用已经学得很好的模型预测未知性别的用户。
03
推荐系统的功能介绍了人工智能的感知、学习和决策三个过程,下面将介绍推荐系统。
在互联网商业平台上有供需双方,如今天的头条、快递、淘宝等。双方的代表是用户和项目在没有推荐系统的情况下,用户和文章之间通常有三种主要的连接方式:小编辑向用户推荐256多篇文章,用户自己搜索需要的文章,用户a向用户B
推荐文章。这三种连接模式满足了大多数要求,并且运行良好。然而,在移动互联网时代,手机的屏幕很小,在单个屏幕上的曝光更少。特别是在流量越来越难获取的时候,平台的主动推荐完全依赖于运营商的编辑,这有明显的局限性:
操作大多推荐公众喜欢的项目,长尾项目暴露不够。大众商品并不是每个人都喜欢的,不准确的推荐会造成交通的浪费。推荐的数量是有限的,内容不能无限期地被删除,用户可以在阅读后继续阅读。为了解决上述问题,我们引入了推荐系统
04推荐系统
的工作流程本质上,推荐过程是根据不同的用户偏好对项目进行排序,然后推荐最好的项目。在
的极端情况下,如果只需要推荐10个项目,我们可以为每个用户对它们进行排序,这不需要很多计算资源。
,但是,当有数百万个推荐项目时,我们不可能对所有用户进行排序。一般来说,推荐结果应该在收到用户请求后的10毫秒内给出,这是不可能在如此短的时间内完成的,因为要对所有项目进行排序。因此,在推荐时,只有一些项目可以排序
推荐系统通常会进行大量点击评估。这里我们以点击率估算为例。系统向用户进行推荐,一般按照以下流程:
如上图所示,向用户做出推荐响应的流程分为三个流程:
召回:从100多万个内容池中快速初始选择候选集初始排序:基于命中率估计的候选集初步排序精细排序:根据需要调整排序1。回忆
在收到用户的请求后,我们需要一些快速算法或规则来从数百万甚至数十亿的项目库中筛选出最可能的项目这个筛选过程被称为召回,一些互联网公司称这个过程为匹配。召回完成后,可以获得数百个推荐的候选集。推荐系统通常有多种召回算法或召回规则,称为多召回。例如:
基于用户肖像的标签召回基于地理位置信息的召回基于文章协同过滤的召回基于流行的产品召回经过2年的召回过程。初始行
完成后,获得的候选集被输入到排序模型中进行排序。该模型将预测每个项目被用户点击的概率,并根据点击概率从高到低进行排序。
,但是这个排名结果通常不是最终推荐给用户的结果,所以这个过程称为初始排名。在第一行之后,通常会为下一步生成几十个推荐结果。
3。精排
上面提到了人工智能的两个想法然而,今天,当第二种想法流行时,并不是第一种想法已经完全消失了。
在推荐系统中,策略产品经理还需要设置一些专家规则。当算法没有学到一些知识时,用这些规则告诉机器如何处理一些问题。精细的布局是需要规则的场景之一。
细行通常是对排序结果进行额外筛选、减重或增重的过程以下是一些常见的精细计时处理:
调整推荐结果以保持每个推荐的多样性如果一次推荐10部华为手机,而且它们都靠得很近,那么这个时候就需要减少搜索结果,比如只有前两部手机是分散的。出于商业目的,流支持被给予一些项目,并且这些项目在推荐结果中排名第一。甚至有些项目,不管是否推荐,都直接插入并放在顶部。在过滤了有违规风险、已被下架或用户不喜欢的文章后,通常会生成8-10个结果并直接推荐给用户。这是整个推荐过程05结论
最后,总结一下,本章有两个要点:
在人工智能问题的实践中,一般有三个步骤:数据,学习和决策面对需要机器学习的问题,首先需要找到机器需要的数据,做好特征提取工作。数据准备好之后,让机器通过选择或构建模型来学习。推荐系统向用户推荐时,要经过三个步骤:召回、初步安排和精细安排。这篇文章最初是由@菠萝王子海发表的。每个人都是产品经理。根据CC0协议
,未经许可,禁止从Unsplash转载图片
本文由 在线网速测试 整理编辑,转载请注明出处。