一文带你看懂B站视频推荐

      最后更新:2020-05-21 12:45:03 手机定位技术交流文章

      本文将以站点B为例,详细回答软件如何更有效地向您推送信息。作为创造者和使用者,如何使用推荐系统来回馈自己?

      零售电子商务提供商推荐您最喜爱的日常用品,新闻阅读推荐您最喜爱的知识,视频短片软件推荐您最喜爱的娱乐视频...自个性化推荐算法被广泛应用于各种软件中,成千上万的人已经为互联网用户所熟悉。可以说,这些经常使用的软件可能比消费者自己更了解你的喜好。

      然而,你真的知道这些软件如何能更有效地把这些信息推给你吗?作为创造者和使用者,如何使用推荐系统来回馈自己?本文将以B站为例详细回答这些问题。

      本文的结构如下:

      标签处理:构建内容和用户配置文件创建圆形层:内容群集和用户组智能使用建议:站点B上主控和平台操作I,标签处理:构建内容和用户配置文件

      所谓的“成千上万的人和成千上万的面孔”被放在产品中。人们指的是用户,面孔指的是内容。一方面,由于不同的年龄、个性、爱好和生活经历,用户对内容有不同的需求;另一方面,内容的类型和质量也会影响用户的偏好。用户和内容之间的高效连接和相互满足是推荐系统的最高目标,尤其是推荐算法。

      1.标记内容

      让我们先看一下用户的观点。

      进入b站,有一个明确的动画、音乐、舞蹈、科技按内容类型的一级导航区,以科技区为例,还可以推出科普、社会科学人文、公共讲座等二级导航,当你选择科普栏目时,可以看到环境、科学、生物、气象等这些小类别。

      让我们以罗翔教授的《为什么要严格解释刑法》为例,从技术>社会科学人文频道的角度,进入视频详细页面,可以在页面中间看到与视频相关的信息。这里有三条重要信息。

      首先,播放的视频数量、弹出窗口数量、评论数量和数据排名表现分别为161.1万、26,000、7967,最高排名在全台排名第七。

      第二,喜欢、不喜欢、硬币、收藏品和子物品的数量没有显示,而剩余的可量化数字是241,000、100,000、33,000和7616。

      第三,视频标签,区别更受欢迎的罗翔和高考专辑标签,也有共同的热门话题,如刑法,校园明星起来,厚大,等等。

      这样,您可以获得视频内容的标签。

      -3。-那这些标签是怎么来的?让我们看看在提交过程中创建者可以控制什么。

      从提交页面可以发现,用户上传视频后,有五个项目可以填写,即分区、标题、类型、标签和简介。其中,标签的选择可以定制,推荐来源和参与活动。如果您在提交视频之前和之后对内容图片进行分析,则创建者的相关信息和内容信息可被归类为静态数据,而特定数据性能将被归类为随时间变化的动态数据。

      2。用户标记

      一切都是相互关联的,“你的气质隐藏了你读过的书和走过的路。”它告诉我们,个性特征受阅读习惯和生活经历的影响,用户的浏览、消费等操作行为也隐藏着个人偏好。

      首先,让我们看看站点b的用户将记录哪些信息和行为数据。

      历史浏览行为:

      播放历史记录使用户能够轻松跟踪他们在什么时间观看了什么视频。然而,用户通常不注意他们在哪里看到的,而只关心他们下次点击时是否可以跳过播放的部分。

      然而,播放时间比是判断视频质量的一个重要标准:播放时间短,用户可能只是被播放的数量或标题吸引进来看看,但实际上他并不喜欢这样的内容;播放时间适中。用户可能更喜欢这样的内容,但是视频的持续时间或质量会影响观看的完整性。较长的播放时间反映出用户可能对这些内容感兴趣。

      此外,用户在视频详细信息页面上的评论、收藏或厌恶也反映了他们的个人偏好。评论作为文本数据,也可以从长度、情感偏向和可读性上反映用户对内容的偏好。

      上述可被用户清楚感知的行为被分类为显式行为,而其他类型的操作不容易被用户感知,包括屏幕操作轨迹、停留时间等。,被称为隐性行为。后者不仅用于构建用户档案,还可以用来刺激用户的显性行为。例如,当视频详细页面在B站的停留时间达到一定程度后,就会触发共享图标变成颜色鲜艳的微信图标。

      关注和订阅:

      大学预科课程、主题等。关注和订阅也会暴露用户的兴趣。例如,70%的用户关注列表都是upo,如巫师财经、半佛不朽和金融药丸。当系统评估用户的兴趣时,它很可能会把他们归类为金融发烧友。

      消费者行为:

      除了会员,用户在B站的消费还包括课程、虚拟游戏、表演展览、线下游戏等。但是,消费会留下交易金额、时间、地址、类型等痕迹。在b站数亿活跃用户中,手机游戏月平均付费用户接近150万,直播季付费用户为120万,仅占1%左右。作为“黄金拥有者”,他们不仅在权益享受方面优于普通用户,而且因其卓越的消费能力而被推荐系统“锁定”,并被贴上“良好消费能力”的标签。

      身份信息:

      用户的身份信息包括性别、年龄、教育水平、地理位置等。在允许访问地址簿和在线记录后,该平台还可以获得社交关系和其他产品使用情况,以计算用户对产品的需求。

      总之,本文获得了一个关于用户信息和行为的标签。

      从B站的首页,我们可以发现目前基于兴趣的推荐视频一般可以分为以下几类:关注、高度赞扬的视频、新星计划、关注人们的赞扬、广告和互动视频。这些标签只是基于内容或用户推给用户的标签。然而,通过单个标签处理,仍有空可以在推荐准确度方面进行优化。

      2。构建圈:内容聚类和用户分组

      在内容和用户的标签处理完成后,两者仍然是个体,但是由于标签的相似性,个体将被连接,因此多个个体可以进入同一个圈。权重和相似度通常被用作划分圈内个体关联度的标准。

      1.内容聚类

      内容和内容之间的相似性通常通过与创建者相关的信息(认证、关注)或内容信息(频道、主题活动、关键词)来计算,而数据表示通常用于在排名列表或热点中进行排名和显示。

      该算法通常用于热门列表推荐场景,如热门标签王星、猫、大熊猫等。在动物圈下面。由于内容信息中关键词的相似性,它们被分成相同类别的视频,然后可以集中显示。或搜索场景,根据关键词进行搜索,其中关键词用于与数据库中的创建者或内容信息进行匹配。

      2。用户组

      用户和用户之间的相似性通常由用户行为来计算。这个过程被称为协作过滤,它以基于项目的协作和基于用户的协作为基础框架。

      基于内容的协作:

      主体是内容。根据用户喜欢的视频,找到与这些视频相似的内容,并推荐给用户。与上面提到的内容聚类不同,内容协作的过滤标准是用户行为与内容的相似性,而后者标准不包含用户偏好。

      基于用户的协作:

      主体是用户。根据用户喜欢的视频,找到与用户有相似偏好的用户,然后向用户推荐该组偏好的视频。

      我们将以B站不同视频用户的浏览情况为例来区分这两种推荐方法。假设用户A喜欢观看技术和数字领域的内容,那么站点B会向这些用户推荐哪些视频:

      根据给定的内容分区和浏览用户判断用户的偏好。在基于内容的合作下,系统会向用户A推荐游戏区的内容,因为三个分区的浏览用户相似度较高;然而,通过基于用户的协作,系统将向用户A推荐动画和游戏区域,因为用户A和用户B和用户C的浏览历史更相似,并且该组似乎更喜欢这两个区域。

      该算法在推荐的场景中出现得更频繁。看看下面的例子,可以发现用户最近的观看偏好和对UPs的关注都是舞曲,所以在主页上推荐的类似视频的比例可以达到60%以上。

      3。巧妙使用推荐:站B和平台操作的上位

      1.主要操作建议

      (1)内容冷启动

      对于B站新生成的视频,其数据性能在短期内没有很高的参考价值,因此推荐系统可以参考内容侧的静态信息。从创建者的相关信息来看,过去记录较好的UPC所有者在冷启动阶段将获得更高的推荐。从内容信息来看,标题、更新时间、关键词和封面是主要因素。

      (2)持续创新能力的培养

      对于刚果爱国者联盟的所有者来说,标题和关键词的选择只是一种短期的哗众取宠。获得稳定关注和预期收益的关键在于提高内容质量和培养他们的持续创新能力。基于平台对内容的原创性、垂直性和传播性的衡量,万国邮联的所有者可以更具体地寻找他们擅长和具有高热点的部分,并建立他们自己的创新周期系统,以保持更新时间和内容质量的稳定性。

      (3)普通用户也可以培训自己的等候名单

      利用推荐算法的机制,普通用户也可以参考其原理,训练自己的推荐列表,从而合理利用站点b。例如,喜欢分享科普知识的用户在关注类似的科普视频、延长科普视频播放时间、添加表扬、评论和分享行为后,会发现网页推送更符合他们的兴趣。

      2.平台运营建议

      (1)用户冷启动

      相对于内容,用户还将面临从注册到活动从0到1的过程。在此期间,该平台最重要的目的是通过高质量的内容提高用户活动和保留率。与行为数据相比,身份信息是平台能够获得的第一手信息,比如根据手机品牌对用户偏好进行第一轮兴趣推测。

      然而,为了留住用户,该平台更重要的任务是找出白人小用户的兴趣点,给他们贴上标签,并划分兴趣圈。一方面,该平台可以通过对某个渠道的强力曝光,逐步发掘用户的兴趣,锁定特定的分区,逐步缩小范围,或者根据年龄属性进行用户协同推荐,这是一个多维度的问题。另一方面,平台可以主动使用用户在初始阶段主动选择的分区和关键字搜索行为来逐步构建简档。

      (2)内容多样性和质量优化

      该平台提供的频道有限,B站每月平均PUG视频提交量可达310万。显然,仅仅将如此大量的视频分成几个标签是远远不够的。因此,B站不仅允许创建者向视频添加现有标签和自定义标签,还允许观众向视频添加标签以丰富视频维度。

      从质量的角度来看,B站现在已经扩展了视频的审查流程,这意味着对视频真实性、原创性和价值导向的审查将更加严格。这种优化不仅是对用户的尊重,也有利于平台的长期维护。

      (3)推荐的算法也应该跳出封地

      推荐算法的怪圈在于“信息茧室”。一个实施例是,用户消费特定类型的内容越多,系统将推荐的相似内容越多,而其他内容将被隔离。另一个实施例是数据越好,推荐的内容越好,而长尾视频没有早期。

      对于前者,b站的推荐系统不会停留在用户已经感兴趣的推荐上,而是会鼓励用户在探索中找到自己更多样化的兴趣,这是基于用户的协作推荐优于基于内容的协作推荐的地方。

      作为对后者的回应,英国广播公司推出了关于长尾视频曝光的新星计划(详情请参考“从三个方面解读:英国广播公司用户激励系统”),并将增加主页推荐的权重。

      (4)推荐系统>推荐算法

      推荐算法并不等同于推荐系统,人工编辑也有它的位置。推荐算法下的信息流容易出现热点话题刷屏等问题,而人机结合的推荐有时能在价值和新鲜话题的回应中起到更为收尾的作用。

      (5)上师对持续创作的指导

      Upmaster不断创造的动机不仅来自经济激励,也来自心理激励,如成就感和社会互动。推荐算法的合理应用可以在满足创作者心理需求的同时带来经济激励。

      特别值得一提的是,B站每月的活跃用户数已达到一百万。如何根据活动、注意力和创作质量三个维度合理分配推荐比例,是B站运营中亟待解决的问题之一

      作者:47岁,专注于内容和社交产品,相信保持锻炼,保持学习,保持乐观。

      这篇文章最初由@47发表。每个人都是产品经理。未经允许禁止复制。

      主题地图来自网络。

      本文由 在线网速测试 整理编辑,转载请注明出处,原文链接:https://www.wangsu123.cn/news/7196.html

          热门文章

          文章分类