亚博ag拜仁合作伙伴_你以为Youtube只是个简单视频网站?来看看这个

本文摘要:概述YouTube所用的推荐系统是目前规模最大、设备最先进的行业推荐系统之一。

概述YouTube所用的推荐系统是目前规模最大、设备最先进的行业推荐系统之一。在这篇论文中,我们在高水平上叙述了这个系统,重点关注了深度自学带来的巨大性能提高。本文根据典型的两阶段信息检索的二分法,首先详细说明了深度候选分解模型。

通过设计、回归、确保对用户影响很大的巨大推荐系统,我们还获得了简单的经验教训和意见。系统阐述了我们推荐系统的整体结构如图2右图所示。系统由两个神经网络组成:一个作为候选分解,另一个作为排名。其中候选分解网络从用户YouTube活动历史中提取事件作为输出,从大视频库中搜索小数据集(数百个视频)。

这些候选人一般指出与用户有正确的关联性。该候选分解网络仅通过协同过滤器获得普遍个性化。用户之间的相似性可以通过粗粒度特征(例如视频观看的ID、单词搜索和人口特征统计资料)传达。推荐列表中经常出现的最差推荐必须密切相关,具备低解职率(recall)的候选人集中在区分比较重要性上。

排名网络通过描述视频和用户特征子集的希望目标函数来评价各视频,完成排名任务。根据分数向用户展示最高分数的视频。

两个阶段的推荐方法允许我们从相当大的(数百万)语料库推荐。与此同时,设备上经常出现的少量视频是个性化的用户内容。此外,该设计需要与其他来源分解的候选人混合,如在该早期工作[3]中所述。在研究开发过程中,我们普遍用于非网络指标(精度、解职率、rankingloss),引领我们系统的递归改良。

但是,为了最后测量算法和模型的效果,我们依赖于通过动态实验进行A/B测试。在一个动态实验中,我们的能量在点击率、观赏时间和许多用户参与度指标中容易发现的变化。这是最重要的,因为动态A/B测试结果不总是与离线实验有关。图2:推荐系统结构:候选视频通过细管状流程从大量视频中搜索并排名,然后将其中一小部分展示给用户。

图3:深度候选分解模型结构:映射的密集特征与密集特征相结合。等级联合将星型大小的密集ID转换为适当隐蔽层输出的相同宽度的向量之前,映射取得了平均值。

所有隐蔽层都是完全训练中,采样用的softmax输入上的梯度上升最大限度地减少了交叉膦损失。在服务中,用近似的邻居搜索分解数百个候选视频。图4:对于等价的视频,模型需要以样品年龄(exampleage)为特征训练,正确传达数据中的上载时间和依赖时间的人气程度。

没有这个特征,这个模型就不会在训练窗口预测平均值。图5:模型自由选择标签和输出对离线评价有挑战性,但对动态性能有很大影响。如图所示,实心点是什么?是网络输出的特征,中空点?被删除了。

我们在A/B测试中发现了预测未来观赏(5b)的表现。如5b右图所示,样品年龄应对tmax?tn,其中tmax是训练数据中仅次于观测时间。图6:描绘了映射的分类特征(包括一价特征和多价特征)的深度排名系统结构,这些特征具有共享的映射和规范化的倒数特征的应该。

所有的层都是相连的。在实践中,必须向网络传递数百个特点。结论叙述了推荐YouTube视频的深度神经网络结构,分为候选分解和排名两个问题。

我们的深度协同过滤器模型需要吸收很多信号,用于深层建模交互,其性能比YouTube原本使用的矩阵分解方法高。与科学相比,自由选择推荐的代理问题看起来更rogateproblem)看起来更加艺术,并且通过提供不平面的领导观赏发现了不道德(co-watchavior)和预防未来信息的泄漏,对未来观赏的分类最好在动态评价中表现出来。

引导来自分类器的判断信号也是取得良好结果的关键,否则模式不会对代理问题产生数值过无法很好地切换到主页。我们发现了以训练样品的年龄为输出特征,去除了与过去相比的固有偏差(bias),允许模型传达人气录像的时间是不道德的。这种改良的线下维持了精准的亲率,同时在A/B测试中明显减少了近期上传视频的观看时间。

名单是一个更经典的机器学习问题,但我们深刻的自学方法在性能上达到了以前观赏时间预测的线性和基于树根的方法。推荐系统特别受益于用户过去和事物之间的不道德特征。

深度神经网络必须与类别和倒数特征的类似密切相关,分别用于映射和分位数标准化。我们找到深层可以有效地对数百个特征的非线性互动建模。逻辑回归(Logisticregression)根据向训练样本表现权重进行变更,其中给予观赏时间的是样本,没有观赏的是胜样本,可以自学相似模型预测观赏时间的概率。这种方式比必要时预测点击率更好,在观赏时间的权重排名评价指标上更好。

本文关键词:亚博ag拜仁合作伙伴

本文来源:亚博ag拜仁合作伙伴-www.sdxwbxg.com

相关文章