团体标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111669757.6 (22)申请日 2021.12.3 0 (71)申请人 天翼电子商务有限公司 地址 100037 北京市西城区阜成门外大街 31号4层429D (72)发明人 韩弘炀 傅剑文 陈心童 章建森  周文彬  (51)Int.Cl. G06F 16/2457(2019.01) G06F 16/27(2019.01) G06F 16/28(2019.01) G06F 16/9535(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于多场景 数据融合推荐的方法 (57)摘要 本发明公开了一种基于多场景数据融合推 荐的方法, 包括以下: (1)采集模块: 利用流技术 对用户在第i场景下的曝光和点击数据进行采集 并存储至hive中记为tablei; 应当指出的是, 数 据采集技术及存储形式包括但 不限于以上方式。 本专利针对推荐系统中多场景推荐, 提出一种基 于多场景数据融合推荐的方法, 补充了其他场景 中的用户交互信息, 既丰富了样 本又补充了用户 真实近期交互物料, 能够使用更为丰富的数据进 行建模。 通过提取用户、 物料、 场景相关信息建 模, 利用单个模 型充分学习用户在不同场景下对 物料的兴趣表征, 使 得同一用户在不同场景对同 样的物料有不同的展示顺序, 能够在节省消耗的 同时利用简单的模型得到准确的推荐结果。 权利要求书1页 说明书4页 附图2页 CN 114528323 A 2022.05.24 CN 114528323 A 1.一种基于多场景 数据融合推荐的方法, 其特 征在于, 包括以下: (1)采集模块: 利用流技术对用户在第i场景下的曝光和点击数据进行采集并存储至hive中记为 tablei; 应当指出的是, 数据采集 技术及存储形式包括但不限于以上 方式; (2)数据融合模块: 对于hive中的所有tablei进行样本合并, 丰富用户对物料的交互行为, 并在样本维度上 拼接用户、 物料、 场景等相关补充特征及回溯样本生成日期前t日用户点击的场景&物料 sequence, 对于每条样本, 曝光样本label记为0, 点击样本label记为1, 最终存储至hive中 记为tableall; (3)模型训练模块: a.对于用户近t日点击的场景&物料sequence, 将场景和物料 的embedding进行concat 得到向量序列{Vi}, 并将其与样本中场景与物 料concat后的embedding  V进行att ention操 作(函数f), 得到对当前样本场景&物料sequence的表征A; b.利用attention后的结果A, 与用户embedding  U共同输入一个多层深度网络(函数 g), 有效生成用户在不同场景 下对不同物料的兴趣偏好表征B; B=g(A,B); c.使用用户在不同场景下对不同物料的兴趣偏好表征concat非场景特征的其他特征 embedding形成向量Xin输入一个多层深度网络进行训练, 其损失函数为: (4)多场景推荐模块: a.对于每个场景j用SQL取其场景及召回算法对用户召回的物料相应的特征及其补充 特征, 并根据近t日所有表 tablei取该用户的场景&物料sequence; b.利用训练好的模型对结果进行预测, 每个场景j生成一个推荐结果表resultj储存在 hive中。权 利 要 求 书 1/1 页 2 CN 114528323 A 2一种基于多场景数据融合 推荐的方 法 技术领域 [0001]本发明涉及推荐系统领域, 特别涉及一种基于多场景 数据融合推荐的方法。 背景技术 [0002]传统多场景推荐模型都是每个场景构建一个模型, 这样缺失了用户在 其他场景的 交互行为以及用户实际近期交互行为, 使得在某些场景下对用户推荐效果不够准确。 尽管 少量场景使用了此类交互信息, 但仅在于增加样本, 并未考虑不同场景下用户的兴趣偏好 存在差异; [0003]千人千面形式的个性化推荐已在众多生活中的场景发挥其作用, 不断智能化地满 足用户各方面的喜好, 其准确捕捉用户兴趣的来源就是用户大量的交互数据。 如何利用好 用户的交互数据是推荐系统中的重要环节。 目前推荐系统的使用大多都是每个场景构建一 个模型, 这样无可避免的缺失了用户在其他场景对同样物料行为的交互信息。 即使少量场 景使用了此类交互信息, 也仅在于增加样本, 并未考虑不同场景下用户的兴趣偏好存在差 异; [0004]针对这一实际背景, 本方案提出了一种基于多场景数据 融合推荐的方法, 既能够 利用多个场景中的用户交互信息, 又考虑了用户在不同场景下偏好的差异, 还能够对于多 个场景仅使用单个模型得到每个场景更为准确的推荐 结果, 节约人力物力资源消耗的同时 又简化了模型。 发明内容 [0005]本发明要解决的技术问题是克服现有技术的缺陷, 提供一种基于多场景数据融合 推荐的方法。 [0006]本发明提供了如下的技 术方案: [0007]本发明提供一种基于多场景 数据融合推荐的方法, 包括以下: [0008](1)采集模块: [0009]利用流技术对用户在第i场景下的曝光和点击数据进行采集并存储至hive中记为 tablei; 应当指出的是, 数据采集 技术及存储形式包括但不限于以上 方式; [0010](2)数据融合模块: [0011]对于hive中的所有tablei进行样本合并, 丰富用户对物料的交互行为, 并在样本 维度上拼接用户、 物料、 场景等相关补充特征及回溯样本生成日期前t日用户点击的场景& 物料sequence, 对于每条样本, 曝光样本label记为0, 点击样本label记为1, 最终存储至 hive中记为tableall; [0012](3)模型训练模块: [0013]a.对于用户近t日点击的场景&物料sequence, 将场景和物料的embedding进行 concat得到向量序列{Vi}, 并将其与样本中场景与物料concat后的embedding  V进行 attention操作(函数f), 得到对当前样本场景&物料sequence的表征A;说 明 书 1/4 页 3 CN 114528323 A 3

.PDF文档 专利 一种基于多场景数据融合推荐的方法

文档预览
中文文档 8 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于多场景数据融合推荐的方法 第 1 页 专利 一种基于多场景数据融合推荐的方法 第 2 页 专利 一种基于多场景数据融合推荐的方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 21:47:20上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。