团体标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111658449.3 (22)申请日 2021.12.3 0 (71)申请人 广东工业大 学 地址 510000 广东省广州市东 风东路729号 (72)发明人 吴亚迪 陈平华  (74)专利代理 机构 东莞市卓易专利代理事务所 (普通合伙) 44777 代理人 黄瀛 (51)Int.Cl. G06F 16/9535(2019.01) G06F 16/635(2019.01) G06F 16/68(2019.01) G06F 16/683(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于音乐多模态数据的用户长短期偏 好推荐预测方法 (57)摘要 本发明公开了一种基于音乐多模态数据的 用户长短期偏好推荐预测方法, 实现了针对音乐 应用程序、 商店和社区, 为用户提供一种精准发 现用户喜好的推荐预测方法, 通过处理音乐的多 模态数据, 研究歌曲的隐含情感信息、 用户的听 歌序列对音乐推荐的不同影 响, 采用注意力机制 和多个LSTM(长短期记忆)网络分别对歌曲情感 和用户长短期偏好进行建模, 最后提出一个新的 混合推荐预测方法, 在一定程度上探索到用户和 歌曲的情感相关性及用户的长短期偏好, 增强音 乐了推荐预测性能。 权利要求书2页 说明书6页 附图1页 CN 114254205 A 2022.03.29 CN 114254205 A 1.一种基于音乐多模态数据的用户长短期偏好推荐预测方法, 其特征在于, 包含以下 步骤: 获取音乐的音频数据信号, 并使用预设的逻辑 回归分配器对所述音频数据信号进行处 理, 生成声学感情特 征; 构建情感词汇库, 并获取所述音乐的文本信息, 根据所述情感词汇库对所述文本信息 进行分析, 以提取音乐情感特征, 所述文本信息包括歌词文本信息以及评论文本信息, 所述 音乐情感特 征包括歌词情感特 征以及评论情感特 征; 使用双层注意力网络分别对所述声学情 感特征以及所述评论情感特征进行处理, 得到 双层注意力机制输出; 获取用户的历史听歌数据, 并根据多个LSTM网络生成隐藏状态序列以及用户短期偏 好; 对所述隐藏状态序列使用时间加权操作和平均池化及加权均值化操作, 生成用户长期 偏好; 利用Softmax函数融合所述双层注意力机制输出、 用户长期偏好以及用户短期偏好, 获 得音乐的概 率分布, 并生成推荐。 2.根据权利要求1所述的一种基于音乐多模态数据的用户长短期偏好推荐预测方法, 其特征在于, 所述获取音乐的音频数据信号, 并使用预设的逻辑回归分配器对所述音频数 据信号进行处 理, 生成声学感情特 征的步骤具体包括: 获取并通过开元提取器对所述音乐的音频信号数据进行提取预处理, 生成声学物理特 征, 所述声学物理特征包括节奏、 强度、 响度、 MFCC、 高音以及相 对应的泛函, 所述泛函包括 范围、 均值、 偏度以及峰度; 使用预设的逻辑回归分析器对所述声学物理特 征进行运 算分类, 生成声学情感特 征。 3.根据权利要求2所述的一种基于音乐多模态数据的用户长短期偏好推荐预测方法, 其特征在于, 所述逻辑回归分析的模型为 其中, 所述 wT为权重矩阵, 所述x为声学物理特 征。 4.根据权利要求3所述的一种基于音乐多模态数据的用户长短期偏好推荐预测方法, 其特征在于, 所述情感词汇库包括数个表情符号以及多个常见的用于表征情感的情感词 汇, 每首音乐对应多个情感类别, 所述 提取音乐情感特 征对步骤执 行后, 还包括步骤: 使用平均 频率公式计算音乐每个所述情 感类别的所述情感词汇的平均频率, 所述平均 频率公式为 其中, 所述PEij表示情感类别在所述文本信息中的出现频率, 表示情感类别中第k个 情感词汇在所述文本信息中出现的次数, N*j表示所述文本信息的总词汇数。 5.根据权利要求4所述的一种基于音乐多模态数据的用户长短期偏好推荐预测方法, 其特征在于, 还包括用户特征、 音乐特征以及时间特征, 所述使用双层注意力网络 分别对所 述声学情感特征以及所述评论情感特征进 行处理, 得到双层注意力机制输出的步骤具体包 括:权 利 要 求 书 1/2 页 2 CN 114254205 A 2将所述声学情感特征、 歌词情感特征、 评论情感特征、 用户特征、 音乐特征以及时间特 征输入至嵌入层中, 以降低输入维数, 分别获得d维embed ding特征向量ev、 el、 ec、 u、 m、 t: 通过所述双层注意力网络分别计算各个输入特征的注意力 权重, 得到双层注意力 机制 输出, 所述计算获得注意力机制输出的公式如下 Zatt=γvev+γlel+γcec+γuu+γmmM+γtt; 其中, 所述γv、 γl、 γc、 γu、 γm、 γt分别为各输入特 征的注意力权 重。 6.根据权利要求5所述的一种基于音乐多模态数据的用户长短期偏好推荐预测方法, 其特征在于, 所述获取用户的历史听歌数据, 并根据多个LSTM网络生成隐藏状态序列以及 用户短期偏好的步骤中, 给定用户u, 使用多个LSTM网络 分别对多个历史 听歌序列数据和当 前听歌序列进行编码: ht=LSTM(xt, ht‑1), t∈{1, 2, …, |Sh|}; 设多个历史听歌序列数据为{mi, , m2,…, mm}、 {m1, , m2,…, mn}, 当前听歌序列为{m1, , m2,…, mt‑1}, 其中ht为LSTM的隐藏状态, xt∈Rd*1为序列ht中第t首音乐的d维嵌入向量, 通过 运算, 在序列ht里的音乐 的编码为 当前听歌序列的 最终隐藏状态ht‑1为所述用户短期偏好的表示。 7.根据权利要求6所述的一种基于音乐多模态数据的用户长短期偏好推荐预测方法, 其特征在于, 所述对所述隐藏状态序列使用时间加权操作和平均池化及加权均值化操作的 步骤包括: 将一周映射 为48个时间段, 计算两 两时间段之间的时间相似性系数 Ti, j=|Hi∩Hj|/|Hi∪Hj|; 其中, Hi为时间段i内所有用户听过的音 乐集合, 当两个时间段重合的音 乐数量越多, 其 相似性越高; 对于一个历史轨 迹Sh, 由用户当前时间段c, 生成历史序列表示, 公式为 其中, 为Sh中当前时间段c与第j个音乐的时间段之 间的时间相似性; 对于当前隐藏状态序列, 进行平均池化操作, 得到当前序列表示, 公式为 将各个历史序列表示与当前序列表示进行加权均值化, 得到用户长期偏好因子Sl, 公式 为 其中, Wl为可训练的权 重矩阵。 8.根据权利要求7所述的一种基于音乐多模态数据的用户长短期偏好推荐预测方法, 其特征在于, 作为本发明另一个优选的实施例, 所述Softmax函数对公式为 最终向用户推荐top ‑N个喜欢的音乐。权 利 要 求 书 2/2 页 3 CN 114254205 A 3

.PDF文档 专利 一种基于音乐多模态数据的用户长短期偏好推荐预测方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于音乐多模态数据的用户长短期偏好推荐预测方法 第 1 页 专利 一种基于音乐多模态数据的用户长短期偏好推荐预测方法 第 2 页 专利 一种基于音乐多模态数据的用户长短期偏好推荐预测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 21:48:07上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。