团体标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111658449.3 (22)申请日 2021.12.3 0 (71)申请人 广东工业大 学 地址 510000 广东省广州市东 风东路729号 (72)发明人 吴亚迪 陈平华 (74)专利代理 机构 东莞市卓易专利代理事务所 (普通合伙) 44777 代理人 黄瀛 (51)Int.Cl. G06F 16/9535(2019.01) G06F 16/635(2019.01) G06F 16/68(2019.01) G06F 16/683(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于音乐多模态数据的用户长短期偏 好推荐预测方法 (57)摘要 本发明公开了一种基于音乐多模态数据的 用户长短期偏好推荐预测方法, 实现了针对音乐 应用程序、 商店和社区, 为用户提供一种精准发 现用户喜好的推荐预测方法, 通过处理音乐的多 模态数据, 研究歌曲的隐含情感信息、 用户的听 歌序列对音乐推荐的不同影 响, 采用注意力机制 和多个LSTM(长短期记忆)网络分别对歌曲情感 和用户长短期偏好进行建模, 最后提出一个新的 混合推荐预测方法, 在一定程度上探索到用户和 歌曲的情感相关性及用户的长短期偏好, 增强音 乐了推荐预测性能。 权利要求书2页 说明书6页 附图1页 CN 114254205 A 2022.03.29 CN 114254205 A 1.一种基于音乐多模态数据的用户长短期偏好推荐预测方法, 其特征在于, 包含以下 步骤: 获取音乐的音频数据信号, 并使用预设的逻辑 回归分配器对所述音频数据信号进行处 理, 生成声学感情特 征; 构建情感词汇库, 并获取所述音乐的文本信息, 根据所述情感词汇库对所述文本信息 进行分析, 以提取音乐情感特征, 所述文本信息包括歌词文本信息以及评论文本信息, 所述 音乐情感特 征包括歌词情感特 征以及评论情感特 征; 使用双层注意力网络分别对所述声学情 感特征以及所述评论情感特征进行处理, 得到 双层注意力机制输出; 获取用户的历史听歌数据, 并根据多个LSTM网络生成隐藏状态序列以及用户短期偏 好; 对所述隐藏状态序列使用时间加权操作和平均池化及加权均值化操作, 生成用户长期 偏好; 利用Softmax函数融合所述双层注意力机制输出、 用户长期偏好以及用户短期偏好, 获 得音乐的概 率分布, 并生成推荐。 2.根据权利要求1所述的一种基于音乐多模态数据的用户长短期偏好推荐预测方法, 其特征在于, 所述获取音乐的音频数据信号, 并使用预设的逻辑回归分配器对所述音频数 据信号进行处 理, 生成声学感情特 征的步骤具体包括: 获取并通过开元提取器对所述音乐的音频信号数据进行提取预处理, 生成声学物理特 征, 所述声学物理特征包括节奏、 强度、 响度、 MFCC、 高音以及相 对应的泛函, 所述泛函包括 范围、 均值、 偏度以及峰度; 使用预设的逻辑回归分析器对所述声学物理特 征进行运 算分类, 生成声学情感特 征。 3.根据权利要求2所述的一种基于音乐多模态数据的用户长短期偏好推荐预测方法, 其特征在于, 所述逻辑回归分析的模型为 其中, 所述 wT为权重矩阵, 所述x为声学物理特 征。 4.根据权利要求3所述的一种基于音乐多模态数据的用户长短期偏好推荐预测方法, 其特征在于, 所述情感词汇库包括数个表情符号以及多个常见的用于表征情感的情感词 汇, 每首音乐对应多个情感类别, 所述 提取音乐情感特 征对步骤执 行后, 还包括步骤: 使用平均 频率公式计算音乐每个所述情 感类别的所述情感词汇的平均频率, 所述平均 频率公式为 其中, 所述PEij表示情感类别在所述文本信息中的出现频率, 表示情感类别中第k个 情感词汇在所述文本信息中出现的次数, N*j表示所述文本信息的总词汇数。 5.根据权利要求4所述的一种基于音乐多模态数据的用户长短期偏好推荐预测方法, 其特征在于, 还包括用户特征、 音乐特征以及时间特征, 所述使用双层注意力网络 分别对所 述声学情感特征以及所述评论情感特征进 行处理, 得到双层注意力机制输出的步骤具体包 括:权 利 要 求 书 1/2 页 2 CN 114254205 A 2将所述声学情感特征、 歌词情感特征、 评论情感特征、 用户特征、 音乐特征以及时间特 征输入至嵌入层中, 以降低输入维数, 分别获得d维embed ding特征向量ev、 el、 ec、 u、 m、 t: 通过所述双层注意力网络分别计算各个输入特征的注意力 权重, 得到双层注意力 机制 输出, 所述计算获得注意力机制输出的公式如下 Zatt=γvev+γlel+γcec+γuu+γmmM+γtt; 其中, 所述γv、 γl、 γc、 γu、 γm、 γt分别为各输入特 征的注意力权 重。 6.根据权利要求5所述的一种基于音乐多模态数据的用户长短期偏好推荐预测方法, 其特征在于, 所述获取用户的历史听歌数据, 并根据多个LSTM网络生成隐藏状态序列以及 用户短期偏好的步骤中, 给定用户u, 使用多个LSTM网络 分别对多个历史 听歌序列数据和当 前听歌序列进行编码: ht=LSTM(xt, ht‑1), t∈{1, 2, …, |Sh|}; 设多个历史听歌序列数据为{mi, , m2,…, mm}、 {m1, , m2,…, mn}, 当前听歌序列为{m1, , m2,…, mt‑1}, 其中ht为LSTM的隐藏状态, xt∈Rd*1为序列ht中第t首音乐的d维嵌入向量, 通过 运算, 在序列ht里的音乐 的编码为 当前听歌序列的 最终隐藏状态ht‑1为所述用户短期偏好的表示。 7.根据权利要求6所述的一种基于音乐多模态数据的用户长短期偏好推荐预测方法, 其特征在于, 所述对所述隐藏状态序列使用时间加权操作和平均池化及加权均值化操作的 步骤包括: 将一周映射 为48个时间段, 计算两 两时间段之间的时间相似性系数 Ti, j=|Hi∩Hj|/|Hi∪Hj|; 其中, Hi为时间段i内所有用户听过的音 乐集合, 当两个时间段重合的音 乐数量越多, 其 相似性越高; 对于一个历史轨 迹Sh, 由用户当前时间段c, 生成历史序列表示, 公式为 其中, 为Sh中当前时间段c与第j个音乐的时间段之 间的时间相似性; 对于当前隐藏状态序列, 进行平均池化操作, 得到当前序列表示, 公式为 将各个历史序列表示与当前序列表示进行加权均值化, 得到用户长期偏好因子Sl, 公式 为 其中, Wl为可训练的权 重矩阵。 8.根据权利要求7所述的一种基于音乐多模态数据的用户长短期偏好推荐预测方法, 其特征在于, 作为本发明另一个优选的实施例, 所述Softmax函数对公式为 最终向用户推荐top ‑N个喜欢的音乐。权 利 要 求 书 2/2 页 3 CN 114254205 A 3
专利 一种基于音乐多模态数据的用户长短期偏好推荐预测方法
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-18 21:48:07
上传分享
举报
下载
原文档
(614.8 KB)
分享
友情链接
DB11-T 1535-2018 供热管网节能监测 北京市.pdf
华为 Java语言编程规范.pdf
GB-T 1420-2015 海绵钯.pdf
GB-T 42433-2023 珠宝玉石鉴定 红外光谱法.pdf
GB-T 971-2008 滚丝轮.pdf
GB-T 30659-2014 假肢和矫形器 要求和试验方法.pdf
TB-T 3504-2018 列车接近预警地面设备.pdf
GB-T 18607-2017 石油天然气工业 钻井和采油设备 往复式整筒抽油泵.pdf
框架架构TOGAF学习指南.pdf
腾讯安全 物联网汽车安全.pdf
GB-T 11615-2010 地热资源地质勘查规范.pdf
DB65-T 3902-2016 烟花爆竹批发、零售及储存库事故隐患排查技术规范 新疆维吾尔自治区.pdf
GB-T 10811-2022 釉下-中彩日用瓷器.pdf
NY-T 3544-2020 烟粉虱测报技术规范 露地蔬菜.pdf
GB-T 2847-2005 用于水泥中的火山灰质混合材料.pdf
GB-T 23020-2013工业企业信息化和工业化融合评估规范.pdf
GA DSJ 351-2019 公安大数据安全 零信任体系技术设计要求.pdf
NY-T 4375-2023 一体化土壤水分自动监测仪技术要求.pdf
DB31-T 73-2020 水泥粉磨系统运行管理与节能监测 上海市.pdf
DB32-T 4664-2024 涉危险化学品生产企业特种设备双重预防机制建设实施规范 江苏省.pdf
1
/
3
10
评价文档
赞助2元 点击下载(614.8 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。