(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211064625.5
(22)申请日 2022.08.31
(71)申请人 北京百度网讯科技有限公司
地址 100085 北京市海淀区上地十街10号
百度大厦2层
(72)发明人 段高华
(74)专利代理 机构 北京同立钧成知识产权代理
有限公司 1 1205
专利代理师 刘文娜 黄健
(51)Int.Cl.
G06F 16/951(2019.01)
G06F 16/9532(2019.01)
G06F 8/53(2018.01)
G06V 20/62(2022.01)
G06T 1/00(2006.01)H04L 9/40(2022.01)
(54)发明名称
数据处理方法及装置
(57)摘要
本公开提供了一种数据处理方法及装置, 涉
及数据处理领域, 尤其涉及智 能搜索领域。 具体
实现方案为: 根据试题搜索日志和试题获取日
志, 确定待处理试题的试题信息。 根据试题信息
访问第一客户端的查询接口, 得到试题信息对应
的第一返回结果, 其中, 第一返回结果是经过加
密处理的。 获取第一客户端的解密函数, 并根据
解密函数对第一返回结果进行解密处理, 得到解
密后的第二返回结果。 根据第二返回结果, 得到
待处理试题对应的解题视频。 本公开的技术方案
可以快速有效的获取到试题所对应的解题视频,
进而可以提升构建解题视频资料库的速度和效
率。
权利要求书4页 说明书16页 附图7页
CN 115357772 A
2022.11.18
CN 115357772 A
1.一种数据处 理方法, 包括:
根据试题搜索日志和试题获取日志, 确定待处 理试题的试题信息;
根据所述试题信 息访问第 一客户端的查询接口, 得到所述试题信 息对应的第 一返回结
果, 其中, 所述第一返回结果是 经过加密处 理的;
获取所述第 一客户端的解密函数, 并根据 所述解密函数对所述第 一返回结果进行解密
处理, 得到解密后的第二返回结果;
根据所述第二返回结果, 得到所述待处 理试题对应的解题视频。
2.根据权利要求1所述的方法, 其中, 所述根据试题搜索日志和试题获取日志, 确定待
处理试题的试题信息, 包括:
根据所述试题搜索日志中的文本搜索日志, 确定所述文本搜索日志中所包括的至少一
个第一试题的第一访问量;
根据所述试题搜索日志中的图片搜索日志, 确定所述图片搜索日志中所包括的至少一
个第二试题的第二访问量;
根据所述试题获取日志, 确定所述试题获取日志中所包括的至少一个第三试题;
根据所述第一访问量、 所述第 二访问量、 所述第 三试题, 确定至少一个待处理试题的试
题信息。
3.根据权利要求2所述的方法, 其中, 所述根据 所述第一访问量、 所述第 二访问量、 所述
第三试题, 确定 至少一个待处 理试题的试题信息, 包括:
在所述至少一个第一试题中, 获取 所述第一访问量高于第一阈值的第一目标 试题;
在所述至少一个第二试题中, 获取 所述第二访问量高于第二阈值的第二目标 试题;
将所述第一目标试题的试题内容、 所述第 二目标试题的试题内容以及所述第 三试题的
试题内容, 确定为所述待处 理试题的试题信息 。
4.根据权利要求1 ‑3任一项所述的方法, 其中, 所述根据所述试题信 息访问第 一客户端
的查询接口, 得到所述试题信息对应的第一返回结果, 包括:
根据所述试题信息, 生成所述试题信息对应的查询图像;
根据所述查询图像访问所述第 一客户端的查询接口, 得到所述查询接口返回的所述试
题信息对应的第一返回结果。
5.根据权利要求1所述的方法, 其中, 所述获取 所述第一 客户端的解密函数, 包括:
获取所述第一 客户端的安装程序;
对所述安装程序进行反编译处 理, 得到所述第一 客户端的反编译 文件;
在所述反编译 文件中获取 所述解密函数。
6.根据权利要求1 ‑5任一项所述的方法, 其中, 所述第 二返回结果中包括第 一格式的视
频文件;
所述根据所述第二返回结果, 得到所述待处 理试题对应的解题视频, 包括:
对所述第一格式的视频文件进行文件解析, 得到 至少一个视频片段;
对所述至少一个视频片段进行合并, 得到初始视频;
对所述初始视频进行视频处理, 得到所述待处理试题对应的解题视频, 所述视频处理
包括如下中的至少一种: 去水印处 理、 裁剪处理、 视频质量调整处 理、 编码信息调整处 理。
7.根据权利要求6所述的方法, 其中, 所述去水印处 理包括:权 利 要 求 书 1/4 页
2
CN 115357772 A
2获取所述初始视频的第一帧图像, 并在所述第一帧图像中识别图像水印, 并确定所述
图像水印在所述第一帧图像中的水印位置;
根据所述水印位置, 对所述初始视频中的各个图像帧依次进行去水印处 理。
8.根据权利要求6所述的方法, 其中, 所述裁 剪处理包括:
获取所述初始视频中第一时段对应的第一音频, 其中, 所述第一时段为所述初始视频
的开始时刻之后的第一预设时长内的时段, 和/或, 所述第一时段为所述视频的结束时刻之
前的第二预设时长内的时段;
对所述第一音频进行语音识别, 得到所述第一音频对应的第一文本;
将所述第一文本和预设文本进行匹配处理, 确定所述第 一文本中和所述预设文本相匹
配的文本片段;
确定所述文本片段在所述初始视频中所对应的匹配时段;
在所述初始视频中, 将所述匹配时段对应的视频片段删除。
9.根据权利要求6所述的方法, 其中, 所述视频质量调整处 理包括:
获取所述第一 客户端对应的预设视频参数;
将所述初始视频的视频参数调整为所述预设视频参数。
10.根据权利要求6 ‑9任一项所述的方法, 其中, 所述第二返回结果中还包括所述视频
文件对应的描述信息;
所述根据所述第二返回结果, 得到所述待处理试题对应的解题视频之后, 所述方法还
包括:
根据所述描述信息, 在数据库中确定和所述描述信息相匹配的目标 试题;
将所述解题视频存储至所述数据库中, 并建立所述解题视频和所述目标试题的关联关
系。
11.一种数据处 理装置, 包括:
确定模块, 用于根据试题搜索日志和试题获取日志, 确定待处 理试题的试题信息;
访问模块, 用于根据所述试题信息访 问第一客户端的查询接口, 得到所述试题信息对
应的第一返回结果, 其中, 所述第一返回结果是 经过加密处 理的;
获取模块, 用于获取所述第一客户端的解密函数, 并根据所述解密函数对所述第一返
回结果进行解密处 理, 得到解密后的第二返回结果;
处理模块, 用于根据所述第二返回结果, 得到所述待处 理试题对应的解题视频。
12.根据权利要求1 1所述的装置, 其中, 所述确定模块具体用于:
根据所述试题搜索日志中的文本搜索日志, 确定所述文本搜索日志中所包括的至少一
个第一试题的第一访问量;
根据所述试题搜索日志中的图片搜索日志, 确定所述图片搜索日志中所包括的至少一
个第二试题的第二访问量;
根据所述试题获取日志, 确定所述试题获取日志中所包括的至少一个第三试题;
根据所述第一访问量、 所述第 二访问量、 所述第 三试题, 确定至少一个待处理试题的试
题信息。
13.根据权利要求12所述的装置, 其中, 所述确定模块具体用于:
在所述至少一个第一试题中, 获取 所述第一访问量高于第一阈值的第一目标 试题;权 利 要 求 书 2/4 页
3
CN 115357772 A
3
专利 数据处理方法及装置
文档预览
中文文档
28 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共28页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 03:03:03上传分享