(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111654479.7
(22)申请日 2021.12.3 0
(71)申请人 畅捷通信息技 术股份有限公司
地址 100094 北京市海淀区永丰路9号院3
号楼3层
(72)发明人 郭帆 王胜辉 熊昌伟
(74)专利代理 机构 北京智乾知识产权代理事务
所(普通合伙) 11552
代理人 王利娟
(51)Int.Cl.
G06V 10/764(2022.01)
G06V 10/82(2022.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种基于深度学习的多云数据异常检测方
法和系统
(57)摘要
本发明提出一种基于深度学习的多云数据
异常检测方法和系统。 其中, 方法包括: 将数据的
时间序列输入训练好的深度学习网络, 得到数据
的重构序列; 应用数据的时间序列和数据的重构
序列计算重构误差, 再应用重构误差计算异常分
数阈值; 如果实时的数据的时间序列中的数值超
过所述异常分数阈值, 则认为所述数值为异常
值。 本发明提出的方案, 基于深度学习网络实现
的多云数据异常检测更精准的异常告警, 从而提
高多云数据组件 数据的准确性, 快速定位数据 异
常, 保证多云平台的稳定性和健壮性。
权利要求书2页 说明书7页 附图3页
CN 114332537 A
2022.04.12
CN 114332537 A
1.一种基于深度学习的多云数据异常检测方法, 其特 征在于, 所述方法包括:
步骤S1、 采集多个云平台的数据的时间序列;
将正常的数据的时间序列分成四个子集,其中N1子集用于超参数选择, N2子集用于深
度学习网络训练, N3子集用于 常分数阈值的学习, N4子集用于测试; 将异常数据的时间序列
分为两个子集, A1子集用于学习常 分数阈值, A 2用于测试;
步骤S2、 将所述 N2子集的数据的时间序列输入深度学习网络进行训练, 输出重构序列;
步骤S3、 将所述A1子集的数据的时间序列输入训练好的深度学习网络, 得到A1子集的
数据的重构序列;
步骤S4、 应用所述A 1子集的数据的时间序列和A 1子集的数据的重构序列计算A 1子集的
重构误差, 再应用所述A1子集的重构误差计算异常 分数阈值 τ;
步骤S5、 如果实时的数据的时间序列中的数值超过所述异常分数阈值, 则认为所述数
值为异常值。
2.根据权利要求1所述的一种基于深度 学习的多云数据异常检测方法, 其特征在于, 在
所述步骤S4中, 所述计算异常 分数阈值 τ 的具体方法包括:
应用所述A1子集的重构误差计算A1子集的异常估计阈值a(A1), 将所述异常估计阈值
作为异常 分数阈值 τ, 具体公式包括:
a(·)=(e(i)‑μ )TΣ‑1(e(i)‑μ )
其中,
μ和Σ为正态分布N( μ,Σ)的参数;
e(i)为某子集的重构误差;
e(i)=X(i)‑X’(i);
X(i)为某子集的数据的时间序列;
X’(i)为某子集的数据的重构序列;
T为转置。
3.根据权利要求2所述的一种基于深度 学习的多云数据异常检测方法, 其特征在于, 在
所述步骤S4中, 所述计算异常 分数阈值 τ 的具体方法还 包括:
应用N3子集的重构误差计算 N3子集的异常估计阈值a(N3);
应用所述N3子集的异常估计阈值a(N3)计算AUC值, 所述AUC值为ROC曲线下方的面积
值;
将所述AUC值作为异常 分数阈值 τ。
4.根据权利要求3所述的一种基于深度 学习的多云数据异常检测方法, 其特征在于, 在
所述步骤S4中, 所述计算异常 分数阈值 τ 的具体方法还 包括:
应用所述A1子集的重构误差计算所述A1子集的异常估计阈值a(A1);
应用N3子集的重构误差计算 N3子集的异常估计阈值a(N3);
应用所述N3子集的异常估计阈值a(N3)计算AUC值, 所述AUC值为ROC曲线下方的面积
值;
取所述A1子集的异常估计阈值与AUC值的较大值作为异常 分数阈值 τ。
5.根据权利要求1所述的一种基于深度 学习的多云数据异常检测方法, 其特征在于, 在
所述步骤S2中, 所述深度学习网络的输入 还包括:权 利 要 求 书 1/2 页
2
CN 114332537 A
2N2子集的数据的统计指标。
6.根据权利要求5所述的一种基于深度 学习的多云数据异常检测方法, 其特征在于, 在
所述步骤S2中, 所述统计指标包括:
N2子集的数据的最大值、 N2子集的数据的最小值、 N2子集的数据的均 值、 N2子集的数据
的中位数和N2子集的数据的方差 。
7.根据权利要求1所述的一种基于深度 学习的多云数据异常检测方法, 其特征在于, 在
所述步骤S2中, 所述深度学习网络的输入 还包括:
N2子集的数据的时间序列的倒序。
8.一种用于基于深度学习的多云数据异常检测系统, 其特 征在于, 所述系统包括:
第一处理模块, 被 配置为, 采集多个云平台的数据的时间序列;
将正常的数据的时间序列分成四个子集,其中N1子集用于超参数选择, N2子集用于深
度学习网络训练, N3子集用于 常分数阈值的学习, N4子集用于测试; 将异常数据的时间序列
分为两个子集, A1子集用于学习常 分数阈值, A 2用于测试;
第二处理模块, 被配置为, 将所述N2子集的数据的时间序列输入深度学习网络进行训
练, 输出重构序列;
第三处理模块, 被配置为, 将所述A1子集的数据的时间序列输入训练好的深度学习网
络, 得到A1子集的数据的重构序列;
第四处理模块, 被配置为, 应用所述A1子集的数据的时间序列和A1子集的数据的重构
序列计算A1子集的重构误差, 再应用所述A1子集的重构误差计算异常 分数阈值 τ;
第五处理模块, 被配置为, 如果实时的数据的时间序列中的数值超过所述异常分数阈
值, 则认为所述数值 为异常值。
9.一种电子设备, 其特征在于, 所述电子设备包括存储器和处理器, 所述存储器存储有
计算机程序, 所述处理器执行所述计算机程序时, 实现权利要求1至7中任一项所述的一种
基于深度学习的多云数据异常检测方法中的步骤。
10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有计算机
程序, 所述计算机程序被处理器执行时, 实现权利要求1至7中任一项所述的一种基于深度
学习的多云数据异常检测方法中的步骤。权 利 要 求 书 2/2 页
3
CN 114332537 A
3
专利 一种基于深度学习的多云数据异常检测方法和系统
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 21:47:38上传分享