(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111663929.9
(22)申请日 2021.12.31
(71)申请人 扬州大学
地址 225009 江苏省扬州市大 学南路88号
(72)发明人 朱金荣 曹海涛 邓小颖 张梦
侯伍岳 张剑云 夏长权
(74)专利代理 机构 南京禹为知识产权代理事务
所(特殊普通 合伙) 32272
代理人 王晓东
(51)Int.Cl.
G06V 40/10(2022.01)
G06V 10/26(2022.01)
G06V 10/44(2022.01)
G06V 10/25(2022.01)
G06V 10/80(2022.01)G06V 10/82(2022.01)
G06K 9/62(2022.01)
G06T 3/40(2006.01)
G06T 7/11(2017.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种基于yolov5的行人检测方法
(57)摘要
本发明公开了一种基于yolov5的行人检测
方法, 包括, 利用主干特征提取网络对输入端输
入的数据进行特征提取; 将提取的所述特征输入
特征加强网络进行加强; 结合预测层预测目标
框, 输出得到检测结果; 本发明通过更改网络结
构, 减少参数, 提升运行速度, 达到更好的实时
性。
权利要求书2页 说明书6页 附图3页
CN 114267052 A
2022.04.01
CN 114267052 A
1.一种基于yo lov5的行人检测方法, 其特 征在于: 包括,
利用主干特 征提取网络对输入端输入的数据进行 特征提取;
将提取的所述特 征输入特 征加强网络进行加强;
结合预测层预测目标框, 输出 得到检测结果。
2.根据权利 要求1所述的基于yolov5的行人检测方法, 其特征在于: 在特征提取之前需
要对数据进行 预处理, 包括:
利用马赛克 数据增强处 理图片;
通过Focus对图片进行切片操作;
通道数量乘4。
3.根据权利要求1或2所述的基于yolov5的行人检测方法, 其特征在于: 所述马赛克数
据增强包括,
将四张图片进行随机 裁剪;
将裁剪后的图片拼接 到一张图上作为训练数据。
4.根据权利要求3所述的基于yolov5的行人检测方法, 其特征在于: 所述切片操作包
括,
在一张图片中每隔一个 像素拿到一个值, 类似于邻近下采样, 得到四张图片;
四张图片互补, 将W、 H信息集中到通道空间;
输入通道扩充了4倍, 即拼接起来的图片相对于原先的RGB三通道模式变成了12个通
道;
将得到的新图片再 经过卷积操作, 得到没有信息 丢失情况 下的二倍下采样特 征图。
5.根据权利要求4所述的基于yolov5的行人检测方法, 其特征在于: 所述特征提取包
括,
将1×1输出后的特征图按照通道均分n块, 每一部 分是xi,i∈{1,2,3,...,n}, 每一个xi
对应一个3 ×3的卷积, 由ki()表示, yi表示ki()的输出;
特征子集xi与ki‑1()的输出相加, 送入ki();
对特征的重复利用, 得到不同数量以及不同感受野大小的输出;
将所有输出进行融合并进行1 ×1的卷积;
6.根据权利要求4或5所述的基于yolov5的行人检测方法, 其特征在于: 对所述特征进
行加强包括,
FPN(特征金字塔网络)高维度向低维度传递语义信息;
PAN(路径聚合网络)低维度向高维度再传递 一次语义信息;
深层的特 征图携带有更强的语义特 征, 较弱的定位信息;
浅层的特 征图携带有较强的位置信息, 和较弱的语义特 征。
7.根据权利要求6所述的基于yo lov5的行人检测方法, 其特 征在于: 还 包括,
所述FPN(特 征金字塔网络)把深层的语义特 征传到浅层, 增强多个尺度上的语义表达;权 利 要 求 书 1/2 页
2
CN 114267052 A
2所述PAN(路径聚合网络)把浅层的定位信息传导到深层, 增强多个尺度上的定位能力。
8.根据权利 要求7所述的基于yolov5的行人检测方法, 其特征在于: 所述预测目标框包
括,
曼哈顿距离, 为两个点之间垂直和水平 距离的总和, 表示 为:
MH(u,v)=|(x1‑x2)|+|y1‑y2|
其中: (x1,y1)为第一个点的坐标值, (x2,y2)为第二个点的坐标值。
9.根据权利要求8所述的基于yo lov5的行人检测方法, 其特 征在于: 还 包括,
在图像中感兴趣的位置周围形成边界框 簇;
在Confluence中, 以任意两个边界框的左上角和右下角坐标的曼哈顿距离作 为边界框
是否为同一簇的判定标准。
10.根据权利要求8或9所述的基于yo lov5的行人检测方法, 其特 征在于:
具体包括:
进行归一化操作, 将坐标缩小到0到1之间, 使图像内通过任意两个大的目标边框和任
意小的目标边框的关系相比较来区分内边界框和目标间边界框 。权 利 要 求 书 2/2 页
3
CN 114267052 A
3
专利 一种基于yolov5的行人检测方法
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 21:47:03上传分享