团体标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111663929.9 (22)申请日 2021.12.31 (71)申请人 扬州大学 地址 225009 江苏省扬州市大 学南路88号 (72)发明人 朱金荣 曹海涛 邓小颖 张梦  侯伍岳 张剑云 夏长权  (74)专利代理 机构 南京禹为知识产权代理事务 所(特殊普通 合伙) 32272 代理人 王晓东 (51)Int.Cl. G06V 40/10(2022.01) G06V 10/26(2022.01) G06V 10/44(2022.01) G06V 10/25(2022.01) G06V 10/80(2022.01)G06V 10/82(2022.01) G06K 9/62(2022.01) G06T 3/40(2006.01) G06T 7/11(2017.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于yolov5的行人检测方法 (57)摘要 本发明公开了一种基于yolov5的行人检测 方法, 包括, 利用主干特征提取网络对输入端输 入的数据进行特征提取; 将提取的所述特征输入 特征加强网络进行加强; 结合预测层预测目标 框, 输出得到检测结果; 本发明通过更改网络结 构, 减少参数, 提升运行速度, 达到更好的实时 性。 权利要求书2页 说明书6页 附图3页 CN 114267052 A 2022.04.01 CN 114267052 A 1.一种基于yo lov5的行人检测方法, 其特 征在于: 包括, 利用主干特 征提取网络对输入端输入的数据进行 特征提取; 将提取的所述特 征输入特 征加强网络进行加强; 结合预测层预测目标框, 输出 得到检测结果。 2.根据权利 要求1所述的基于yolov5的行人检测方法, 其特征在于: 在特征提取之前需 要对数据进行 预处理, 包括: 利用马赛克 数据增强处 理图片; 通过Focus对图片进行切片操作; 通道数量乘4。 3.根据权利要求1或2所述的基于yolov5的行人检测方法, 其特征在于: 所述马赛克数 据增强包括, 将四张图片进行随机 裁剪; 将裁剪后的图片拼接 到一张图上作为训练数据。 4.根据权利要求3所述的基于yolov5的行人检测方法, 其特征在于: 所述切片操作包 括, 在一张图片中每隔一个 像素拿到一个值, 类似于邻近下采样, 得到四张图片; 四张图片互补, 将W、 H信息集中到通道空间; 输入通道扩充了4倍, 即拼接起来的图片相对于原先的RGB三通道模式变成了12个通 道; 将得到的新图片再 经过卷积操作, 得到没有信息 丢失情况 下的二倍下采样特 征图。 5.根据权利要求4所述的基于yolov5的行人检测方法, 其特征在于: 所述特征提取包 括, 将1×1输出后的特征图按照通道均分n块, 每一部 分是xi,i∈{1,2,3,...,n}, 每一个xi 对应一个3 ×3的卷积, 由ki()表示, yi表示ki()的输出; 特征子集xi与ki‑1()的输出相加, 送入ki(); 对特征的重复利用, 得到不同数量以及不同感受野大小的输出; 将所有输出进行融合并进行1 ×1的卷积; 6.根据权利要求4或5所述的基于yolov5的行人检测方法, 其特征在于: 对所述特征进 行加强包括, FPN(特征金字塔网络)高维度向低维度传递语义信息; PAN(路径聚合网络)低维度向高维度再传递 一次语义信息; 深层的特 征图携带有更强的语义特 征, 较弱的定位信息; 浅层的特 征图携带有较强的位置信息, 和较弱的语义特 征。 7.根据权利要求6所述的基于yo lov5的行人检测方法, 其特 征在于: 还 包括, 所述FPN(特 征金字塔网络)把深层的语义特 征传到浅层, 增强多个尺度上的语义表达;权 利 要 求 书 1/2 页 2 CN 114267052 A 2所述PAN(路径聚合网络)把浅层的定位信息传导到深层, 增强多个尺度上的定位能力。 8.根据权利 要求7所述的基于yolov5的行人检测方法, 其特征在于: 所述预测目标框包 括, 曼哈顿距离, 为两个点之间垂直和水平 距离的总和, 表示 为: MH(u,v)=|(x1‑x2)|+|y1‑y2| 其中: (x1,y1)为第一个点的坐标值, (x2,y2)为第二个点的坐标值。 9.根据权利要求8所述的基于yo lov5的行人检测方法, 其特 征在于: 还 包括, 在图像中感兴趣的位置周围形成边界框 簇; 在Confluence中, 以任意两个边界框的左上角和右下角坐标的曼哈顿距离作 为边界框 是否为同一簇的判定标准。 10.根据权利要求8或9所述的基于yo lov5的行人检测方法, 其特 征在于: 具体包括: 进行归一化操作, 将坐标缩小到0到1之间, 使图像内通过任意两个大的目标边框和任 意小的目标边框的关系相比较来区分内边界框和目标间边界框 。权 利 要 求 书 2/2 页 3 CN 114267052 A 3

.PDF文档 专利 一种基于yolov5的行人检测方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于yolov5的行人检测方法 第 1 页 专利 一种基于yolov5的行人检测方法 第 2 页 专利 一种基于yolov5的行人检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 21:47:03上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。