团体标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111681650.3 (22)申请日 2021.12.3 0 (71)申请人 西安电子科技大 学 地址 710071 陕西省西安市雁塔区太白南 路2号西安电子科技大 学北校区 (72)发明人 郭宝龙 张靖晗 李泽坤 蒋元淑  (74)专利代理 机构 郑州知倍 通知识产权代理事 务所(普通 合伙) 41191 专利代理师 李玲玲 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于迁移学习的垃圾图像分类方法 (57)摘要 本发明公开了一种基于迁移学习的垃圾图 像分类方法, 改善了ShuffleNet  V2网络分类准 确率较低的问题。 该发明对预处理后的垃圾图像 数据集按N:M的比例分配为训练集和验证集; 根 据网络模型, 加入压缩激励网络和Leak y ReLU激 活函数, 并在末端增添Flatten层和三层全连接 层建立垃圾 分类网络模型, 得到初始分类神经网 络; 将ImageNet图像 数据集中的权重参数导入初 始分类神经网络, 再训练网络; 将垃圾图片输入 训练完成的分类神经网络, 得到垃圾分类结果。 该技术增加压缩激活网络, 通过学习的方式获取 到每个特征通道的重要特征, 抑制对当前任务不 重要的特征, 增强通道间信息交流的能力, 提高 分类任务的准确率。 权利要求书2页 说明书6页 附图2页 CN 114463578 A 2022.05.10 CN 114463578 A 1.一种基于 迁移学习的垃圾图像分类方法, 其特 征在于: 含有以下步骤: 步骤1、 收集已经分好类的垃圾图像, 得到初始垃圾图像数据集; 步骤2、 对于初始垃圾图像数据 集进行随机裁剪, 得到224 ×224大小的图像, 再以0.5概 率进行随机水平旋转, 将图像转换为Tensor后, 进行归一 化处理; 步骤3、 对预处 理后的垃圾图像数据集按N:M的比例分配为训练集和验证集; 步骤4、 根据ShuffleNet  V2网络模型, 加入压缩激励网络和LeakyReLU激活函数建立垃 圾分类网络模 型, 并在末端增添Flatten层和三层 全连接层建立垃圾分类网络模型, 从前往 后依次为卷积层, BN层, Leaky  ReLU激活函数, 最大池化层, stage2, 压缩激活网络, stage3, 压缩激活网络, stage4, 压缩激活网络, 卷积层, BN层, Leaky  ReLU激活函数, 全局池化层, Flatten层, 第一全连接层, BN层, 第二全连接层, BN层和第三全连接层, 得到初始分类神经 网络; 步骤5、 将ImageNet图像数据 集中的权重参数导入初始分类神经网络, 再将网络进行训 练, 得到训练完成的分类神经网络; 步骤6、 将垃圾图片输入训练完成的分类神经网络, 得到垃圾分类结果。 2.根据权利要求1所述的基于迁移学习的垃圾图像分类方法, 其特征在于: 所述步骤2 中调用torchvision中的transforms.Resize()函数改变输入图像尺寸为256 ×256, 再调 用transforms.CenterCrop()函数将图像随机裁剪为224 ×224大小的图像, 然后调用 transforms .ToTensor( )函数将裁剪后的图像转换为Tensor, 最后调用 transform s.Normalize()函数将图像进行归一 化处理。 3.根据权利要求1所述的基于迁移学习的垃圾图像分类方法, 其特征在于: 所述步骤4 中的卷积层由3 ×3×112大小的卷积核构成, 其padding深度为0, stri de值为2; 步骤4中调 用torch中的nn.BatchNorm2d()函数或nn.BatchNorm1d()函数生成BN层来实现批量归一 化; 步骤4中调用torch中的nn.Leaky  ReLU()函数得到激活函数Leaky  ReLU, 并且负值斜 率值为0.001; 步骤4中的最大池化层的池化窗口大小为3 ×3, 其padding深度为1, stride值 为2。 4.根据权利要求1所述的基于迁移学习的垃圾图像分类方法, 其特征在于: 所述步骤4 中的stage2、 stage3和stage4, 其均由shufflenet单元组成, 具体包括基本 单元和下采样单 元, stage2由1个下采样单元和3个基本单元组成, stage3由1个下采样单元和7个基本单元 组成, sta ge4由1个下采样单 元和1个基本单元组成, 下采样单 元含有以下步骤: 4.1.1、 由步骤2得到的图像, 将输入经过两个分支的卷积操作, 一个分支进行2个卷积 操作, 从前往后依次为卷积核大小为3 ×3、 stride为2的DW卷积层, BN层, 卷积核大小为1 ×1 卷积层, BN层, Leaky  ReLU激活函数; 另一个分支进行3个卷积操作, 从前往后依次为卷积核 大小为1×1卷积层, BN层, Leaky  ReLU激活函数, 卷积核大小为3 ×3、 stride为2的DW卷积 层, BN层, 卷积核大小为1 ×1卷积层, BN层, Leaky  ReLU激活函数; 4.1.2、 将两个分支进行co ncat操作重排 通道, 保证通道之间信息的交流; 4.1.3、 经 过channel shuffle得到输出结果; 基本单元含有以下步骤: 4.2.1、 通过c hannel split的方式将输入通道分割为两个分支;权 利 要 求 书 1/2 页 2 CN 114463578 A 24.2.2、 对于两个分支, 其中一个分支不改变, 做同等映射, 另一个分支进行3个卷积操 作, 从前往后依次为卷积核大小为1 ×1卷积层, BN层, Leaky  ReLU激活函数, 卷积核大小为3 ×3、 stride为1的DW卷积层, BN层, 卷积核大小为1 ×1卷积层, BN层, Leaky  ReLU激活函数; 4.2.3、 将两个分支进行co ncat操作重排 通道, 保证通道之间信息的交流; 4.2.4、 经 过channel shuffle得到输出结果。 5.根据权利要求1所述的基于迁移学习的垃圾图像分类方法, 其特征在于: 所述步骤4 中的压缩激励网络包括Sque eze操作、 Excitati on操作和Scale操作, 步骤4.3.1、 X∈RW'×H'×C'为输入宽度, 首 先经过卷积映射变换 Ftr得到U∈RW×H×C; 步骤4.3.2、 执行Squ eeze操作Fsq(·), 通过GlobalAv erage Pooling得到 当前特征图的 全局压缩量, 即: 步骤4.3.3、 执 行Excitati on操作Fex(·,W)得到特 征图中不同c hannel的权重, 即: s=Fex(z,W)=σ(g(z,W) )=σ(W2δ(W1z)) 步骤4.3.4、 经过Scale操作Fscale(·,·)加权得到最终特 征 中元素 计算过程如下: 6.根据权利要求1所述的基于迁移学习的垃圾图像分类方法, 其特征在于: 所述步骤4 中的全局池化层的池化窗口大小为7 ×7; 步骤4中的第一全连接层和第二全连接层均采用 ReLU作为激 活函数, 调用torch中 的nn.Line ar()函数实现, 输出维度为1024; 步骤4中的第 三全连接层采用Softmax作为激活函数, 输出维度为 40, 代表40类垃圾图像。 7.根据权利要求1所述的基于迁移学习的垃圾图像分类方法, 其特征在于: 所述所述步 骤5包括以下步骤: 步骤5.1、 将ImageNet图像数据 集中的权重参数导入初始分类神经网络, 冻结除全连接 层以外的各层权 重参数值; 步骤5.2、 通过训练集和验证集对初始分类神经网络进行训练, 其中使用momentum值为 0.9,weight_decay值 为0.0001的SGD优化器对网络各层权 重参数进行迭代; 步骤5.3、 直至该分类神经网络 输出准确率 不再提高, 得到训练完成的分类神经网络 。权 利 要 求 书 2/2 页 3 CN 114463578 A 3

.PDF文档 专利 一种基于迁移学习的垃圾图像分类方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于迁移学习的垃圾图像分类方法 第 1 页 专利 一种基于迁移学习的垃圾图像分类方法 第 2 页 专利 一种基于迁移学习的垃圾图像分类方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 21:47:59上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。