专利 一种应用于智能机器人的增量学习方法及装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111676331.3 (22)申请日 2021.12.31 (71)申请人中原动力智能机器人有限公司地址 450018 河南省郑州市郑东新区明理路尚贤街河南企业联合大厦16层16 01 (72)发明人袁野　朱永同　万里红　刘娜　张赛　 (74)专利代理机构广州三环专利商标代理有限公司 44202 专利代理师许羽冬 (51)Int.Cl. G06N 3/08(2006.01) G06K 9/62(2022.01) G06V 10/82(2022.01) G06V 10/774(2022.01) (54)发明名称一种应用于智能机器人的增量学习方法及装置 (57)摘要本发明公开了一种应用于智能机器人的增量学习及装置。该方法在模型初始化阶段，将所述混合数据集输入至第一深度学习神经网络模型，并完成第一深度学习神经网络模型的初始化，得到第一深度学习神经网络模型的初始权重参数；在知识蒸馏阶段，根据交叉熵损失函数和蒸馏损失函数继续对所述第一深度学习神经网络模型进行训练，得到第二深度学习神经网络模型及其第二权重参数；在权重对齐阶段，根据第一深度学习神经网络模型的初始权重参数对第二深度学习神经网络模型的第二权重参数进行对齐调整，得到第三深度学习神经网络模型及其第三权重参数。本发明技术方案大大减轻了增量学习中的灾难性遗忘问题，提高了智能机器人对旧任务的记忆力和执行力。权利要求书2页说明书7页附图2页 CN 114511081 A 2022.05.17 CN 114511081 A 1.一种应用于智能机器人的增量学习方法，其特征在于，包括以下步骤：在模型初始化阶段，将混合数据集输入至第一深度学习神经网络模型，并完成所述第一深度学习神经网络模型的初始化，得到所述第一深度学习神经网络模型的初始权重参数；所述混合数据集包括预留的旧样本数据和增加的新样本数据；在知识蒸馏阶段，根据交叉熵损失函数和蒸馏损失函数继续对所述第一深度学习神经网络模型进行训练，得到第二深度学习神经网络模型及其第二权重参数；在权重对齐阶段，根据所述第一深度学习神经网络模型的初始权重参数对所述第二深度学习神经网络模型的第二权重参数进行对齐调整，得到第三深度学习神经网络模型及其第三权重参数。 2.根据权利要求1所述的应用于智能机器人的增量学习方法，其特征在于，所述交叉熵损失函数为LCE(X,y)＝∑‑δc＝y*log(pc(X))，式中X为所述混合样本数据集的样本数据， y为所述样本数据对应的标签， δc＝y为指示函数， pc(X)为所述第二深度学习神经网络模型的概率输出函数。 3.根据权利要求2所述的应用于智能机器人的增量学习方法，其特征在于，所述蒸馏损失函数为式中X为所述混合样本数据集的样本数据， δc＝y为指示函数， qc(X)为所述第一深度学习神经网络模型完成初始化后输出的第一概率分布，为所述第二深度学习神经网络模型输出的第二概率分布；式中T为预设常数，为所述第一深度学习神经网络模型完成初始化后的初始权重参数；式中T为预设常数， oc(x)为所述第二深度学习神经网络模型的第二权重参数。 4.根据权利要求3所述的应用于智能机器人的增量学习方法，其特征在于，根据所述第一深度学习神经网络模型的初始权重参数对所述第二深度学习神经网络模型的第二权重参数进行对齐调整，得到所述第二深度学习神经网络模型的第三权重参数，具体为：根据所述第二权重参数计算所述第二深度学习神经网络模型对应的第二权重向量之和根据所述初始权重参数计算所述第一深度学习神经网络模型的初始权重向量之和将所述第二权重向量之和Wnew的二范数和初始权重向量之和Wold的二范数对齐得到所述第三深度学习神经网络模型的第三权重向量根据所述第三权重向量得到所述第三深度学习神经网络模型的第三权重参数；其中，至为所述第二深度学习神经网络模型的第二权重参数， w1至为所述第一深度学习神经网络模型的初始权重参数。 5.根据权利要求4所述的应用于智能机器人的增量学习方法，其特征在于，所述混合数权　利　要　求　书 1/2 页 2 CN 114511081 A 2据集通过数据采集标注系统而获取。 6.根据权利要求1至 5任一项所述的应用于智能机器人的增量学习方法，其特征在于，所述数据采集标注系统包括数据采集模块、通信模块、数据存储模块、中央控制模块和数据标注模块；所述数据采集模块用于获取图像数据，并且将所述图像数据传输到所述数据存储模块，并向所述中央控制模块反馈当前的工作状态信息；所述通信模块用于与所述中央控制模块进行双向通信、接收外界的控制指令和向外界反馈机器人当前的工作状态信息；所述数据存储模块用于接收所述中央控制模块的指令和向所述中央控制模块反馈当前的工作状态信息，以及接收和存储来自所述数据采集模块的图像数据；所述中央控制模块用于作为系统的决策中心、获取其余模块的工作状态信息，向其他模块发送指令和协调各个模块的工作；所述数据标注模块用于对采集的图像数据进行标注。 7.一种应用于智能机器人的增量学习装置，其特征在于，包括模型初始化模块、知识蒸馏模块和权重对齐模块；所述模型初始化模块用于将所述混合数据集输入至所述第一深度学习神经网络模型，并完成所述第一深度学习神经网络模型的初始化，得到所述第一深度学习神经网络模型的初始权重参数；所述混合数据集包括预留的旧样本数据和增加的新样本数据；所述知识蒸馏模块用于根据交叉熵损失函数和蒸馏损失函数继续对所述第一深度学习神经网络模型进行训练，得到第二深度学习神经网络模型及其第二权重参数；所述权重对齐模块用于根据所述第一深度学习神经网络模型的初始权重参数对所述第二深度学习神经网络模型的第二权重参数进行对齐调整，得到所述第三深度学习神经网络模型及其第三权重参数。权　利　要　求　书 2/2 页 3 CN 114511081 A 3

专利 一种应用于智能机器人的增量学习方法及装置

专利一种应用于智能机器人的增量学习方法及装置