团体标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111662340.7 (22)申请日 2021.12.3 0 (71)申请人 苏州浪潮智能科技有限公司 地址 215100 江苏省苏州市吴中区吴中经 济开发区郭巷街道官浦路1号9幢 (72)发明人 徐亚鹏 秦凯新 郭腾飞  (74)专利代理 机构 济南诚智商标专利事务所有 限公司 3710 5 代理人 周杰 (51)Int.Cl. G06F 8/34(2018.01) G06K 9/62(2022.01) G06N 3/08(2006.01) (54)发明名称 分布式深度学习模型可视化开 发方法、 系统 及存储介质 (57)摘要 本发明涉及分布式深度学习模型可视化开 发方法、 系统及存储介质。 本发明主服务器提供 图形化的算法可视化配置服务和算法执行状态 可视化服务, 将利用算法可视化配置服务构建的 深度学习训练任务提交给主服务器, 主服务器根 据深度学习训练任务的资源需求分配相应的集 群计算资源, 在被 分配的集群计算资源初始化若 干计算容器形成计算集群, 调用计算集群执行深 度学习训练任务; 监测计算集群执行深度学习训 练任务的训练状态, 将训练状态汇 集处理通过算 法执行状态可视化窗口展示。 通过本发明用户可 以通过图形化的算法可视化配置服务在无需编 程的情况下创建深度学习训练任务, 傻瓜式实现 深度学习模型开发。 权利要求书2页 说明书6页 附图2页 CN 114327430 A 2022.04.12 CN 114327430 A 1.一种分布式深度学习模型 可视化开发方法, 其特 征在于, 包括: 主服务器提供图形化的算法可视化配置服务和算法执行状态可视化服务, 所述算法可 视化配置服务通过基于Web  UI的算法可视化配置窗口实现, 所述算法执行状态可视化服务 通过基于Web  UI的算法执行状态可视化窗口实现, 其中, 算法可视化配置窗口中包括画板, 可添加到所述画板上的图形化算法模块, 可添加到所述画板上并连接各个图形化算法模块 以表示各个图形化 算法模块之间关系的接线; 将利用算法可视化配置服务构建的深度学习训练任务提交给主服务器, 主服务器根据 深度学习训练任务的资源需求分配相应的集群计算资源, 在被分配的集群计算资源初始 化 若干计算 容器形成计算 集群, 调用计算 集群执行深度学习训练任务; 监测计算集群执行深度 学习训练任务的训练状态, 将训练状态汇集处理通过算法执行 状态可视化窗口展示。 2.根据权利要求1所述的分布式深度 学习模型可视化开发方法, 其特征在于, 所述图形 化算法模块包括: 映射了获取深度学习模型训练数据代码实例的图形化数据源模块, 使用 图形化数据源模块加载深度学习模型训练数据; 映射了处理深度学习模型训练数据代码实 例的图形化数据处理模块, 配置图形化数据处理模块对所加载的深度学习模型训练数据按 配置进行处理; 映射了构建深度学习模型各个层次代码实例的图形化算法层次模块, 配置 图形化算法层次模块来按配置构建神经网络的各个层次; 映射了训练配置代码实例的图形 化训练参数配置模块, 利用图形化训练参数配置模块为构建的神经网络配置训练参数; 映 射了请求资源代码实例的图形化资源请求模块, 使用图形化资源请求模块来为深度学习训 练任务配置资源需求。 3.根据权利要求1所述的分布式深度 学习模型可视化开发方法, 其特征在于, 利用算法 可视化配置服务构建的深度学习训练任务提交给主服务器, 主服务器对深度学习训练任务 进行参数检查, 获取深度学习任务的配置信息和资源需求信息, 并将深度学习训练任务的 配置信息存至分布式数据管理器, 将深度学习训练任务的资源需求信息发送给任务调度 器。 4.根据权利要求3所述的分布式深度 学习模型可视化开发方法, 其特征在于, 任务调度 器根据深度学习训练任务的资源需求向配置于主服务器的资源管理器申请集群计算资源; 资源管理器根据集群计算资源状态选出相对空闲的集群计算节点给来执行深度学习训练 任务, 被选出 的集群计算节点初始化若干计算容器形成计算集群, 并将计算容器及计算集 群信息反馈给资源管理器, 资源管理器将计算容器及计算集群的信息反馈给任务调度器, 由任务调度器将 深度学习训练任务分配给计算 集群。 5.根据权利要求4所述的分布式深度 学习模型可视化开发方法, 其特征在于, 接收深度 学习训练任务的计算集群从分布式数据管理器获取对应的配置信息, 利用配置信息映射成 实现深度学习训练任务的代码实例, 计算 集群执行实现深度学习训练任务的代码实例。 6.根据权利要求5所述的分布式深度 学习模型可视化开发方法, 其特征在于, 计算集群 根据所分配的深度学习训练任务代码实例获取执行代码实例所需的工具, 计算集群通过预 设的镜像仓库下 载安装工具。 7.根据权利要求1所述的分布式深度 学习模型可视化开发方法, 其特征在于, 主服务器 通过任务调 度器监测执行深度学习训练任务的计算集群中各个计算容器的训练状态, 并将权 利 要 求 书 1/2 页 2 CN 114327430 A 2训练状态 汇总处理后通过算法执 行状态可视化窗口展示。 8.根据权利要求7所述的分布式深度 学习模型可视化开发方法, 其特征在于, 任务调度 器监测计算 集群中计算 容器故障时, 将故障计算 容器所执行的业务迁移。 9.一种实现分布式深度学习模型可视化开发方法的系统, 其特征在于, 包括: 客户端, 客户端通过API ‑server连接主服务器, 利用主服务器提供的算法可视化配置服务创建深度 学习训练任务, 并将 深度学习训练任务 通过API‑server发送给主服 务器; 主服务器, 主服务器接收客户端所发深度学习训练任务, 获取深度学习训练任务的配 置信息和资源需求信息; 主服务器根据资源需求信息为深度学习训练任务配置集群计算资 源; 集群, 集群受主服务器控制为深度学习训练任务提供计算节点, 计算节点创建计算容 器形成的计算 集群来执 行深度学习训练任务; 主服务器监测计算集群执行深度学习训练任务的各个计算容器的训练状态, 并通过算 法执行状态可视化 服务经客户端 展示给用户; 分布式数据管理器, 分布式数据管理器存储包括: 深度学习训练任务的配置信 息、 深度 学习模型训练数据、 深度学习模型训练数据处 理后数据。 10.一种实现分布式深度 学习模型可视化开发方法的存储介质, 其特征在于, 所述实现 分布式深度学习模型可视化开发方法的存储介质存储至少一条指 令, 读取并执行所述指令 实现如权利要求1 ‑8任一所述的分布式深度学习模型 可视化开发方法。权 利 要 求 书 2/2 页 3 CN 114327430 A 3

.PDF文档 专利 分布式深度学习模型可视化开发方法、系统及存储介质

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 分布式深度学习模型可视化开发方法、系统及存储介质 第 1 页 专利 分布式深度学习模型可视化开发方法、系统及存储介质 第 2 页 专利 分布式深度学习模型可视化开发方法、系统及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 21:49:31上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。