团体标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111670455.0 (22)申请日 2021.12.31 (71)申请人 华录光存 储研究院 (大连) 有限公司 地址 116000 辽宁省大连市高新 技术产业 园区黄浦路717号 华录大厦10层 (72)发明人 杨镇铭 周传辉 卢小丰 解晓雨  王晟权 马海 丁晓阳  (74)专利代理 机构 大连至诚专利代理事务所 (特殊普通 合伙) 21242 代理人 王丹 陈义华 (51)Int.Cl. G06F 3/06(2006.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种用于多 级存储的数据读取系统 (57)摘要 本发明公开了一种用于多级存储的数据读 取系统, 包括待存储数据类型获取模块用于根据 数据知识库获取待存储数据的类型; 待存储数据 多级存储模块用于根据待存储数据的类型确定 待存储数据的存储位置; 已存储 数据存储位置调 整模块用于调整已存储数据的存储位置; 任务分 类模块用于根据读取任务的特征确定任务类型 和待读取数据所在存储位置; 数据读取模块用于 根据读取任务类型、 待读取数据所在存储位置执 行读取操作获取待读取数据。 通过确定待存储数 据的特征及存储类型并进行多级存储, 根据读取 任务内容进行任务分类并选择读取数据集合, 实 现文件的跨层读取, 提高文 件的读取速度。 权利要求书2页 说明书4页 附图1页 CN 114327294 A 2022.04.12 CN 114327294 A 1.一种用于多级存储的数据读取系统, 其特征在于, 包括待存储数据类型获取模块、 待 存储数据多 级存储模块、 已存 储数据存 储位置调整模块、 任务分类模块、 数据读取模块, 待存储数据类型获取模块, 用于获取待存储数据的类型, 包括根据历史数据建立的数 据知识库, 所述数据知识库中存储不同类型 的数据分类模型, 所述数据分类模型是根据历 史数据的特征数据和标签, 通过对待训练历史数据分类模型进行训练后得到, 获取待存储 的数据后, 计算待存 储数据的特 征和标签, 根据数据知识库确定待存 储数据的类型; 待存储数据多级存储模块, 用于根据待存储数据的类型确定待存储数据的存储位置, 分别将待存储数据、 待存储 数据的特征和标签、 存储位置在多级存储系统中进 行存储, 所述 多级存储系统包括S SD阵列、 磁存 储层以及光存 储层; 已存储数据存储位置调整模块, 用于调整已存储数据的存储位置, 根据已存储时长和 读取频率选择需要调整存储位置的已存储数据并重新确定待调整 数据的类型, 通过数据读 取模块获取待调整数据, 并通过待存 储数据多 级存储模块进行存 储; 任务分类模块, 用于对读取任务的内容进行特征提取, 并根据特征确定任务类型和待 读取数据所在存 储位置, 所述任务类型包括紧急任务、 普通任务以及一般任务; 数据读取模块用于获取待读取数据, 包括根据读取任务类型、 待读取数据所在存储位 置执行读取操作获取待读取数据, 所述读取操作包括第一读取操作、 第二读取操作、 第三读 取操作、 第四读取操作, 所述第一读取操作用于将存储于光存储层的数据拷贝于磁存储层, 当拷贝结束后从磁 存储层获取待读取 数据; 所述第二读取操作用于直接获取存 储于磁存 储层的待读取 数据; 所述第三读取操作用于获取待读取数据所在光储存层的挂载点, 磁存储层根据挂载点 直接获取存储于光存储层的待读取数据, 同时执行第一读取操作, 当第一读取操作执行结 束, 磁存储层释放 挂载点, 并根据读取 执行情况执行第二读取操作; 所述第四读取操作用于直接获取存 储于SSD阵列中的待读取 数据。 2.根据权利要求1所述的一种用于多级存储的数据读取系统, 其特征在于, 所述根据已 存储时长和读取频率选择需要调整存储位置的 已存储数据并重新确定待调整数据的类型 是指根据预设的时间间隔, 判断存储于多级存储系统的数据的读取频率是否低于预设读取 频率以及已存储时长是否高于预设存储时长; 当所述数据的读取频率低于预设访问频率并 已存储时长高于预设存储时长时, 将所述数据标记为待调整 数据, 基于待调整 数据的类型、 读取频率和已存 储时长根据数据知识库重新确定待调整数据的类型。 3.根据权利要求1所述的一种用于多级存储的数据读取系统, 其特征在于, 所述对读取 任务的内容进行 特征提取, 并根据特 征确定任务类型和待读取 数据所在存 储位置包括, 步骤3a, 获取指定领域的多个训练文本, 将多个所述训练文本分批次输入至第一神经 网络模型中, 针对每一批次, 采用随机掩码的方式提取所述批次对应的所述训练文本的文 本特征, 并根据提取的文本特征, 调整所述第一神经网络模型, 得到语言模型, 根据语言模 型提取所述内容的文本特 征, 将其作为读取任务的特 征; 步骤3b, 根据历史读取任务特征与历史任务类型构建第二神经网络模型, 通过在第二 神经网络模型中输入读取任务的特 征, 获取其任务类型; 步骤3c, 根据读取任务的特征与多级存储系统所存储的数据特征进行特征匹配, 获取权 利 要 求 书 1/2 页 2 CN 114327294 A 2匹配值高于阈值的数据存 储位置。 4.根据权利要求1所述的一种用于多级存储的数据读取系统, 其特征在于, 所述根据读 取任务类型、 待读取 数据所在存 储位置执 行读取操作获取待读取 数据包括, 当任务类型为 一般任务、 存 储位置在光存 储层时, 执 行第一读取操作; 当任务类型为普通任务、 存 储位置在光存 储层时, 执 行第三读取操作; 当任务类型为紧急任务、 存 储位置在光存 储层时, 执 行第三读取操作; 当任务类型为一般任务或普通任务或紧急任务、 存储位置在磁存储层时, 执行第二读 取操作; 当任务类型为一般任务或普通任务或紧急任务、 存储位置在SSD阵列时, 执行第四读取 操作。权 利 要 求 书 2/2 页 3 CN 114327294 A 3

.PDF文档 专利 一种用于多级存储的数据读取系统

文档预览
中文文档 8 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种用于多级存储的数据读取系统 第 1 页 专利 一种用于多级存储的数据读取系统 第 2 页 专利 一种用于多级存储的数据读取系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 21:48:40上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。