书籍详情
《基于机器学习的磁盘故障预测研究》[48M]百度网盘|亲测有效|pdf下载
  • 基于机器学习的磁盘故障预测研究

  • 出版时间:2022-01
  • 热度:11384
  • 上架时间:2024-06-30 09:38:03
  • 价格:0.0
书籍下载
书籍预览
免责声明

本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正

内容介绍

内容简介

  随着互联网时代的到来,数据规模的快速增长给存储带来了巨大挑战。磁盘凭借其容量大、价格低等优势,被广泛用于数据中心存储。然而,磁盘属于复杂的机械、电子设备,维持其高可靠性很具挑战。磁盘故障预测技术可对即将发生的磁盘故障进行预测,在磁盘故障发生之前,主动地对这些磁盘中的数据进行迁移,达到提高可靠性并降低维护开销的目的。但该技术仍存在如下问题亟待解决:①由于缺乏故障磁盘样本,导致基于有监督分类模型的磁盘故障预测方法存在适用性受限的问题;②仅使用预测准确率衡量预测方法的好坏,缺少对预测错误代价的评估;③基于扇区故障预测对存在潜在扇区故障的磁盘进行提升频率的扫描检测,导致维护开销增加。

作者简介

  江天明,华中师范大学信息管理学院讲师,主要研究方向是大数据分析、机器学习、异常检测、推荐系统。在国内外重要核心期刊和学术会议上发表多篇论文,其中SCI论文2篇,中国计算机学会推荐B类会议论文2篇;获得发明专利1项;主持中央高校基本科研业务费专项资金青年教师项目1项、中国博士后科学基金1项。

内页插图

目录

第1章 绪论
1.1 数据中心磁盘故障预测的研究背景
1.2 数据中心磁盘故障预测的国内外研究现状
1.3 本书的主要研究内容与思路
1.4 本书章节安排

第2章 基于深度生成对抗网络的磁盘故障预测方法SPA
2.1 SPA的研究背景与动机
2.2 深度生成对抗网络相关研究
2.3 SPA设计方案
2.4 实验评估
2.5 本章小结

第3章 磁盘故障预测中预测错误代价优化方法VCM
3.1 VCM的研究背景与动机
3.2 代价敏感学习简介
3.3 VCM设计方案
3.4 实验评估
3.5 本章小结

第4章 基于磁盘扇区故障预测的自适应扫描检测方法FAS
4.1 FAS的研究背景及动机
4.2 磁盘扫描检测简介
4.3 FAS设计方案
4.4 FAS理论分析
4.5 实验评估
4.6 本章小结

第5章 总结与展望
5.1 总结
5.2 展望

致谢

参考文献

附录1 攻读学位期间发表论文目录
附录2 攻读博士学位期间申请的发明专利和其他成果
附录3 攻读博士学位期间参与的科研项目
附录4 英文缩略及含义

前言/序言

  随着互联网时代的到来,数据规模的快速增长给存储带来了巨大挑战。磁盘凭借其容量大、价格低等优势,被广泛用于数据中心存储。然而,磁盘属于复杂的机械、电子设备,维持其高可靠性很具挑战。磁盘故障预测技术可对即将发生的磁盘故障进行预测,在磁盘故障发生之前,主动地对这些磁盘中的数据进行迁移,达到提高可靠性并降低维护开销的目的。但该技术仍存在如下问题亟待解决:①由于缺乏故障磁盘样本,导致基于有监督分类模型的磁盘故障预测方法存在适用性受限的问题;②仅使用预测准确率衡量预测方法的好坏,缺少对预测错误代价的评估;③基于扇区故障预测对存在潜在扇区故障的磁盘进行提升频率的扫描检测,导致维护开销增加。
  针对以上三个问题,笔者的主要工作包括如下三个方面:
  首先,针对基于有监督分类模型的磁盘故障预测方法存在适用性受限的问题,提出了基于异常检测模型的磁盘故障预测方法SPA。SPA将故障磁盘样本当作异常,仅利用健康磁盘样本进行模型训练,解决了模型冷启动问题。另外,通过构建二维SMART数据类图(image-like)表示,结合深度神经网络,能够自动挖掘SMART数据特征。同时,利用深度神经网络的微调特性实现模型更新,解决了模型老化问题。基于Backblaze真实数据集合的实验结果显示,SPA能够在磁盘使用的整个生命周期达到1%的误报率和99%的故障检测率。实验结果证明基于异常检测的SPA能够克服已有故障预测方法适用性受限的问题。
  其次,针对缺少预测错误代价评估指标的问题,提出了磁盘故障预测错误代价优化方法VCM。从降低可靠性维护开销的角度出发,VCM将错误预测代价引入磁盘故障预测中,并通过代价敏感学习来降低错误预测代价。具体来说,VCM为误报和漏报分配不同的错误预测代价权重,构建代价敏感学习的损失函数。然后利用阈值滑动策略,选择取得最小代价的预测阈值。基于Backblaze和百度真实数据集合的实验结果显示,相较于对代价不感知的方法,VCM能够减少最高22%的预测错误代价。实验结果证明了代价敏感学习对缩减预测错误代价的有效性。
  最后,针对基于扇区故障预测的扫描检测方法导致扫描检测开销增加的问题,提出了自适应扫描检测方法FAS。基于扇区故障预测结果,FAS对存在扇区故障的磁盘提高扫描检测频率,对健康磁盘降低扫描检测频率。此外,针对周期性的扫描检测行为,提出了一种基于投票的映射方法来提升预测准确率。基于Backblaze真实数据集合的实验结果显示,相较于当前最优的扫描检测方法,FAS在达到与前者相同可靠性的同时,能够减少最高32%的扫描检测开销。实验结果证明了扇区故障预测对降低扫描检测开销和提高数据可靠性的有效性。
  本书受2021年华中师范大学中央高校基本科研业务费项目:基于机器学习的引文推荐可解释性研究(编号:CCNU21XJ020)和中国博士后科学基金项目:基于深度语义的引文推荐可解释性研究(编号:2021M701367)资助。