当前位置:首页 > 新闻中心 >新闻详情

必示智能运维AIOps学习资料

发布时间:2019-10-25 09:02:00

AIOps,即智能运维,是以人工智能技术赋能IT运维行业,通过机器学习的方法来提升运维效率,让企业可以从复杂的IT软硬件和海量监控数据中自动、准确、快速地发现异常、定位故障、预测风险,提高企业IT系统可用性和运维效率。随着大数据技术、人工智能技术的蓬勃发展,越来越多的领域都在尝试使用新技术进行业务能力的提升。技术的持续创新使用,带来支撑软件的不断变化和迭代,也对IT系统服务提出越来越高的要求。这就需要AIOps的新技术、新思路、新体系来更智能化地为各行业的运维工作保驾护航。

然而智能运维作为一项新兴的垂直领域技术,目前相关学习材料还不是非常系统。为了便于更多人能更容易地了解、学习、实践智能运维,我们汇总、筛选了一系列精品学习资料,供大家参考。(本文持续更新,将分享最新的落地实践案例,敬请关注)

前沿观点
★ 智能运维发展趋势
《清华裴丹 |  AIOps九大发展趋势》

★ AIOps产业实践前沿
《多场景、可编排智能运维平台落地实践》

★ 当前AI技术的能力边界,对智能运维应有的客观预期
《张钹、朱松纯、黄铁军等同台激辩:人工智能的“能”与“不能”》

★ AIOps白皮书
《企业级AIOps实施建议白皮书》
《金融业AIOps实施建议白皮书》
 
下载地址:
链接: https://pan.baidu.com/s/1Ft0Oz07c8u1nNIiUueFSzQ
提取码: 71if


学术精选
★ 清华大学NetMan智能运维实验室文章精选
★ 清华大学智能运维研究生课程课件
AIOps Fall2018 研究生课程及课件汇总(英文)



书籍推荐



 论文推荐
★ 日志异常序列检测相关
《LogAnomaly: Unsupervised Detection of Sequential and Quantitative Anomalies in Unstructured Logs》
* 作者为Weibin Meng, Ying Liu、Yichen Zhu,发表于2019年的IJCAI。


★ 异常检测相关
《Time-Series Anomaly Detection Service at Microsoft》
* 作者为Hansheng Ren、Bixiong Xu、Yujing Wang,发表于2019年的KDD。


★ 调用链相关
《Microscope: Pinpoint Performance Issues with Causal Graphs in Micro-service Environments》
* 作者为Jinjin Lin、Pengfei Chen、Zibin Zheng,发表于2018年的ICSOC。


★ 日志模板提取相关
《Syslog Processing for Switch Failure Diagnosis and Prediction in Datacenter Networks》* 作者为Shenglin Zhang、Weibin Meng、Jiahao Bu,发表于2017年的IWQoS。

★ 故障预测相关
《Syslog Processing for Switch Failure Diagnosis and Prediction in Datacenter Networks》* 作者为Shenglin Zhang、Weibin Meng、Jiahao Buß,发表于2017年的IWQoS。

★ 多维根因定位相关
《iDice: Problem Identification for Emerging Issues》* 作者为Qingwei Lin、Jian-Guang Lou、Hongyu Zhang,发表于2016年的ICSE。

★ 故障定位相关
《Taking the Blame Game out of Data Centers Operations with NetPoirot》* 作者为Behnaz Arzani、Selim Ciraci、Boon Thau Loo,发表于2016年的ACM SIGCOMM。

★ 变更分析相关
《Rapid and Robust Impact Assessment of Software Changes in Large Internet-based Services》* 作者为Shenglin Zhang、Ying Liu、Dan Pei,发表于2015年的ACM CoNEXT。

★ 容量管理调度相关
《Quasar: Resource-Efficient and QoS-Aware Cluster Management》* 作者为Christina Delimitrou、Christos Kozyrakis,发表于2014年的ASPLOS。

★ 告警聚合相关
《Unveiling clusters of events for alert and incident management in large-scale enterprise it》* 作者为Derek Lin、Rashmi Raghu,发表于2014年的KDD。

链接: https://pan.baidu.com/s/1NTcupvbnAG50YvYtBCdHgQ
提取码: se6r




TOP

400-666-1132