当前位置:首页 > 客户案例 > 案例详情

某大型电信运营商智能运维项目

发布时间:2021-10-22 19:03:57


客户情况介绍

该运营商软件研究院于2015年成立,本部位于北京。研究院在新技术领域,打造了全行业先进的集IaaS资源与IPaaS能力于一体的“天宫云化架构平台”;敏捷开发、持续集成、DevOps的“天 梯研发管理平台”;面向感知及业务的全数字、自动化、智能化“天眼运营监控平台”;全域能力一 点看全、一点开放的“天擎能力运营开放平台”。


业务挑战


随着5G网络的建设与商用,在提高网速的同时,运营商须在海量的网络数据中迅速识别业务异常数 据,准确定位故障,提高新业务生成效率,降低重复劳动。 该运营商业务涉及系统多,关键指标繁多,各类软件关系复杂,主机硬件难于统筹,传统运维方式 难以适应现有业务场景的运维要求。

  • 发现问题难 传统静态阈值的监控方式无法有效检测业务指标的异常波动,原有监控系统漏报、误报多。
  • 根因定位难 人工排查异常设备和指标的方式耗时久、效率低,缺乏综合根因定界及定位分析的手段。
  • 数据治理难 日志数据数量大、类别多且分散,数据治理难。
  • 运营分析难 缺乏以业务为视角的多样化指标的综合运营分析能力。


解决方案概述

为解决云原生环境下应用运维问题,必示采用 “由下至上”、“由分散到集中”、“由数据到算法”的建设思路,利用自研应用故障 预警和应用故障定位系统,提供多制式网络的跨域诊断和运维智能排障两大功能,实现契合该运营商的智能运维落地场景, 助推其全面数字化转型。
故障发现:根据指标数据和日志数据进行建模,构建基于动态阈值 的异常检测模型,提前、准确的发现业务异常事件。
故障定界:通过使用成熟算法,快速组合分析与异常指标相关联的大量多维度业务明细数据,定位出异常情况最高的维度。
根因分析:由业务指标告警触发,对与该业务相关联的主机、数据 库、中间件进行异常指标定位。
故障预测:对磁盘空间等具备长期发展特性的时序指标数据进行预 测,描绘将来一定时间段内可能的趋势情况,并可以配 置阈值对指标走势进行预警提醒。


客户收益

  • 该项目的成功建设,为客户提供了技术支持,保障了服务品质,助力企业数字化转型升级:
  • 辅助运维人员发现数据的波动可能带来的影响,及时输出系统运行的总结报告,减少故障发现时间;
  • 辅助运维人员更加快速发现、定位异常日志,进行故障判断,减少故障修复时间;
  • 减少人工对批处理任务的监控,降低成本并提高检测精准度、减少误报、漏报现象,提升业务连续性。






相关产品链接

机器指标定位

更多案例效果,请致电:400-666-1132
或发邮件至 contact@bizseer.com 索取

TOP

010-82362970