当前位置:首页 > 客户案例 > 案例详情

精准预警银行应用故障,助用户敏捷排障

发布时间:2020-07-01 10:30:11


【背景】
传统的指标监控方式一般采用固定阈值的方式,当指标波动达到该固定阈值时产生告警,但这种监控方式通常很难满足业务指标的检测需求,因为业务指标往往存在指标值随时间变化而不断变化的情况。必示业务指标异常检测产品通过学习指标的历史数据来构建适应时间周期变化的异常检测模型,识别业务指标在时间序列上的数据波动规律,达到准确检测业务指标异常波动的目的。

【数据接入】
某大型商业银行业务系统的响应率指标

【案例场景】
某日,该行运行稳定的某业务系统响应率突然出现小幅异常波动,逐渐从99.99%下降至98%左右。必示AIOps灵敏捕捉到了此次响应率异常波动,第一时间发出告警;传统监控平台由于该指标尚未触发95%的固定阈值而未产生告警。
  
用户根据经验判断:虽然当前系统运行状况尚未受到影响,但响应率指标微小异常波动的背后很可能隐藏着业务隐患。于是立刻开始故障根因排查,并持续关注指标的进一步变化。经过全面排查,很快确定响应率缓慢下降的原因是前一天系统变更引起的内存泄漏。

最终,在该业务系统响应率出现大幅降低的时刻,管理员根据已准备的应急预案执行了版本回退操作。随后3分钟内该系统的各项指标恢复正常,一次可能的重大故障及时得到了妥善处理。

【价值】
回顾此次故障的处理过程,必示业务指标异常检测产品凭借其高度准确的检测能力和提前告警,帮助管理员预判故障发生风险,为充分排查故障原因和准备故障恢复预案争取到了宝贵时间,使管理员及时在业务指标恶化时采取有效应对措施,高效地完成了故障处理操作,缩短系统恢复耗时(MTTR),挽回了大量潜在的交易损失。




相关产品链接

业务指标异常检测

更多案例效果,请致电:400-666-1132
或发邮件至 contact@bizseer.com 索取

TOP

400-666-1132