第 88 期 2020-06-13 哆啦A梦—基于 Prometheus 的企业监控平台的设计与实现

视频回顾

简述

360 搜索事业部云平台一直致力于将容器技术在生产环境中落地,已开源企业级 Kubernetes 管理平台Wayne(https://github.com/Qihoo360/wayne ),并经历了在生产环境大规模应用的考验。当下Prometheus 是被广泛应用的监控系统,既是容器时代的标配,也同时解决了应用指标监控的问题。然而它的报警模块 Alertmanager 还有一些地方不是很完善,使用起来不够灵活,针对这一问题,我们开发并开源了哆啦A梦报警平台(https://github.com/Qihoo360/doraemon )。

本次分享主要介绍哆啦A梦报警平台的功能与实现。

大纲

  • Prometheus 在 360 搜索云平台的应用
  • Alertmanager 的痛点以及哆啦A梦的设计思路
  • 哆啦A梦的功能介绍
  • 哆啦A梦的快速部署
  • 哆啦A梦报警聚合的实现
  • 哆啦A梦对 Prometheus 报警标签(Labels)的快速匹配算法

分享者自我介绍

刘恒滔,奇虎 360 搜索事业部资深开发工程师

分享时间

2020-06-13 20:00:00 UTC+8

分享 PPT

1 个赞

ppt:https://slides.com/jayryu/deck-441c75

请教一下,哆啦A梦最终是在哪个地方调用的Prometheus接口进行评估的呢?我这边调试代码的时候一直提示客户端报错,应该怎么解决呢?