监控目标: K8S生产集群和各种容器资源的使用情况。
• 主要工作: 搭建基于k8s的监控报警系 、告警模板编写 、告警通知机制 、告警规则编写 、Consul 批量注册。
• 负责告警模板编写: 确保告警模板清晰 、可读 ,并能够满足不同告警场景的需求。
• 负责告警通知机制: 基于 webhook 整合钉钉作为告警通知工具 ,负责接收告警通知并做应急响应。
• 负责告警规则编写: 定期审查和更新告警规则 ,确保其与应用的状态和性能要求保持一致; 如 :pod.rules 、svc.rules、 pvc.rules 、kubeadm.rules 等规则。
• 负责 Consul 批量注册脚本编写: 基于 consul 自动发现 node-exporter 监控过200+服务器
点击空白处退出提示
评论