公司用的zabbix并不适合现在的需求,针对上级要求,对代码报错进行监控的需求,自己开了一套python监控。
主要功能:
1、实时监测java输出的日志,检测关键字,如:error等,从而触发告警;告警的信息为:检测到的关键字所在行和上下行。即,发送关键字所在行和上下行信息,且不能有重复;
2、日志分割;检测指定日志文件,达到规定文件大小后,对其进行备份,产生新的文件提供日志写入;
3、系统参数告警;实时监控系统cpu、内存、磁盘占用,达到阈值后发送告警;(cpu连续三次达到阈值触发告警;磁盘一旦触发告警后6小时内不再发送)
4、启用了多进程,每个功能一个进程,有进程崩溃不会影响其他进程;
备注:gitee上提交的代码为最初版本,有些时日没有更新了