异常检测项目的背景是这样的,当时团队正在开发一个运维监控系统,用来监控后台服务的运行状况。异常检测就是为了实现监控指标的智能告警,属于运维监控系统的一个模块。做异常检测算法模型负责人, 主要工作及产出如下:
•独立调研时序信号异常检测领域技术现状,并结合业务特性制定技术方案
•基于 PyTorch 框架实现深度学习异常检测模型,核心算法包括 DBSCAN、VAE
•开发出一套开源代码,用于时序数据去噪、平滑、模板提取及模板聚类等功能
•实现并行化,单次识别时间降低至 5-20 毫秒,符合线上计算性能需要
•异常检测算法 F1-score 相比原有方法提升 60%+