初期使用 Prometheus + grafana, prometheus 单点设计随着数据量增大,重启时间需要 30+min 才能读取完所有 wal。故使用 victoria + grafana 替换了 Prometheus,目前每秒百万数据点无压力,且组件化设计使得容灾能力提升,且重启可在半分钟内完成。
评论