Falcon prometheus

1.作为项目经理主持完成公司中云信站点IAAS平台(4个机架20个计算节点)建设工作,保障了业务系统按时投产;2.负责建设公司的日志管理平台,接入了IAAS平台业务日志和所有网络设备,安全设备的硬件日志,根据业务规则需求对日志进行分析处理,收集存储。配置监控告警策略监控异常业务日志并推送告警通知;3
640Zabbix金融
1.负责公司运维体系构建,包括标准规范制定、持续集成、监控告警、安全防护等方面,整体对运维的质量、效率、成本、安全负责;2.管理运维工作,包括网络/硬件规划管理、IDC机房、系统运维、数据库运维、应用运维、自动化运维等,针对各级业务系统的架构、部署、监控、治理、优化、容灾、安全等进行规划和实施指导3
430K8S人工智能
1.统一数据采集(Alloy)轻量高效:采用Go语言编写的单一二进制文件,资源占用远低于同时部署多个传统Agent。多源兼容:原生支持Prometheus指标采集、Loki日志采集、OpenTelemetry遥测数据等,是面向未来的统一采集器。强大的处理能力:内置灵活的流水线处理机制,可以在数据发送
1690K8S游戏
awesome-yuan开源项目
提供一套能够实现快速搭建环境的docker-compose集合。此集合精心整合了各类在开发与运维过程中极为常用的数据库集群。通过使用这一集合,用户能够便捷、高效地构建起所需的数据库环境,大幅缩短搭建时间,提升工作效率,助力项目快速推进。无论是用于测试、开发还是生产环境,该docker-compose
340K8S开发工具
从0到1开发机器学习平台 纳管多个云上的gpu和cpu-k8s集群 任务功能 多集群多队列多用户组 gpu多机训练,tensorboard可视化 工作流cpu/gpu数据处理 云仿真,单机仿真任务 开发机 gpu-share开发机1虚n gpu双卡开发机 cpu开发机 save镜像 原地重启 cfs/pfs持久化存储 alluxio缓存 4种维度监控、本地和云平台日志 支持优先级
780GoAI
该项目使用的jumpserver堡垒机改版过来的,其目的是解决游戏服务器从开服服务器初始化,代码部署更新,程序监控自动拉起,数据库备份回滚等,实现程序的自动化,避免手动更新遇到的各种问题,从而达到快速、安全、方便的更新部署。 1:【60%】本项目解决了游戏活动更新问题,避免了手动更新造成的各种问题 2:【20%】本项目解决了游戏更新活动时数据库备份,使备份更加灵活方便,包括出现问题数据库回滚等数据库问题 3:【20%】本项目解决了游戏程序宕机,能够进行程序进程监控,并且能够自动拉起,从而避免玩家造成损失
1550Python后台管理系统(模板)
1. 提供7×24小时运维保障,涵盖云资源管理、系统监控、故障排查、性能优化及安全防护等关键领域。 2. 通过自动化运维工具、DevOps实践及智能化监控体系,实现高可用、弹性扩展的云平台架构,确保业务连续性与数据安全。 3. 车联网混合云实施实现部分车端app免流 4. 自建cdn实现双向认证保障安全 5. 整改云资源安全情况,协助客户过等保、重保、磐石、故障演练
860K8S云原生
amazon爬虫,全站可爬,公开数据都可以爬,asin/listing,每天能拿上亿级别数据,适合大卖家以及做选品产品的公司。如卖家精灵,sif关键词,鸥鹭,易佰等公司,个人用户也接待,可签合同对公开票等,数据交付方式可商量(直接写数据库,api,cvs等),专业团队,欢迎咨询 电19925228760。
770Zabbix电商
Linux运维,系统加固,网站维护,数据库,监控,服务器运维,APP后台维护,容器dockers,K8S,saas,Zabbix, Falcon prometheus, Jenkins, HaProxy.
1380ZabbixDocker 映像
1. 项目中使用keepalive+nginx实现负载均衡,配合hot-upsteam、ingress实现容器转发 2. grafana+Prometheus 对服务器、中间件、数据库进行监控和报警配置 3. 中间件:kafka、nacos、zookeeper;数据库 neo4j、mysql、redis-cluster 4. Mysql+MHA进行高可用,Redis-clutser集群
1830负载均衡企业服务
1.Prometheus grafana监控平台项目的开发搭建,从0到1,k8s取代虚拟机的整合,节约资源,方便了维护,提高效率,实现了代码交付时间
2110负载均衡存储系统
开发Python自动化脚本监控系统上的关键参数,使用Prometheus+Grafana前端框架搭建监控系统,使用Mysql存储历史监控数据,利用FTP备份重要文件(定期备份配置文件,存储错误信息),使用Alertmanager实现监控报警、发送邮件功能,使用Django/Flask作为后端接口,前端使用vue-element-admin框架,搭建更定制化的数据表单页面
1350python监控系统
项目介绍: 该监控系统可以横跨多个 prometheus 集群进行监控,且支持对多个集群的数据进行查询和聚合。存储方面支持长期存储,可将 prometheus 数据存储到廉价的对象存储中,且监控数据通过多副本保证高可用。通过 k8s endpoint s以及 consul 实现监控目标自动发现。告警则接入飞书机器人实现基于命名空间的告警到人。 工作内容: 1. 整体技术架构选型及部署实施; 2. 使用 Go 开发 node controller,在节点频繁变更下,实现 kubelet endpoints 的自动更新; 3. 配置 hashmod 解决 prometheus 无法支撑单个大集群以及多副本 prometheus 重复拉取指标的问题; 4. 使用 Go 开发 alertmanager webhook ,并基于飞书机器人配置自动重载; 5. 编写 alertmannager 和 thanso ruler 告警规则以及 prometheus record 优化查询语句。 项目成果: 1. 解决多套集群部署多套监控系统的问题,节约计算资源以及人力维护成本; 2. 实现 k8s 集群内外部监控 target 自动发现,无硬编码 target; 3. 保证了大体量集群下 prometheus 的高可用,以及数据的完整性; 4. 告警直到相关责任人,推进问题响应速度。
2850服务器运维prometheus
1. 通过opentelemetry采集trace到prometheus 2. 通过prometheus metrics或者主动探测采集k8s相关指标 3. 通过grafana呈现相关指标大盘 4. 通过不同告警等级接入不同告警渠道
1280服务器运维pod监控
承担运维工作 1. 负责 Ludo 业务运维维护管理 ,包括自动化发布、监控、成本管理、稳定性保险 2. 协调沟通测试、研发完成故障演练、安全修复、RCA 报告、微服务上云等工作。 3. 负责 AWS 云平台产品维护管理,包括 EKS、S3、ECS、SLB、VPC等产品。
2150服务器运维运维
该项目是一个针对沃尔沃的小程序项目,主要提供汽车信息、用户服务、购买汽车等功能。作为项目的 DevOps 工程师,主要负责持续 CICD 系统的搭建和运维、线上版本的发布和运维等工作。 工作职责: 1. 负责搭建、维护和优化基于 Jenkins 的持续集成和持续交付系统,实现自动化构建、自动化测试、自动化部署等功能。 2. 负责制定和实施发布流程,确保线上版本的发布稳定可靠,同时保证线上服务的高可用性。 3. 负责管理和维护基础设施,包括服务器、存储、网络等,确保系统的安全、稳定和高效运行。 4. 负责监控和分析线上系统的运行状况,及时发现和解决故障,提高系统的可靠性和性能。 5. 负责与开发团队、测试团队和运维团队进行协作,确保项目的顺利进行和高效交付。
2980服务器运维常用工具包
当前共16个项目more
×
寻找源码
源码描述
联系方式
提交