项目描述:
系统实现合规审计、统计分析、全文检索、告警分析等功能,通过丰富的报表,协助管理者及时获悉全网整体运行态势。对一天、一周、一月的PV、UV、跳出率、重复访问率进行统计分析来反映表明用户品质,以达到及时处理的目的。
个人职责:
1、使用Flume来完成Apache服务器日志收集工作,并自动上传到指定的HDFS系统中存储。
2、负责项目中的MR数据清洗部分,将采集到的数据进行过滤,去除垃圾信息并存入hdfs中,并使用hive对数据进行统计分析存入Mysql中,并存入ES中进行备份。
3、参与日志系统的维护和管理。
技术要点:
使用flume实时收集生成的通话数据
将flume收集的log输入发送到kafka集群
将kafka消费的数据进行MR数据清洗、过滤
将干净的数据录入hive
使用hive抽取通话记录到mysql表中
点击空白处退出提示
评论