项目描述:
当用户在偶书网浏览或阅读时产生大量日志数据,根据这些日志数据分析以下指标:页面访问量、独立访客数、
独立会话数、页面跳出率、新增IP数、新增用户数、平均会话访问深度、平均会话访问时长等。并将这些指标可视
化展示,便于站长更好地了解用户喜好。
架构描述:
ZooKeeper+Flume+HDFS+Hive+Sqoop+MySQL+Echarts
责任描述:
1. 参与计算页面访问量、独立访客数、页面跳出率、平均会话深度指标
2. 配置日志服务器通过Log4jAppender发给Flume收集数据
3. 使用Flume将数据存储按日期存储在HDFS上
4. 用Hive清洗HDFS的数据,并设置定时任务,自动加载处理
5. 使用Sqoop将结果导出到MySQL,使用Echarts可视化展示
点击空白处退出提示
评论