该项目对千亿级电信用户行为实时数据采集,并使用Hadoop, Spark技术进行实时分析统计处理。通过采集数据,比如浏览的页面,点击的按钮,查看的内容,用户的基础信息,包括地区,手机品牌,浏览器版本,操作系统等,形成用户画像,从而对用户行为数据进行漏斗分析。
把电信用户行为数据集加载到HDFS中;使用python语言编写Spark程序对HDFS中的数据进行用户行为分析,并把结果写入到MySQL数据库;使用Django框架开发网页应用,对MySQL数据库中的数据进行可视化分析;
点击空白处退出提示












评论