1.项目内容:完成一个可以爬取豆瓣电影Top250电影数据以及进行数据分析,并且在网页上形成数据可视化的界面。
功能模块:①爬虫板块:通过爬虫程序爬取电影数据,根据BeautifulSoup进行网页数据抓取以及数据解析,然后将数据持久化到本地数据库中。
②数据可视化板块:主要分为电影、评分、词云等板块,电影板块展示详细的电影相关信息;评分板块给出豆瓣电影Top250评分分布图(包括数据视图、柱状图、折线图等);词云板块根据热词生成词云。
2.个人工作:①能够将豆瓣电影网站Top250的电影相关数据爬取到本地数据库;②基于Flask实现的数据可视化网站;③电影板块展示前豆瓣网站Top250电影的详细信息(如排名、电影名称、评分、评价人数、一句话概括、简介信息);④评分板块豆瓣电影Top250评分分布图(包括数据视图、柱状图、折线图等);⑤词云板块根据热词生成词云。
点击空白处退出提示














评论