项目一:爬取豆瓣电影数据
主要是爬取豆瓣电影的数据,包括电影名称、导演、演员、评分等信息。我使用了Python 的 requests 库和 BeautifulSoup 库来实现数据的获取和解析,并将数据保存到了本地的 Excel 文件中。通过这个项目,我学会了如何使用 Python 爬虫来获取数据,并对数据进行简单的处理和分析
项目二:爬取新浪新闻数据
主要是爬取新浪新闻的数据,包括新闻标题、发布时间、正文内容等信息。我使用了Python的Scrapy 框架米实现数据的获取利解析,并将数据保存到了MongoDB数据库中。通过这个项目,我学会了如何使用 Scrapy 框架来进行爬虫开发,并对数据进行存储和管理
项目三:爬取淘宝商品数据
主要是爬取淘宝商品的数据,包括商品名称、价格、销量等信息。我使用了 Python 的Selenium 库来模拟浏览器操作,并使用 XPath 来解析页面数据。通过这个项日,我学会了如何使用 Selenium 库来进行模拟操作,并对数据进行解析和处理
点击空白处退出提示












评论