项目描述要点:
- 功能:爬取浙江省政府网站中关于“新能源汽车”的公开信息,包括标题、发布时间、正文内容等,并保存为文本文件。
- 技术:使用Selenium模拟浏览器操作,处理多窗口切换,采用多种XPath策略适配不同页面结构,文件名清理等。
- 我的角色:独立开发整个爬虫程序,包括页面解析、反爬处理、数据存储等。
点击空白处退出提示
语言技术
Python
项目描述要点:
- 功能:爬取浙江省政府网站中关于“新能源汽车”的公开信息,包括标题、发布时间、正文内容等,并保存为文本文件。
- 技术:使用Selenium模拟浏览器操作,处理多窗口切换,采用多种XPath策略适配不同页面结构,文件名清理等。
- 我的角色:独立开发整个爬虫程序,包括页面解析、反爬处理、数据存储等。
评论