墨磨叽迹
24天前在线
全职 · 1000/日  ·  21750/月
工作时间: 工作日19:00-23:30、周末8:00-12:00工作地点: 远程
服务企业: 2家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

大学生一枚,掌握了 Python 编程语言,常用的爬虫框架和库,如 Requests、Scrapy、BeautifulSoup、Selenium 等,并能在实际应用中灵活运用。同时,我熟悉 Pandas、NumPy、Matplotlib 等数据分析相关的库,能够使用数据建模和机器学习算法处理数据分析业务。       比较有代表性的项目经验是针对某东网站的某电脑商品数据爬虫和分析。该项目主要任务是爬取网站上的商品信息和用户评价,并根据数据进行商品的评分和排序。我的部分工作主要包括构建爬虫框架和爬取网站数据,清洗和预处理数据,使用 Pandas 分析用户评价和评论结果,并对酒店进行评分和排序。      在这个项目中,我主要使用 Requests框架爬取网站数据,使用 Pandas 对酒店评价和评论数据进行清洗、过滤和预处理,使然后对商品的评分和销量进行了计算和优化。       我相信,Python 爬虫和数据分析的技术将会越来越受到广泛的应用,因此我将持续不断地学习和探索新技术,提高自己的技能。

工作经历

  • 2022-09-01 -至今在校生学生

    我是一名在校学生,正在攻读 人工智能专业的学位课程。我对爬虫和数据分析技术十分感兴趣,并在课程学习中积累了一些相关的经历和技能。 在学习过程中,我通过 Python 编程语言系统学习了 Requests、BeautifulSoup、Selenium 等常用的爬虫框架和库,并着手开发了一些小型的爬虫项目。我特别感兴趣的是数据清洗和分析部分,我通过 Pandas、NumPy、Matplotlib、时间序列 等数据处理、可视化,学习并使用了区分数据类型、数据重构、数据筛选和可视化等技术,将小规模数据集转化为可视化的信息。

教育经历

  • 2022-09-01 - 南昌大学人工智能本科

    大学公共课除体育、英语外,全优,专业课全优(Python成绩前茅)

技能

0
1
2
3
4
5
作品
拉钩网数据分析师岗位数据分析

主要通过Pandas、datetime、pyecharts,将表格数据读取、选择性保留、更换标题、转换数据类型、数据清洗、合并后制作了数据分析师岗位需求趋势图、前十城市职位需求量柱状图榜单、学历要求分布饼图。

1
2023-06-23 03:01
一些案例

P1为部分项目 P2是美团项目目录 P3是美团爬虫源码,主要采用了Requests框架以及正则表达式筛选,抓取数据后导入CSV表格 P4-P6分别为借助Matplotlib,经过数据清洗,将数据分析后得到的{店家评分:店家数量}饼图、人均消费分布玫瑰图以及以评论量降序的店家词云图(字体可一定程度反映店家的热度) P7-P9是京东爬虫,用Python语言编写,主要是爬取京东商品的评论信息,并将这些信息存储到Excel文件中。代码中使用了requests库和json库来获取和解析爬取到的信息,同时也使用了openpyxl库、pandas库、和xlwt库来对Excel文件进行操作和处理。在代码中,首先使用循环语句爬取了100页的评论信息并进行解析,然后将解析后的信息按照一定的格式存储到dataframe中,并将该dataframe导出到Excel文件中。 (因九宫格有限,只能展示部分项目,只能省略某些反爬措施)

1
2023-06-23 02:32
美团爬虫数据分析、

使用requests模块和正则表达式爬取了美团外卖的餐厅信息。程序从链接 开始,每一页都包含20个餐厅。程序使用循环、正则表达式和csv模块来爬取和存储餐厅信息。具体地,程序首先定义了要爬取的页面数量、请求头、Cookie以及要存储数据的CSV文件路径。然后,程序将Cookie中的数据存储到字典data_dict中,并创建了CSV文件对象,后面的每个爬取到的条目都会添加到该CSV文件中。在程序的循环部分中,程序依次爬取每个页面,使用正则表达式从页面源代码中匹配得到餐厅的各种信息,将这些信息构造成一个列表,通过迭代添加到CSV文件中。最后,程序完成所有爬取,关闭CSV文件对象。

2
2023-06-23 02:38
更新于: 2023-06-23 浏览: 155