王文强
1月前来过
全职 · 1200/日  ·  26100/月
工作时间: 工作日18:30-22:30、周末09:00-22:00工作地点:
服务企业: 3家累计提交: 1工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

我做过FOF基金数据开发、金融工程数据开发、自动特征工程、量化模型、交易、策略管理平台开发、Django全栈开发、年报系统开发、爬虫、静态文件Word、Pdf、xlsx、html、csv 非结构化数据提取。使用过Django、Airflow、Ray、Featuretools、爬虫、前端相关框架。能够从业务需求出发制定开发任务和流程设计,并在开发过程中不断优化和总结。

我Python基础扎实能够快速学习新技术并应用到项目中,养成了不断学习和总结的习惯,在遇到不同类型项目时具备分析问题解决问题的能力,写出来的项目代码完整、精简不打补丁。除了简历以外还有很多小项目没写,业余时间我也会学习一些新技术虽然在公司项目当中都没用到。今后如果遇到类似的新项目时,我有信心通过自己的努力完成未知的新挑战,擅长借助ChartGPT提升开发效率,对新技术比较感兴趣。

工作经历

  • 2012-07-01 -2017-06-30中软国际高级python开发工程师

    驻场长江证券、平安资管从事python全站开发,做过FOF基金数据开发、金融工程数据开发、量化模型、交易、策略管理平台开发、Django全栈开发、年报系统开发、爬虫、静态文件Word、Pdf、xlsx、html、csv 非结构化数据提取。使用过Django、Airflow、Ray、Featuretools、爬虫、前端相关框架。能够从业务需求出发制定开发任务和流程设计,并在开发过程中不断优化和总结。

教育经历

  • 2008-09-01 - 2012-06-30湘潭大学计算机软件本科

技能

HTML5
MySQL
Oracle
0
1
2
3
4
5
0
1
2
3
4
5
作品
web全站开发以及其他项目

项目经验一:盖象商城 1 、设计表结构:使用ORM实现商品信息、交易管理、个人中心、资产管理模块。 2 、用户模块:注册、登录、登出、修改密码功能。 3 、极验验证登录、*短信验证码注册。将耗时的操作放到第三方应用 django_celery做异步处理。 4 、集成第三方登录,采用social-core组件实现*、*登录。 5 、使用JWT加密解密方式做用户认证和授权系统,对访问权限、频率做限制。 6 、API接口开发:使用ModelSerializer对数据做序列化,使用顶层ModelViewSet 下面的不同视图类和GenericViewSet,对不同请求方式返回相应API接口。 7 、商品列表页功能:分页,搜索,过滤,排序。 8 、购物车、订单业务逻辑,支付宝完成支付功能。 9 、使用Django框架的Xadmin定制开发后台管理系统。 10、使用drf中CacheResponseMixin将数据缓存到redis数据库中。 11、图片保存到FastDFS图片存储服务器。 12、测试集成:使用django_nose对项目进行单元测试、采用第三方工具Apache ab做 性能测试、Unittest做自动化测试。 13、生成docs接口文档、错误日志监控系统集成sentry。 14、Nginx做反向代理和负载均衡,将请求upstream转发给一个Supervisor监管的 Gunicorn进程,使用Gunicorn进程拖管Django工程代码。 项目经验二:对账流程开发 1 、通过15家超市的供货商网站下载验收单数据。 2 、使用打码平台通过登录界面验证码功能,跳转到目标网页下载 pdf、xlsx文件。 3 、使用 pdfminer、tabula、python-docx、pandas从pdf、xlsx、html提取文本及表格。 4 、将文本和表格合并、清洗,转换成表中字段类型,保存至数据库。 5 、审查收货日期和下载日期对缺失数据进行补录。 6 、使用物料名称、单位转换表,店铺名称、编号转换表,对原始数据做转换。 7 、根据折扣率、税率对单价、总价做转换,收货类型对收货数量做转换存。 8 、转换时对缺失数据和异常数据,已邮件形式提醒客户。 8 、使用scripting Tracker工具分析SAP树形结构ID属性。 9 、使用python第三方库pywin32、pyautogui 操作SAP下载15家超市的R3数据。 10、读取R3数据序列化成相应字段类型,通过中间转换表转换后存入数据库。 11、对超市验收单和SAP下载的R3的数据根据收货单和退货单进行分表。 12、对比分表后的数据,找出相同类型数据之间的差异存入新表中。 13、设置定时任务每天重复下载一个月前数据,对数据库中数据进行实时更新。 14、设计表结构、使用ORM实现用户模块、收货单、中间转换表、对比表模块。 15、使用Django restframe 框架返回API接口。 16、用户管理模块、Xadmin后台管理模块。 17、列表页功能:分页,搜索,过滤,排序。 项目经验三;其他项目汇总 1、年报审查项目 :支持动态路由通过年份列表页,对任意年份年报审查系统做增改查操作年报近5年表格对比图、错别字检查、一致性检查页面、集成celery对接口做异步处理。 2、年报格式校验 :通过前端动态定义五级标题、数字、内容、表格的字体、字号、缩进等属性,比对属性与上传的word文档内容的属性,将不属性不一致的做标注,并在html文件中渲染成不同颜色并添加锚点,返回年报html页面。 3、年报pdf对比 :对比新旧年报的pdf文件,找出新增的章节、段落。返回渲染后的两个html文件,标记出新增章节和段落,JS渲染新增列表可通过锚点定位 到窗口中。 4、资讯中心采集 :从东财、聚源获取新闻、公告、研报、资讯数据,通过kafka创建多个topic实现分布式对数据做去重清洗,存入到oracle、mongodb、redis 5、爬虫项目汇总 :Scrapy增量爬取中企债券网、东方财富网数据清洗后存入Mongdb数据库。Selenium + Requests 爬取牛散持股查询信息网。Requests + 多线程 抓取*公众号金融类评论文章。RedisCrawlSpider框架爬取京东和大淘客数据。 6、数据类型汇总 :从非结构化个人简历中提取基金经理学历、工作单位信息生成拓扑图。解析最近10年基金年报/半年报pdf文件提取信用风险评级。 年报和责任报告pdf、彭博数据源、研究所提供的数据中提取 ESG 数据。 7、量化项目汇总 :从通达信获取K线数据、聚宽获取个股财务数据计算个股自由现金流、股权、股利贴现模型,灰度模型做线性回归编写交易策略回测框架。提取沪深300股指K线特征值,机器学习算法对测试集进行预测,对结果集做可视化分析,根据分析结果在聚宽量化平台编写量化交易策略。

0
2023-06-03 13:08
Django全栈开发项目

项目一:每日变更 1 、录入系统的变更等级和变更类型、审批链、实施人、验证人、通知人、变更内容。 2 、不同的等级和类型对应不同的审批链并记录审批流程。 3 、审批驳回修改后重新提交审批,审批通过后实施人开始实施。 4 、实施时间过后定时发送邮件提醒验证人对变更做验证,并记录验证结果。 5 、验证完成后传阅通知人并记录整个事件流程。 6 、在搜索页根据变更时间、关键字、人员、变更状态搜索查询并导出xls文件。 项目二:异常管理 1 、事件通报:通过定制模板、人员群组、发送邮件,记录邮件沟通内容。 2 、异常管理:录入异常时跟事件通报进行关联。 3 、录入后发送起EOA审批,commend文件获取审批结果。 4 、异常列表页、详情页、搜索查询页、导出功能。 5 、异常统计生成月报、季报、年报。 项目三:FOF基金数据管理平台: 1、用户管理、基金信息、开放日、预约申赎、功能管理模块通过ORM 设计表结构。 2、用户、角色、权限管理模块增删改查功能,并对用户权限做限制。 3、产品信息、估值表信息、开放日、预约信息管理模块。 4、首页展示母子基金申购金额、赎回份额与实收资本的比例。 5、通过用户、开放日、代销机构、母基金搜索母子基金关联关系联详情页。 6、预约申购和预约赎回新增、修改、详情、列表页搜索过滤分页。 7、估值表邮件解析、数据校验以及展示、生成PPT格式周报、月报、季报文件。 项目四:Python管控平台: 1 、设计表结构:程序管理、任务调度、版本控制、用户、角色、权限管理表。 2 、用户模块:注册、登录、退出、修改密码、验证码功能、设置角色权限范围。 3 、实现项目上传、存档、解压、版本更新、多版本存档功能。 4 、通过前端触发Django接口操作shell脚本对上传程序的启动和停止进行控制。 5 、前端使用模板语法对数据进行渲染,对表单数据做前端校验、ModelForm做后端校验。 6 、读取本地log日志序列化成json串返回API接口,前端ajax对日志做异步刷新。 项目经验五:FeatureTools自动特征工程算法开发 1 、使用ray集群三层结构分布式计算:第一层主节点做任务控制,第二层worker 节点做内存分配、聚合计算,第三层driver工作节点完成hdfs/es数据读写、 特征计算、java api交互。 2 、数据接入:自动识别主表、子表、字段类型,并对数据做清洗。 3 、特征定义:通过实体集、算子、参数自适应定义新特征并将ft对象保存到ES。 4 、特征计算:通过ft对象计算抽样dt区间内的特征值和基础指标。 5 、特征筛选:根据基础指标进行筛选找出有效特征。 6 、全量计算:通过ray集群分批次分布式计算hive新增全量数据特征值。 7 、增量计算:更新、新增、实时数据增量计算特征值。 8 、算子开发:根据业务需求编写聚合类、转换类算子并集成到项目工程代码中。 9 、特征翻译:根据算子、字段、形参含义将特征名翻译成中文。 10、需求分析、流程优化、bug修复、源码修改、docker部署。

0
2023-06-03 13:02
年报系统智能引擎开发

1 、通过前端上传年报、财务word文档到后端。 2 、Django后端使用pydocx库将word文档转成html文件。 3 、使用PyQuery分别提取两个转化后的html文件的文本内容。 4 、通过CSS的行内样式和内部样式优先级分析字体大小和粗细。 5 、通过CSS样式和正则将文本内容解析成章节、段落、内容和表格树形结构。 6 、将表格的粒度细化到单元格,不匹配文本通过标点符号细化到每个句子和文字。 7 、对两个树形结构文本内容进行校对,校对流程如下图(只画了第一层树状结构)。 8 、思路:树形结构对比整个树干、树枝、树叶和花朵匹配一个剪一个,剩余不匹配部分 根据相似度匹配叶子节点,通过标点符号和分词生成第二层树状结构,同样方式分别 对比第二层树状结构的树干、树枝、树叶。 9 、对html文件做初始化所有文本内容统一颜色,表格设置边框。 10、将首次匹配成功的章节、段落、内容、表格渲染成白底黑字。 11、已找到的表格未匹配成功的单元格背景渲染成蓝色。 12、对第一层树状结构匹配成功的块级元素,在两个html文件中分别设置相同描点。 13、对第二层树状结构匹配成功的树干、树枝、树叶渲染成白底黑字并添加锚点。 14、将第二层匹配和不匹配的叶子结点之间设置锚点实现相互跳转。 15、将相似度不高并且找不到的文本字体加粗背景设置成橙色。 16、在年报html页面添加JS代码渲染出错误列表隐藏栏,设置错误元素跳转描点。 17、通过Django返回渲染后的年报html,鼠标点击任意块级元素返回新窗口财务页面, 两个html页面之间可通过锚点相互跳转。

0
2023-06-03 12:57
更新于: 2023-06-03 浏览: 131