Kang
1月前来过
全职 · 300/日  ·  6525/月
工作时间: 工作日09:00-18:00、周末10:00-18:00工作地点: 远程
服务企业: 0家累计提交: 0工时
聊一聊

APP聊一聊

个人介绍

我是程序员客栈的Kang,一名Python开发;

我毕业于河南工业大学,担任过瞰天科技的Python开发工程师,担任过海天瑞声的Python开发工程师;

负责过敏感词筛查系统,NewsPilot新闻分类系统,垂直领域AI模型API服务的开发;

熟练使用Python,FastAPI,PaddlePaddle/PyTorch,MySQL,Docker; 如果我能帮上您的忙,请点击“立即预约”或“发布需求”!

工作经历

  • 2026-03-30 -至今海天瑞声python开发

    敏感词筛查系统: 针对 300万行级 海量文本数据,设计并实现了一套基于 多进程并发 的自动化检测框架。 引入 Aho-Corasick (AC) 自动机算法,在 8万个敏感词 规模的关键词库下,将检索效率较传统正则匹配提升了 5倍,显著降低了系统 CPU 负载。 解决了大规模处理任务中的内存泄漏与进程间通信效率瓶颈,支撑了单日十万量级的数据合规性自研检查。 NewsPilot 新闻分类系统(Funnel 漏斗架构): 负责构建从数据预处理到深度学习推理的完整 pipeline。 设计了 “规则 + LightGBM初筛 + ERNIE深度识别” 的三层漏斗式架构,针对 THUCNews 等大型数据集,实现了在高 QPS 场景下的高精度分类(准确率 93.7%)。 利用 PaddleNLP 对 ERNIE 3.0 -medium-zh模型进行微调(Fine-tuning),并针对文本分类任务优化了标签索引逻辑与显存管理。

  • 2025-07-08 -2025-09-08北京瞰天科技有限公司python开发

    数据业务后端与模型工程化: 负责将行业垂直领域的 AI 模型转化为高性能 API 服务,使用 FastAPI 搭建了稳定、低延迟的推理后端。 实现了从前端数据可视化到后端预测结果输出的完整业务闭环,支撑了空间数据的高效处理与分析。 针对 Windows 生产环境下的 GBK/UTF-8 编码冲突、跨平台路径兼容等工程细节进行了深度调优,确保了系统在异构环境下的平稳运行。 模型性能与推理优化: 针对模型推理过程中的算力瓶颈,通过 异步 IO (Asyncio) 优化了数据请求链路,将接口平均响应延迟降低了 30%。 数据治理与 ETL 管道:使用 Pandas 构建自动化数据清洗管道,处理缺失值、异常值及格式标准化问题;建立数据质量监控规则,确保输入模型的数据准确率达 99%+,为后续模型训练提供高质量数据基础。

教育经历

  • 2023-09-01 - 河南工业大学数据科学与大数据技术本科

    主修课程:数据结构、算法设计、机器学习、高级语言程序设计(Python)、操作系统、计算机网络、数据库系统原理 全国大学生数学建模竞赛河南赛区省级二等奖

资质认证

语言

中文母语水平
英语可口语交流
0
1
2
3
4
5
0
1
2
3
4
5

技能

Go掌握
Python掌握
Kafka掌握
Nginx掌握
Django掌握
Docker掌握
Vue掌握
Torch掌握
Flask熟练
0
1
2
3
4
5
0
1
2
3
4
5
更新于: 05-15 浏览: 7