




个人介绍
拥有8年+后端开发经验的Python/Golang工程师,先后在字节跳动、爱奇艺、讯飞等知名互联网公司担任核心开发职位。具备从0到1的项目架构设计能力和大规模系统的高并发优化经验。
技术专长后端开发:精通Python(5年)、Golang(2年),熟练使用Flask、FastAPI、Gin等主流框架AI工程化:具备AI模型工程化部署经验,参与过语音克隆、智能问答等AI项目的技术实现系统架构:擅长高并发系统设计,曾独立完成支持4万+日调用量的核心业务系统数据技术:深度掌握MySQL、Redis、Elasticsearch等数据存储和检索技术项目经验商业项目:参与讯飞耳机语音克隆、字节CDN管理系统等核心业务开发开源贡献:Mysqlsmom项目获得280+ GitHub stars,解决MySQL到ES数据同步痛点技术影响力:技术博客《简单工作流引擎》获博客园周榜第一,具备一定技术影响力核心优势快速交付:具备从需求分析到上线部署的全流程独立开发能力技术视野:紧跟技术趋势,在AI、大数据、云原生等领域均有实践经验沟通协作:字节跳动360环评M+,具备良好的团队协作和跨部门沟通能力持续学习:保持对新技术的敏感度,快速学习和应用新技术栈服务理念专注于通过技术手段解决实际业务问题,提供高质量、可维护的技术解决方案。无论是企业级系统开发、AI应用落地,还是数据平台建设,都能快速理解需求并交付符合预期的产品。
可立即到岗,欢迎技术交流与项目合作!
工作经历
2024-07-01 -2024-12-01讯飞未来Python开发
主要职责: 负责AI项目工程化开发,独立完成讯飞耳机"语音克隆"核心功能 基于FastAPI框架完成系统架构设计与接口开发 实现高并发系统,支持每日4万+次调用,峰值QPS达10 搭建完整运维体系,包括负载均衡、日志收集、告警监控等 技术成果: 系统平均响应时间控制在1.5秒内 保证高并发场景下的系统稳定性 作为2024年讯飞耳机核心卖点成功上线
2022-01-01 -2023-11-01字节跳动后端开发
主要职责: 负责CDN业务核心模块开发,包括月初分量、根因定位等关键功能 设计并实现CDN供应商管理系统,提升运营效率 构建多租户CDN协作平台,支持融合CDN、PCDN、自建CDN等业务模式 核心项目: CDN供应商月度流量智能分配算法设计与实现 云厂商(阿里云、腾讯云、七牛云)内部协作平台建设 多种CDN业务模式的统一管理系统
2021-06-01 -2021-12-01爱奇艺后端开发
主要职责: 负责爱奇艺版权系统(奇盾)的开发与维护 参与版权保护相关功能的设计与实现
教育经历
2012-09-01 - 2016-06-01黑龙江大学计算机科学与技术本科
语言
技能

1. 解决了什么问题 数据同步需求:解决MySQL数据实时同步到Elasticsearch的常见业务需求 全量+增量同步:支持历史数据一次性导入和新数据实时同步两种场景 数据处理灵活性:支持自定义数据处理逻辑,满足复杂的业务数据转换需求 运维成本:提供开箱即用的解决方案,无需自研复杂的数据同步架构 2. 技术选型与特点 核心技术: 语言:纯Python编写,兼容性好,易于扩展 实时同步:基于MySQL binlog解析实现增量数据捕获 依赖简单:仅需Python2.7 + Redis + MySQL(binlog-format=row) 技术特点: 轻量级:无重型依赖,部署简单 可扩展:支持自定义数据处理器,灵活适配业务需求 稳定可靠:通过binlog机制保证数据一致性 多版本支持:兼容Elasticsearch 2.4到5.x等多个版本 性能表现: 实时性:毫秒级增量数据同步延迟 可靠性:基于binlog机制,保证数据零丢失 扩展性:支持大表分批同步,避免内存溢出 3. 如何快速上手 bash# 1. 安装工具 pip install mysqlsmom pip install --upgrade elasticsearch==5.4 # 2. 生成配置文件 mom new test_mom/init_config.py -t init --force # 3. 修改配置 vim ./test_mom/init_config.py # 配置MySQL和ES连接信息 # 4. 开始同步 mom run -c ./test_mom/init_config.py 上手优势: 5分钟部署:从安装到运行只需几个命令 配置简单:模板化配置文件,按注释修改即可 文档完善:提供中文文档和快速开始指南


本方案面向谁? 法律从业者:律师、法务专员需要快速查询华盛顿州法律条文 企业法务:需要了解华盛顿州合规要求的企业 普通公民:需要了解州法律常识、节假日等信息的居民 解决了什么问题? 检索效率低:传统法律文件检索需要人工翻阅大量文档,耗时费力 专业门槛高:非法律专业人士难以理解复杂的法律条文 语义理解差:关键词搜索无法理解用户真实意图,检索精度不高 相对于市场常规方案的特点 技术优势:使用PostgreSQL+pgvector替代专门向量数据库,降低成本提升稳定性 模型选择:集成Claude API,在法律文本理解方面表现更优 垂直专精:专注华盛顿州法律,比通用法律AI更精准 成本效益:相比聘请法律顾问,大幅降低法律咨询成本 技术选型 核心技术栈 前端:React + TypeScript,英文界面 后端:Python Flask,异步高性能 AI模型:Claude-3.5-Sonnet API 数据库:PostgreSQL + pgvector扩展 向量模型:sentence-transformers 系统特点 向量检索:PostgreSQL原生向量计算,无需额外向量数据库 RAG架构:文档向量化 + 语义检索 + Claude生成回答
