个人介绍
我是程序员客栈的杨,一名行业大模型数据分析; 我毕业于大连交通大学,担任过北京御华数智的行业大模型数据分析,担任过北京极速破译的数据分析; 负责过RAG 私有知识库问答系统,通用网页爬虫与数据分析可视化系统的开发; 熟练使用Python、LangChain、OpenAI API、向量数据库、RAG、Selenium、Pandas、Matplotlib、Requests; 如果我能帮上您的忙,请点击“立即预约”或“发布需求”!
工作经历
2025-06-07 -至今北京御华数智行业大模型数据分析
• 梳理垂直领域大模型业务逻辑,挖掘行业数据,利用大模型爬取并整理业务数据。 • 主导搭建RAG知识库:完成文档切块、BGE-M3向量化、数据存储于Milvus/Chroma/PGVector,并结合LlamaIndex/LangChain 实现⾼效语义检索。 • 制作垂直领域大模型Demo,完成端到端的数据处理与知识库问答系统落地。 • 独⽴完成多个垂直领域RAGDemo 的全流程(从数据采集到知识库检索)。
2024-05-01 -2025-05-01北京极速破译数据分析
1.对接警局,根据警局的需求。利用Python编写代码输出文档2.利用sql进行大量数据分析,数据清洗以及资金穿透3.跟警局相关负责人对接情况
2023-05-01 -2024-05-01北京华企盾科技有限公司数据分析
1.根据警局的需求对数据进行处理(数据:2.对处理的数据进行研判分析,提供相关证明,给出研判分析结果及报告.各,生成相关思维导图.3.根据客户需求进行技术配和,整理数据表
教育经历
2018-06-01 - 2023-04-06大连交通大学软件工程本科
语言
技能

数据采集模块:支持静态页面(Requests+BeautifulSoup)与动态渲染页面(Selenium)双模式抓取,内置User-Agent轮换、IP代理、请求频率控制等反爬策略。2.数据存储模块:支持MySQL、CSV、Excel多格式存储,自动去重,数据结构化入库。3.数据清洗模块:基于Pa






