个人介绍
一、个人简介
毕业于中国科学院大学,主要研究方向是机器学习和自然语言处理。先后在百度,斯伦贝谢、shopee等公司做过NLP高级研发工程师。研发过对话机器人系统和AI中台系统。
二、大模型技术能力
1. 具备丰富的大模型落地应用经验,能够结合实际业务场景将大模型技术应用于公文写作、Text2SQL 转换、标书生成等多个方向,推动业务智能化升级。
2. 熟悉主流大模型体系,包括 DeepSeek-R1、Qwen3、ChatGLM 等,掌握其在训练、推理、私有化部署以及国产化环境适配等方面的实践方法和优化策略。
3. 深入理解大模型训练与调优技术,熟练掌握增量预训练、全量微调、LoRA 轻量化训练、强化学习(如基于人类反馈的强化学习 RLHF)等关键技术路径,具备较强的工程实践能力和模型优化能力。
4. 熟悉大模型与国产化服务器的适配(昇腾910B、300Iduo、智凯v100、曙光k100等)
5. 熟悉国产化大模型在标书、公文、text2sql等公文领域的落地应用。
三、自然语言处理能力
1. 熟悉语言学基础知识,掌握语法结构、语义理解、句法分析等 NLP 核心概念。
2. 精通常见的 NLP 任务与算法,包括:
(1)序列标注与实体识别:命名实体识别(NER)、词性标注、条件随机场(CRF)等。
(2)句法与语义分析:依存句法分析、语义角色标注等技术。
(3)情感分析与分类:能够基于机器学习方法开展文本情绪识别与分类。
六、综合技能
英语水平:CET-6
熟练Python、C#、Java等面向对象语言开发,MySQL、ES的应用,有良好的编程习惯
熟悉Linux操作系统下常用命令,熟悉shell、git、Visual Studio的使用
熟悉数据结构和算法设计、机器学习、数据挖掘等专业知识,了解TCP/IP通信协议
熟悉大模型Qwen、Baichuan、ChatGLM基于full、freeze、lora等算法的训练和推理
工作经历
2020-07-01 -至今北京虾皮信息科技有限公司高级NLP算法工程师
主要研究神经机器翻译算法、大模型落地应用等工作。1. 具备丰富的大模型落地应用经验,能够结合实际业务场景将大模型技术应用于公文写作、Text2SQL 转换、标书生成等多个方向,推动业务智能化升级。 2. 熟悉主流大模型体系,包括 DeepSeek-R1、Qwen3、ChatGLM 等,掌握其在训练、推理、私有化部署以及国产化环境适配等方面的实践方法和优化策略。
2016-06-01 -2020-06-01百度数据研发工程师
主要研究K12教育数据的研发和教育知识图谱的搭建,包含教育数据的爬取,以及教育数据知识图谱的构建。 对话机器人开发,文本分类、槽位抽取、阅读理解、文本匹配等想关工作
教育经历
2014-09-01 - 2017-06-01中国科学院大学计算机科学与技术硕士
技能

针对*商城业务,设计一个*导购机器人, 该机器人系统主要包含文本分类、文本分类的人机协同、信息抽取模块、阅读理解、知识图谱、 指代、容错、补全以及推荐模块等。 工作内容: (1)设计开发文本分类和人机协同任务的代码逻辑,包含价格的分类、*的分类等, 基于BERT预训练语言模型开发的分类模型指标F1-score:95%+; (2)设计开发关于基于*标签的推荐模块,主要是基于KG数据进行开发的, 包含实体的识别,价格实体及极性的识别、热门机型的推荐、实体和*标签的归一化等功能模块。

设计一个知识渊博的虚设偶像男友, 通过与该偶像男友进行聊天获得想了解的答案。 工作内容: (1)设计算法架构流程图,主要包含意图识别、QA问答、阅读理解、闲聊生成、实体识别等模块。 (2)设计基于BERT预训练语言模型的意图识别、QA问答模块模型的研发和部署。






