个人介绍
我是程序员客栈的gaussclb,一名大语言模型算法专家; 我毕业于上海大学,担任过网易的金融风控工程师,担任过阿里的NLP高级算法工程师,担任过零一万物的大模型算法专家; 负责过哈萨克斯坦主权通用大模型训练和上线,苏州征知政企项目,数字人直播和IP复刻; 熟练使用大模型的后训练和强化学习,大模型的推理部署,Agent应用开发,语音图像多模态项目开发,Vebi Coding; 如果我能帮上您的忙,请点击“立即预约”或“发布需求”!
工作经历
2024-01-15 -至今零一万物大模型算法专家
哈萨克主权大模型 一期: 1. 完成AlemGPT的SFT、RL和测试集评估,在英语测试集上追平gpt-4o,在哈语/俄语测试集上超过gpt-4o水平3%,Alem1.0的已完成交付 2. 基于verl框架,在math数据集上做了大量的RL探索实验 二期: 1. 完成了Yi-Lighting文本指令的Deepseek V3.1蒸馏,提供更强的通用文本能力 2. 探索训练大模型的工具调用能力,在BFCL的单轮non_live测试集上打平qwen3-32b,在相关性和多轮测试集上低于qwen3-32b水平10% 3. 基于qwen3-omin,探索多模态大模型训练流程,完成语音、图像等多任务的初步实验 数字人直播弹幕互动 基于Yi-Lighting,开发数字人直播弹幕互动,实现拒答、主动发问、不同口语风格、不同称呼、多轮交互等功能,弹幕回答准确率超90%,用于支撑本地生活、电商等场景的POC 数字人IP复刻 基于Yi模型做SFT+RAG,实现数字人IP复刻,例如:李开复、抖音知识博主、图灵CEO等,模拟人物风格和知识注入,支撑2B需求 其他2B业务
2021-03-16 -2023-02-15阿里高级算法工程师
英语作文 英语通用能力:基于spacy、nltk等NLP工具包,构建英语通用能力,包含时态、语态、从句等检测能力,从句准确率达到70%, 时态/语态准确率达到90%,基于英语通用能力,通过对高中短文改错题型做数据分析,构建错误类型分类体系,搭建一套完整的答案解析的流程,覆盖率68.4%,准确率93.2%,满意度80% 作文批改模块:基于errant实现英语作文语法错误类型标注功能,涵盖20多种主要错误类型,在高考数据集上准确率达到91.38%,超越竞品(微软77.78%,有道60.38%),在产品的评测结果上同样超越竞品;基于错误解释生成模块,给出错误理由,基于规则生成整篇作文的评语 手写OCR后处理优化:包括涂改部分、标点符号误识别、分段和分栏,调整部分排序和合并块逻辑,应用于线上业务 词汇和句子润色:复现微软词替换模型,构建词润色的pipeline,达到对标微软的水平;尝试命题作文搜索构造pair对、wordtune竞品数据爬取、回译等方式,训练判别模型为生成模型筛选变好的句子对,提高润色变好的比例,到达对标竞品水平 • 优化搜索体验 翻译sc:结合NER
2019-05-15 -2021-03-15网易算法工程师
盗号模型:使用Spark分布式框架训练RF/GBDT/XGBoost算法,尝试Transformer结合DNN抽取特征,利用word2vec和deepwalk预初始化embedding层参数等技巧,训练盗号模型,结合规则拦截线上异常交易,recall提升20%,accuracy提升5%,用户打扰率从1.5%下降到1.2% 图模型:利用Hive、GraphX工具,基于身份证、设备指纹等关系构图;基于统计和Deepwalk构建特征,使用异常检测算法IForest检测高密度图结构,社区发现算法Louvain和Infomap对大图进行分割, Graph Kernel对星型、链状等图结构进行分类,挖掘出游戏工作室、淘宝购买账号、游戏代练、代买、家族关系等异常现象 数据仓库:设计和搭建风控数仓,用于日常业务需求分析、用户画像构建、模型的特征提取和构图等
教育经历
2016-07-01 - 2019-04-30上海大学计算机应用技术硕士






