gaussclb人工智能-程序员客栈

25天前在线

C级

大模型算法专家

杭州

全职 · 2000/日 · 43500/月信用正常

工作时间: 周末10:00-10:00工作地点: 远程

服务企业: 0家累计提交: 0工时

立即雇佣

聊一聊

APP聊一聊

去下载APP

主页

我是程序员客栈的gaussclb，一名大语言模型算法专家；我毕业于上海大学，担任过网易的金融风控工程师，担任过阿里的NLP高级算法工程师，担任过零一万物的大模型算法专家；负责过哈萨克斯坦主权通用大模型训练和上线，苏州征知政企项目，数字人直播和IP复刻；熟练使用大模型的后训练和强化学习，大模型的推理部署，Agent应用开发，语音图像多模态项目开发，Vebi Coding；如果我能帮上您的忙，请点击“立即预约”或“发布需求”！

2024-01-15 -至今零一万物大模型算法专家已认证
 哈萨克主权大模型  一期： 1. 完成AlemGPT的SFT、RL和测试集评估，在英语测试集上追平gpt-4o，在哈语/俄语测试集上超过gpt-4o水平3%，Alem1.0的已完成交付 2. 基于verl框架，在math数据集上做了大量的RL探索实验  二期： 1. 完成了Yi-Lighting文本指令的Deepseek V3.1蒸馏，提供更强的通用文本能力 2. 探索训练大模型的工具调用能力，在BFCL的单轮non_live测试集上打平qwen3-32b，在相关性和多轮测试集上低于qwen3-32b水平10% 3. 基于qwen3-omin，探索多模态大模型训练流程，完成语音、图像等多任务的初步实验  数字人直播弹幕互动  基于Yi-Lighting，开发数字人直播弹幕互动，实现拒答、主动发问、不同口语风格、不同称呼、多轮交互等功能，弹幕回答准确率超90%，用于支撑本地生活、电商等场景的POC  数字人IP复刻  基于Yi模型做SFT+RAG，实现数字人IP复刻，例如：李开复、抖音知识博主、图灵CEO等，模拟人物风格和知识注入，支撑2B需求  其他2B业务 
2021-03-16 -2023-02-15阿里高级算法工程师
 英语作文  英语通用能力：基于spacy、nltk等NLP工具包，构建英语通用能力，包含时态、语态、从句等检测能力，从句准确率达到70%, 时态/语态准确率达到90%，基于英语通用能力，通过对高中短文改错题型做数据分析，构建错误类型分类体系，搭建一套完整的答案解析的流程，覆盖率68.4%，准确率93.2%，满意度80%  作文批改模块：基于errant实现英语作文语法错误类型标注功能，涵盖20多种主要错误类型，在高考数据集上准确率达到91.38%，超越竞品（微软77.78%，有道60.38%），在产品的评测结果上同样超越竞品；基于错误解释生成模块，给出错误理由，基于规则生成整篇作文的评语  手写OCR后处理优化：包括涂改部分、标点符号误识别、分段和分栏，调整部分排序和合并块逻辑，应用于线上业务  词汇和句子润色：复现微软词替换模型，构建词润色的pipeline，达到对标微软的水平；尝试命题作文搜索构造pair对、wordtune竞品数据爬取、回译等方式，训练判别模型为生成模型筛选变好的句子对，提高润色变好的比例，到达对标竞品水平 • 优化搜索体验  翻译sc：结合NER
2019-05-15 -2021-03-15网易算法工程师
 盗号模型：使用Spark分布式框架训练RF/GBDT/XGBoost算法，尝试Transformer结合DNN抽取特征，利用word2vec和deepwalk预初始化embedding层参数等技巧，训练盗号模型，结合规则拦截线上异常交易，recall提升20%，accuracy提升5%，用户打扰率从1.5%下降到1.2%  图模型：利用Hive、GraphX工具，基于身份证、设备指纹等关系构图；基于统计和Deepwalk构建特征，使用异常检测算法IForest检测高密度图结构，社区发现算法Louvain和Infomap对大图进行分割， Graph Kernel对星型、链状等图结构进行分类，挖掘出游戏工作室、淘宝购买账号、游戏代练、代买、家族关系等异常现象  数据仓库：设计和搭建风控数仓，用于日常业务需求分析、用户画像构建、模型的特征提取和构图等

2016-07-01 - 2019-04-30上海大学计算机应用技术硕士已认证

Vibe Coding

中文母语水平

英语借工具书面交流

Python精通

Torch精通

更新于: 04-11 浏览: 53

个人介绍

工作经历

教育经历

资质认证

语言

技能

相似推荐换一批

重点城市程序员兼职推荐

重点岗位程序员兼职推荐