yonggang
2小时前在线
全职 · 300/日  ·  6525/月
工作时间: 工作日09:00-05:00工作地点: 远程
服务企业: 0家累计提交: 0工时
聊一聊

APP聊一聊

个人介绍

拥有16年互联网和企业软件研发工作经验,用最新的技术解决业务的各种问题,大量的项目经验,从需求出发,挖掘用户业务痛点,算法模型选择,解决具体业务问题,坚持从数据中来回归到数据中,负责的项目效果好。擅长python,C++等语言,精通大模型问答,知识图谱建设,理解深度学习理论,擅长场景的落地和应用,可以具体应用专业知识解决数据挖掘,搜索算法,商业广告,信息推荐以及自然语言处理的问题,同时熟悉解决问题在流程,需求理解,需求分析,任务拆解和实现测试,效果验证和后续持续优化,理解问题,抽象及解决问题的能力。良好的语言表达能力以及语言沟通能力,同时拥有一定的项目管理能力,能够在工作中接受安排,承担团队以及任务的压力,同时拥有很强的责任心;硕士丰富的算法研究经历,一直围绕搜索,推荐,广告场景,应用自然语言处理,机器学习,深度学习,知识图谱等相关知识解决具体的业务问题。


工作经历

  • 2022-10-17 -2026-03-31用友算法工程专家

    工作职责 企业智能体开发及RAG问答系统建设,流程搭建,策略选择和效果优化:工作内容设计和实现了基于大模型的RAG问答系统,设计了流程框架可以支持多租户,优化了效果涉及到的模块:a) 重构离线数据流从文档解析到灌检索库,批量调用到pipeline,解决了链路长,数据丢失问题;b) 内容解析的好坏直接决定了问答的效果,在开源工具的基础上对PDF 表格进行还原和重构,解决了表格问答难题(首创);c)多次迭代优化RAG问答系统,提出精简上下文的优化思路和效果优化,实现了多资源类型:文档,知识库,图片等综合问答RAG系统;d)持续提升代码质量,性能,稳定性,支持多种平台和多重类型的需要(问答,内容生成,推荐,搜索,内容比对等),获得一致好评。 企业信息检索:企业内有大量是数据,检索是高效的信息获取方法。从零开始实现了信息检索系统,主要工作:信息爬取解析,内容分析和解析,召回和排序策略。用一套系统支持了不同的业务场景,实现了紧密度,文本相似度,语义相似度等相似度计算方法,在此基础上进行了排序,通过配置满足了不同的场景需求。 图谱建设和应用:企业内有各种非结构化数据,如何把数据结构化和多维度呈现出

  • 2019-09-23 -2022-09-30腾讯资深研发工程师

    工作职责 作为图谱建设策略负责人,搭建了自动化的构建流程,包含知识的本体定义,抽取,融合,存储,应用; 攻坚关键技术实体对齐和实体链接,实现了多策略融合的实体对齐算法来适应不同的应用场景(最小属性启发模型、xgboost判别模型、基于bert深度模型)实现了短文本Query和影视资源的实体链接,基于模板的指称识别,通过检索和扩展的候选实体生成,利用上下文的协同实体深度相似消歧; 应用于实体召回和相关性计算、影视推荐、SUG、用户画像、视频内容理解; 通过模板匹配方法对半结构化的数据挖掘,建设了多维度的概念标签体系,应用于影视意图检索和标签展示筛选; 影视语义搜索的策略负责人和小垂类语义搜索模块的主要参与者,搭建了影视语义检索系统,采用了自底向上的分领域意图,使用问答系统中的DIS(领域domain、意图intent、槽位slot)表示语义意图; Query侧通过chart_parser二层模板匹配方法识别语义,Doc 通过bert-ctr来实验意图和槽位识别和解析,应用于影视意图、明星意图召回和模块化展示,howto类,教学类,比赛类等意图类检索中。

  • 2013-06-11 -2019-09-20百度研发工程师

    工作职责 作为策略人员,负责开发了知道实体识别和推荐,贴吧帖子内商业关键词挖掘、扩展、排序,文库的个性化文档模块的搭建,相关文档和看了又看的模块升级; 股市通的股票知识图谱构建和应用; 标类化妆品和母婴规则+CRF融合策略的商品的归一化; 负责关键词的相似度扩展和排序,采用多种扩展策略:用户历史行为的直接扩展,相似用户协同过滤扩展,用户点击的页面关键词的核心词扩展; 排序优化:权重优化升级:衰减,来源,细分指标;模型升级到深度的排序模型auc提升15%; 排序公式:pvr * acp * ctr; 负责了足球、NBA、综艺、电视剧、电影等垂类的开发,通过对用户建模、资源刻画、场景深度挖掘(时间场景),在召回和排序中优化和提权,推荐合适资源,提升用户预期,满足用户深度需求; 负责明星动态个性化推荐的策略,主要工作有用户理解,需求分析,项目拆解和规划。针对动态的三个特点内容短,时效性强,明星满足经过多轮优化(用户,召回,排序,多目标)实现了多目标排序召回策略,构建了平台,用户,明星闭环生态; 负责垂类(图集,本地,问答等垂类)精排GBDT模型,特征构成,特征选择,模型训练,每个垂
收益:视

  • 2011-05-10 -2013-06-10阿里研发工程师

    工作职责 阿里巴巴 杭州阿里巴巴国际事业部 机器翻译,智能导航; 负责线下语料的挖掘和清洗训练优化,语种英语,法语,德语,西班牙语,葡萄牙语,俄语等9中的单语和双语挖掘和整理,模型训练和上线; 工作业绩 该项目荣获:ICBU国际技术部2012年度“CTO”项目团队奖,申请专利5篇,第一作者1篇,2)智能导航项目; 项目负责人,整合和优化多个频道的导航系统,该项目荣获:团队2013年Q2季度哥伦布大奖;

教育经历

  • 2007-09-03 - 2010-07-01苏州大学计算机应用技术硕士

技能

C++精通
Python精通
Torch熟练
0
1
2
3
4
5
0
1
2
3
4
5
作品
企业智能体开发及RAG问答系统建设(最近一份工作的相关工作内容)

搭建企业级的RAG知识管理系统,包含核心模块:文档解析和结构化,知识图谱建设,片段切分,检索召回,片段,片段生产,大模型问答等。多模文档内容解析及流程优化迭代优化RAG问答系统,提出精简上下文的优化思路和效果优化,实现了多资源类型:文档,知识库,图片等综合问答RAG系统;

0
2026-06-26 17:33
更新于: 2小时前 浏览: 2