工作经历
2020-06-22 -至今蚂蚁集团知识图谱
图谱表示学习,异质Encoder算法探索,以GAT和CompGCN模型为基础,针对GAT模型改进体现在融入异质Encoder和支持信息双向流动,并对GAT的Attention方式进行改进;并将改版后的GAT的Attention加入到了CompGCN模型中,在公开数据集FB15k-237上MRR相比于SOTA提升了两个点。
2019-09-01 -2020-05-31百度算法工程师
参与项目:基于小度在家的地图服务等空间域数据做Query Understanding工作 我的工作: 1、前期调研: Query Intent Prediction 和 Entity Linking 领域进行相关的调研总结; 2、数据预处理:定义四轮标注工作规则,Spatial-NER模块,候选实体生成模块; 3、多任务模型:两个主任务Entity Linking和Intent Prediction,两个辅任务Query Type Prediction和Mention Type Prediction四个模型联合训练相互提升,Mention Type Prediction是模型枢纽。 4、模型核心:意图分类使用Hierarchical Classification;实体链接打分采用Triple-Scoring机制;结合数据空间域的特性,使用GCN构建候选实体的三种空间依赖关系:HAS,COVER和NearBy。
2018-12-01 -2019-07-01滴滴算法工程师
参与项目:1、滴滴行程录音安全事件监控,2、实时工单标题预测 我的工作:搭建行程录音安全事件监控二分类模型 和 实时工单标题预测多分类模型 1、首先对数据进行多重清洗,例如:去除导航音数据,数据中加入角色信息等; 2、实验多种词向量预训练方法如:Word2vec\Glove\Fasttext\Elmo\Bert\Flair(Github); 3、实验了多种分类模型:Cnn\Rnn\Fasttext\ Xgboost\Han\Bert\Bert+Cnn等; 4、在词向量预训练和分类模型时均做分字\分词两组对照实验。
教育经历
2018-09-01 - 北京大学计算机应用技术硕士
北京大学在读硕士,担任班级班长
技能
山东大学本科生实验室 创新项目小组组长 (2016.05-2016.12) 项目简介:目的制作为大型商城服务的智能购物车 我的工作:规划整体框架,主要参与实现室内定位(惯性定位+RFID定位)、人体动态锁定跟踪功能
公众号名称:机器学习与自然语言处理,部分文章访问链接可查看:http://mp.weixin.qq.com/mp/homepage?__biz=MzU1NTU3Njg4Mw==&hid=2&sn=cf9b3bdcf61e2339f6301299b3e3cbdc&scene=18#wechat_redirect