个人介绍
我是程序员客栈的火映,一名拥有6年经验的资深算法工程师及全栈开发者;
我毕业于郑州大学软件工程专业,曾担任阿里巴巴应用算法工程师及科大讯飞核心技术研究员,曾在美国大学实验室工作一年,目前经营自己的科技工作室;
负责过闲鱼多模态预测系统、科大讯飞NLP主题分析系统、实验室管理和SaaS系统的核心研发;
熟练使用Python (PyTorch/TensorFlow)、PHP、R语言、BERT/ResNet多模态模型、MySQL及Linux服务器部署;
我能为您提供从AI模型训练、数据分析挖掘到Web系统落地的全套解决方案,点击“立即预约”让我们开始合作!
工作经历
2025-09-01 -2026-03-01郑州市幼儿师范专科院校python基础编程代课老师
负责9个班级的python编程教学,后续辞职后成立了自己的工作室(郑州市中原区火映信息科技工作室),目前工作室主要维护火映智能剪辑这个产品。
2023-08-01 -2025-03-01UTHSC(美国田纳西大学)实验室实验员
卵巢癌基因数据相关研究 1. 数据库分析: 在大型数据库中,使用 R 语言分析不同的差异基因,绘制火山图、热图、相关系数图,并进行 GO 分析、KEGG 分析及 PPI 分析,以辅助基因筛选。 2. 同时,基于基因的机器学习和其他深度模型进行基因筛选和分子对接。 3. 构建实验室管理系统: 开发了一个实验室管理系统,实现无纸化管理。系统可记录设备订购、物品存储及采购信息等
2021-06-05 -2023-06-01阿里巴巴应用算法
项目一,闲鱼CPV预测: 1、类目预测:根据用户发布的图片和文本信息来进行1w个类目的预测,采用多模态模型(resnet50+bert)作为backbone,在优化的过程中主要集中于多模态的预训练、对比学习、标签信息融入和GCN融入等trick,其中多模态预训练的目标函数包括MLM、TIL和QAL三个,预训练数据量达到了2亿的级别,在效果上F1能提升4%左右;对比学习主要用到了R-drop和SimCSE等目标函数,在效果上F1能提升1%左右;标签信息和GCN网络融入,F1提升0.5%左右。负责闲鱼类目从标注训练到上线的整个流程,目前线上QPS大小为600。 模型迭代:由于业务的需求会不断更新类目,比如最近增加的食品生鲜类目,F1均大于80%。, 沉淀:一个多模态、单图、单文等模型框架 2、属性预测:结合query理解和商品理解,提升搜索相关性,负责cpv知识库的挖掘,并理解商品的cpv,产出的cpv信息和query侧进行检索,其手机类目上的精度和覆盖均大于90%,并且top1w query的badcase率相对-30.04%;同时大盘top80w query采样评测badcase率下降
2019-07-21 -2021-06-01科大讯飞核心技术研究员
项目一,基于BERT的多标签分类研究:负责军政外相关数据筛选、标签的定义、推进数据的标注以及模型的搭建及优化等工作。在模型优化过程中,由于数据标注质量存在问题,利用5折交叉验证的方式筛选出更可能是标注错误的数据,并进行回标,效果F1提升2.32%;发现数据中存在较多稀疏标签,因此通过数据增强的方式,利用增添替换及回译的方式,最终效果F1提升2.9%;后面发现数据中存在一些明显和标签信息相似的情况,但未召回,因此修改网络结构加入标签信息,效果F1提升1.06个点;因为定义的标签达到123个之多,且44%的数据为2个标签以上,因此用传统的BCELoss无法很好训练,采用了多标签损失函数,利用了LogSumExp函数的性质,最后效果比BCELoss方式要好。 所属项目:主题分析 项目二,基于远程监督的关系抽取研究:负责模型方案设计及模型优化等工作。组内之前一直利用规则来进行关系抽取,因此在设计方案过程中考虑到了原有的数据标注格式,设计了远程监督的方式来进行关系抽取,在数据预处理阶段采用不规则划窗的方式、增加上下文特征、修改BERT输入中的SegmentId、采用selective atte
教育经历
2016-09-01 - 2019-07-01郑州大学软件工程硕士
研究方向为NLP(自然语言处理),具体包括情感词典的构建,文本分类、实体命名识别、关系抽取等内容
资质认证
语言

1、智能路由转发:支持后端配置多个上游AI服务商账号,系统可根据负载情况自动轮询或故障转移,保证服务的高可用性。2、标准化接口输出:完全兼容OpenAI官方SDK格式,用户无需修改代码即可无缝切换至本平台接口,支持流式传输(Stream)。3、可视化数据看板:提供Token消耗量、请求成功率、响应延





