竹不言
全职 · 300/日  ·  6525/月
工作时间: 工作地点: 远程
服务企业: 0家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

我是程序员客栈的竹不言,一名算法工程师。

我毕业于北京邮电大学,担任过用友的算法工程师负责过VPA意图识别和槽位填充服务,招中标公告信息分类抽取技术实现;熟练使用Python、PyTorch、Java;如果我能帮上您的忙,请点击“立即预约”或“发布需求”!

工作经历

  • 2022-01-01 -2024-06-28用友算法工程师

    负责自然语言处理中的算法研究与实现,包括文本抽取、文本改写、文本纠错、意图识别、槽位填充等任务。

教育经历

  • 2022-09-01 - 2025-06-01北京邮电大学软件工程硕士

  • 2018-09-01 - 2022-06-01北京邮电大学电子信息本科

语言

普通话
0
1
2
3
4
5
0
1
2
3
4
5

技能

0
1
2
3
4
5
0
1
2
3
4
5
作品
VPA意图识别和槽位填充服务/招中标公告信息分类抽取技术实现

将传统的单一意图预测系统改进为多意图预测系统,实现了任务型对话系统中多意图识别和槽位填充的深度学习联合模型。 为解决单一联合模型无法捕捉全部信息和处理复杂关系的问题,采用了显式和隐式交互的联合建模技术,捕捉不同层级的信息。 针对标签不确定性产生过度指导的问题,构建了槽位共振矩阵并使用图网络,缓解了信息间的过度指导。 通过使用非自回归模型,并行意图识别和槽位填充任务,显著提升了系统的响应效率,将平均响应时间控制在了50毫秒以内。 在MixATIS和MixSNIPS数据集上的实验结果显示,该模型效果超过了现有可复现的模型效果,上线后服务用户超1万人。 本项目需要解决的问题是将招投标等各种类型的公告进行分类以及抽取招标公告中的联系人、标的物、预算金额等14个字段。 针对技术中存在类别多样、段落多样、指代多元、表格嵌套的难点,构建HTML语法树,采取深度学习和规则方式相结合的方法。 通过命名实体识别、智能分词、滑动窗口、规则匹配方法,文档解析准确率达99.8%,有效分类公告并精准识别抽取关键信息。 发表专利“网页文档的信息提取方法、装置和可读存储介质”,目前已被多家企业采用。

0
2025-06-04 15:22
更新于: 06-04 浏览: 9