自然语言处理

将传统的单一意图预测系统改进为多意图预测系统,实现了任务型对话系统中多意图识别和槽位填充的深度学习联合模型。 为解决单一联合模型无法捕捉全部信息和处理复杂关系的问题,采用了显式和隐式交互的联合建模技术,捕捉不同层级的信息。 针对标签不确定性产生过度指导的问题,构建了槽位共振矩阵并使用图网络,缓解了信息间的过度指导。 通过使用非自回归模型,并行意图识别和槽位填充任务,显著提升了系统的响应效率,将平均响应时间控制在了50毫秒以内。 在MixATIS和MixSNIPS数据集上的实验结果显示,该模型效果超过了现有可复现的模型效果,上线后服务用户超1万人。 本项目需要解决的问题是将招投标等各种类型的公告进行分类以及抽取招标公告中的联系人、标的物、预算金额等14个字段。 针对技术中存在类别多样、段落多样、指代多元、表格嵌套的难点,构建HTML语法树,采取深度学习和规则方式相结合的方法。 通过命名实体识别、智能分词、滑动窗口、规则匹配方法,文档解析准确率达99.8%,有效分类公告并精准识别抽取关键信息。 发表专利“网页文档的信息提取方法、装置和可读存储介质”,目前已被多家企业采用。
830Java自然语言处理
命名实体识别源文件源码
1.面向NLP模型做的基础模型。对于中文语句进行NER,中文命名实体识别。 2.基于训练库对语句进行拆分,得到每个词汇的类型和位置标注。 3.采用BIO和BiLSTM-CRF模型算法。 4.对10000个数据进行测试,准确率可达90%以上。
1680Pythonpython1000.00元
"通过AI及自动化技术实现7×24小时无人值守直播,降低90%人力成本,提升直播转化率" ▸ 传统直播人力成本高:单场直播减少2-3名运营人员 ▸ 直播时段限制:实现凌晨流量蓝海时段自动开播 ▸ 互动效率低下:AI实时响应速度
520python服务框架/平台2000.00元
目标检测源文件源码
本方案旨在解决目标检测和视频帧的多目标检测,该任务应用于后续的多目标跟踪和分割等任务。可根据用户需求更换数据集,不仅限于人。本方案使用深度学习框架,相比于传统算法,精度更高,本方案无需训练即可使用。
1390深度学习python
传奇英雄对战源文件源码
一款以LLM大语言模型为生产基础卡牌冒险对战游戏 1. 卡牌制作:卡牌有人物、装备、技能三种卡片,三种类型的卡片可以通过给LLM模型输入小说文本,通过适当的prompt进行提炼,最终得到想要的卡牌制作素材 2. 卡牌人物冒险:人物卡牌冒险,冒险过程获得装备或者技能卡牌的奖励。可以利用LLM的强大文本能力,通过prompt设定冒险背景以及起点终点,过程当中可以接受玩家的输入给出反馈 3. 卡牌对战:人物卡牌之间的对战,根据人物自身的装备和技能卡牌,利用LLM随机对战释放技能,配合文生图的输出,达到丰富的战斗效果
1890python游戏10000.00元
1、面向所有需要监控企业舆情风险的个人和单位。 2、周期性自动爬取指定新闻网站新闻,借助对齐后的大模型出生的文本理解能力,落库企业舆情风险到数据库。 3、简易的使用方法,只需要指定新闻网站、监控频率,查看监控结果即可。
1600python网络爬虫0.10元
OCR文字识别源文件源码
文字识别是一种将图像中的文本内容转换为可编辑和搜索的数字文本的技术。它广泛应用于各种场景,包括文档数字化、自动化数据输入、信息检索等。OCR的应用场景 文档数字化: 将纸质文档扫描成图片,并通过OCR转换为可编辑、可搜索的数字格式,如PDF或Word文档。 自动数据录入: 在银行、保险、医疗等行业,OCR用于自动识别单据、发票、账单等内容,提高数据录入效率。 车牌识别: 在交通监控系统中,OCR技术用于自动识别车牌号码。 手写体识别: OCR不仅用于打印文本的识别,也可以扩展到手写体的识别,尽管手写体识别相对复杂。 图像中的文字提取: OCR还可以应用于从图像或照片中提取文本,常见于广告、宣传单、商品标签等场景。 OCR技术的演进 传统OCR:早期的OCR技术主要基于模板匹配和规则的方法,效果较为单一,识别准确度受限。 机器学习OCR:随着机器学习的进展,OCR开始采用训练模型来识别字符,通过大规模数据的训练,提高了对不同字体、语言和格式的适应能力。 深度学习OCR:近年来,深度学习(特别是卷积神经网络CNN和循环神经网络RNN)的发展,使得OCR技术大幅提升,尤其在手写体识别和多语言文本识别方面,表现得尤为出色。现代OCR系统能够处理更加复杂的文本图像,并且能够适应各种字体、噪声和变形情况。
1641图像处理自然语言处理
我是一名专注于深度学习和人工智能领域的软件工程师,拥有丰富的实践经验和扎实的技术背景。我擅长使用 Python 进行编程,并在图像处理和自然语言处理领域有着深入的研究和实践。我曾成功应用深度学习模型于新闻文本分类、人体姿态识别项目以及图像分类检测等任务。 项目经验 新闻文本分类系统: 行业应用:媒体、出版、内容分析 功能实现:自动化新闻内容分类,个性化新闻推荐,内容审核 技术亮点:利用预训练模型 BERT 提升分类准确性,支持多类别文本分类 人体姿态识别系统: 行业应用:健康监测、运动分析、安全监控、人机交互 功能实现:运动训练分析,老年人跌倒检测,异常行为识别 技术亮点:实时数据处理,高准确性的姿态识别算法,易于集成的 API 设计
2480python网络爬虫100.00元
在最近三周时间里,我分别收集了发布于新浪网站的国内(Domestic News)与国际新闻(International News)。针对每条新闻,我都一一记录了新闻的标题,发布时间,来源及新闻报道的正文,并将相关数据存储于MySQL数据库中,以供后期数据查询与分析。之后依据收集到的新闻数据,进行数据格式清洗,冗余数据剔除等数据预处理步骤。接下来分析了新闻发布日期、发布时刻、新闻来源的分布情况,最后制作了新闻标题的词云分布图。通过对比国内与国际新闻分布情况的差异,分析隐藏在数据背后的统计规律与现象。 
1550python大数据1000.00元
Roberta文本分类源文件源码
采用Roberta对本地IMDB数据库进行情感二分类。这段代码定义并训练一个基于RoBERTa的文本分类模型,使用IMDB电影评论数据集进行训练和验证。首先通过IMDBDataset类加载并预处理数据,然后利用DataLoader创建数据加载器。在训练过程中,模型使用AdamW优化器,评估指标包括损失、准确率和召回率。每个训练周期结束后,保存模型权重,并在验证集上评估模型性能。代码还包含进度条显示和种子设置,以确保结果的可重复性。
3950python自然语言处理
1.面向生物信息学以及临床科研人员的分析爬虫软件。 2.比以往的产品更加简洁直观。 3.方便科研工作者工作。 4.界面直观,可以调整的参数多。 5.有gui模式和命令行模式,方便各个行业人员的使用。 6.进行了很好的封装,是对能力的一次检验。
2140python医疗100.00元
当前共11个项目
×
寻找源码
源码描述
联系方式
提交