自然语言处理

Roberta文本分类源文件源码
采用Roberta对本地IMDB数据库进行情感二分类。这段代码定义并训练一个基于RoBERTa的文本分类模型,使用IMDB电影评论数据集进行训练和验证。首先通过IMDBDataset类加载并预处理数据,然后利用DataLoader创建数据加载器。在训练过程中,模型使用AdamW优化器,评估指标包括损失、准确率和召回率。每个训练周期结束后,保存模型权重,并在验证集上评估模型性能。代码还包含进度条显示和种子设置,以确保结果的可重复性。
3150python自然语言处理
OCR文字识别源文件源码
文字识别是一种将图像中的文本内容转换为可编辑和搜索的数字文本的技术。它广泛应用于各种场景,包括文档数字化、自动化数据输入、信息检索等。OCR的应用场景 文档数字化: 将纸质文档扫描成图片,并通过OCR转换为可编辑、可搜索的数字格式,如PDF或Word文档。 自动数据录入: 在银行、保险、医疗等行业,OCR用于自动识别单据、发票、账单等内容,提高数据录入效率。 车牌识别: 在交通监控系统中,OCR技术用于自动识别车牌号码。 手写体识别: OCR不仅用于打印文本的识别,也可以扩展到手写体的识别,尽管手写体识别相对复杂。 图像中的文字提取: OCR还可以应用于从图像或照片中提取文本,常见于广告、宣传单、商品标签等场景。 OCR技术的演进 传统OCR:早期的OCR技术主要基于模板匹配和规则的方法,效果较为单一,识别准确度受限。 机器学习OCR:随着机器学习的进展,OCR开始采用训练模型来识别字符,通过大规模数据的训练,提高了对不同字体、语言和格式的适应能力。 深度学习OCR:近年来,深度学习(特别是卷积神经网络CNN和循环神经网络RNN)的发展,使得OCR技术大幅提升,尤其在手写
1341自然语言处理
聚类工具产品系统
解决文本聚类 数据预处理部分 当前问题: 报告中仅提到了基本的滤波和去噪,但未详细说明预处理的具体方法和挑战。 建议补充: 1. 噪声去除技术 我会使用: 小波变换(Wavelet Transform, WT) 技术分析: o小波变换(Wavelet Transform, WT) o原理:小波变换可以分解 ECG 信号的不同频率成分,去除高频噪声(如肌电干扰)或低频噪声(如基线漂移)。 o优点: 适用于非平稳信号(ECG 是一种非平稳信号)。 能在时域和频域上精确定位信号特征。 可分离不同噪声类型(肌电干扰、高频噪声等)。 o缺点: 需要选择合适的小波基(如 Daubechies 小波)。 参数调整较复杂,容易影响信号质量。 QRS 复合波检测 使用: CNN/LSTM 进行 R 波峰检测 Pan-Tompkins 算法 二选一待定 分析: 优点: 实时性强: Pan-Tompkins 算法适合在实时监测中应用,因为它的计算量较小,处理速度快。 对硬件要求较低,可以在嵌入式设备或微处理器上运行,适合移动监护仪等设备。 高效性:  算法简单且易于实现,基于经典
1060自然语言处理
龙测科技产品系统
龙测科技是一家专注于AI-TestOps软件测试的国家高新技术企业,也是一站式自动化测试工具提供商。龙测AI-TestOps云平台的核心理念是利用现代AI技术及先进测试算法,彻底改变目前手工及自动化软件测试形态。在ARM技术的支持下,龙测科技拥有涵盖市面上绝大部分软硬件系统的UI功能产品体系,凭借全球领先的测试代码生成器技术、测试代码一键自动生成等能力,为行业客户提供高效、可维护、低成本的自动化测试工具,为产品质量保驾护航。
570JavaJavaScript10000.00元
1.面向人群: - 自媒体创作者(播客、视频博主) - 企业内部会议系统 / 智能客服系统 - 教培机构、讲座平台 - 内容审核、运营辅助人员 2. 解决的问题: 在现实场景中,大量语音信息(如音频会议、电话录音、直播内容)无法被高效地提取、理解与归档。本方案提供自动化语音转文字+关键词提取API服务,解决以下痛点: - 手动听写费时费力 -关键信息散乱,无法提取重点 -无法快速生成结构化摘要或报告 通过本方案,用户只需上传音频文件,即可获得:高精度的文字转写内容;核心关键词、时间点、摘要信息;可嵌入工作流的标准 JSON 响应结构 3.核心模块构成 1) 音频转文字模块;2) 文本关键词提取;3)异步 Web API 服务;4)文件预处理模块 4.API返回结果 { "transcript": "我们今天主要讨论的是项目进度和资源配置问题……", "keywords": ["项目进度", "资源配置", "关键风险"], "summary&
940Python自然语言处理
本方案面向谁,解决了什么问题 本方案主要面向对中医感兴趣的用户,尤其是希望通过简单、便捷的方式了解自身健康状况的人群。它解决了传统中医诊断中需要专业医师面对面诊断的痛点,通过AI技术实现了舌苔和面相的初步分析,帮助用户快速了解自身的身体状况,并提供相应的药方推荐,方便用户进行自我调理。 相比于市场常规方案,本方案有哪些特点 AI驱动的中医诊断:与市场上常见的健康类APP不同,本方案结合了AI技术与中医理论,能够通过舌苔和面相图片进行智能分析,提供个性化的健康诊断和药方推荐。 推理图解析:本方案的核心亮点在于推理图,用户可以清晰地看到从舌苔和面相信息到药方推荐的逻辑推理过程,增强了诊断的透明度和可信度。 便捷易用:用户只需上传舌苔和面部图片,即可获得初步诊断和药方推荐,操作简单,无需专业中医知识。 个性化推荐:基于用户的舌苔和面相分析结果,AI初诊器能够提供针对性的药方推荐,帮助用户进行精准调理。 方案的产品组成或技术选型 图像识别技术:用于分析用户上传的舌苔和面部图片,识别颜色、厚度、纹理等特征。 中医知识图谱:结合中医理论,构建症状与药方之间的关联关系,支持AI推理和
2931python医疗
在线考试系统产品系统
内容: 基于集团大数据平台专区核心产品技术分为平台和数据模型开发,机器学习和AI算法、数据治理,垂直场景等方向,通过该认证证明用户能基于集团大数据平台专区产品在对应的技术方向上解决企业的基本业务问题。平台包括以下模块:考试引导页、考试报名、考试答题、题库管理、试卷管理、报名管理、考试评估、考试统计、我的考试、导出统计。 业绩: 主要负责考试引导页、报名、考试答题、报名管理、我的考试前端vue页面开发和后端springboot接口开发;参与考试中监控功能和考试结束导出等功能设计;参与整个项目的上线以及并发压测性能问题的调优工作;参与后期考试评分的支撑相关工作。
920JavaNginx扩展模块10000.00元
作品地址:http://www.latexai.com/ 分为渲染、识别、生成模块,均由本人完成 渲染模块功能为,帮助大家写latex表达式,并渲染出来,可导出png\svg\word格式的公式表示。 同时支持有限的AI公式识别转换为latex表达式,可选输出可视化的模型内部的attention部分
2220LaTeX排版系统
全栈开发,独立完成 该项目使用自研的医疗知识图谱问答算法以及自构建的医疗知识图谱作为数据源 算法主要包含知识图谱嵌入模块、自然语言语义分析模块、答案匹配模块 后端使用python与nginx实现 前端使用vue搭建,并实现窗口自适应功能 为用户提供简单的医疗知识问答功能
2220pythonvue
同声传译产品系统
基于大模型实现英语,德语,法语,中文,日语相互同声传译。 输入一个音频,输出一个对应文字的文件,音频按流式输入给模型。 通过大量数据训练模型,使其能够识别语言模式和结构。深度学习则进一步利用神经网络模拟人脑处理信息的方式,提高翻译的准确性和流畅性。 神经机器翻译(Neural Machine Translation, NMT)是当前最先进的翻译技术。与传统统计机器翻译(SMT)相比,NMT使用深层神经网络,能够更好地捕捉语言的复杂性和上下文信息。NMT模型通常包括编码器(Encoder)和解码器(Decoder)两部分:编码器将源语言文本转换为向量表示,解码器则将这些向量转换为目标语言文本。
1410人工智能2000.00元
1.本方案基于市面上通用大语言模型,解决了大语言模型在垂类领域数据不足的问题,使用RAG技术,构建本地数据库 2.本项目解决了医疗知识问答中数据生成的困难,使用大语言模型技术生成式问答,新型问答方式 3.本项目标场景在医院诊所等,可以有效解决医疗问答的对话问题 4.在问答中,非有关医疗的问答,程序直接对接到大语言模型豆包上,回复,有关本地数据库的医疗式问答,则利用RAG技术,进行生成回复。
830python自然语言处理1000.00元
玩皮王产品系统
基于k8s的容器云平台构建项目,自定义注解防止重复提交,引入Quartz框架定时任务,使用Lock锁 实现并发请求锁机制,使用Lock锁机制,实现并发请求的锁定,确保关键操作的原子性和数据的一致性  通过平台进行批量处理,利用SpringAOP对Excel导出功能进行限流,避免出现大数据导致内存溢出 的情况,利用MyBatis插件对返回结果中包含的客户敏感数据进行脱敏  使用jstat查看JVM信息,因YoungGC过于频繁,增大新生代的内存比,从而减少了总的GC时间, 并将堆区启动内存和最 大内存设置相等,防止JVM反复调整堆内存大小而产生的性能消耗  基于静态ThreadLocal封装线程隔离的全局上下文对象,用于存取用户信息等全局数据,减少对远程查
570AndroidJ2EE框架
命名实体识别源文件源码
1.面向NLP模型做的基础模型。对于中文语句进行NER,中文命名实体识别。 2.基于训练库对语句进行拆分,得到每个词汇的类型和位置标注。 3.采用BIO和BiLSTM-CRF模型算法。 4.对10000个数据进行测试,准确率可达90%以上。
1110Pythonpython
项目模块: 主要是针对text2SQL任务的全链路优化,增加了SQL数据可视化的推理过程,实现整体的数据可视化Agent. 项目分工: 负责对业务整体的建模,包括SQL生成任务的优化,图表关系的业务建模,和API参数的智能生成。 主要包括: SQL生成任务的拆解优化,针对图表分类和参数抽取的业务建模,COT优化,图表和API参数关系抽取,以及参数的对齐优化功能等等。 成果: 跑通了从文本到数据可视化的全流程,支持了5种复杂的数据可视化业务需求,达到业务交付标准。 欢迎合作: 作者在对话领域有多年的研究经验,LLM应用落地上有丰富的实战经验,在这块有大量的交付案例,欢迎有相关业务需求的公司进行合作。
2790大模型
本方案提供了完整的用户体系与各种第三方鉴权体系,使用了Turnstile 闸机过滤无效访问,APP管理可以嵌入任意已开发的web应用,并追加鉴权机制。 本方案中主要使用了AI低代码工作流快速搭建AI赋能的轻量级应用,并提供发布。
940人工智能1000.00元
项目分大模型、后端、前端三部分 大模型经数据训练得到领域大模型 后端使用django框架调用大语言模型接口 前端采用vue框架
3670自然语言处理
医疗综合信息分析平台 项目背景: 以用户的病例信息作为输入,抽取疾病信息,所属领域类别信息,病状的描述信息,处方信息以及对应的禁忌事项信息等。将该信息抽取完成后存储至数据库。最后由专业人员对相关信息进行质检,完成医疗信息的知识落库。 项目分工: 本人主要负责对病例信息的领域分类,疾病名称识别,病状信息描述,处方信息抽取和禁忌事项的抽取业务。即通过大模型对病例信息的数据实现多个维度的信息抽取工作。 项目成果: 完成外科和耳鼻喉科领域下,数百种疾病信息的知识抽取,准确率达到90%以上。 欢迎合作: 作者在对话领域有多年的研究经验,LLM应用落地上有丰富的实战经验,在这块有大量的交付案例,欢迎有相关业务需求的公司进行合作。
2430大模型
项目是面向考编考公的被培训人员,针对他们的需求进行模拟的AI面试,通过学员的回答,经过三步生成对应的报告: 1、根据学员回答的视频(或只语音)通过AI模型,转换成文本 2、根据学员回答的文本,加上题目和参考答案,按照需求组织成上下文,通过AI大模型处理获得批改结果(优点、不足、各项分数等) 3、根据AI批改结果,组织成流程的文字,用模拟老师的声音去转成点评语音 整个报告返回学员查看,这个是核心功能
470PythonAI
将传统的单一意图预测系统改进为多意图预测系统,实现了任务型对话系统中多意图识别和槽位填充的深度学习联合模型。 为解决单一联合模型无法捕捉全部信息和处理复杂关系的问题,采用了显式和隐式交互的联合建模技术,捕捉不同层级的信息。 针对标签不确定性产生过度指导的问题,构建了槽位共振矩阵并使用图网络,缓解了信息间的过度指导。 通过使用非自回归模型,并行意图识别和槽位填充任务,显著提升了系统的响应效率,将平均响应时间控制在了50毫秒以内。 在MixATIS和MixSNIPS数据集上的实验结果显示,该模型效果超过了现有可复现的模型效果,上线后服务用户超1万人。 本项目需要解决的问题是将招投标等各种类型的公告进行分类以及抽取招标公告中的联系人、标的物、预算金额等14个字段。 针对技术中存在类别多样、段落多样、指代多元、表格嵌套的难点,构建HTML语法树,采取深度学习和规则方式相结合的方法。 通过命名实体识别、智能分词、滑动窗口、规则匹配方法,文档解析准确率达99.8%,有效分类公告并精准识别抽取关键信息。 发表专利“网页文档的信息提取方法、装置和可读存储介质”,目前已被多家企业采用。
350Java自然语言处理
视频描述产品系统
1. 使用transformer模型,完成视频序列到文本序列的转换,可以用在监控视频的存档和视频理解上; 2. 主要编程语言为Python,为了方便展示,使用JavaScript语言编写了前段页面。 3. 本项目利用先进的Transformer模型,实现高效、精准的视频内容转文字功能。通过深度学习技术,自动识别视频中的语音对话,转换为文字文本,助力信息快速获取与整理。适用于会议记录、视频编辑等多场景,提升工作效率,让视频信息传递更便捷。
1201人工智能
当前共275个项目
×
寻找源码
源码描述
联系方式
提交