NLP

NLP(自然语言处理)是人工智能的一个重要分支,致力于研究计算机与人类自然语言之间的交互,目标在于使机器能够​​理解、解释和生成人类语言​​。其核心任务涵盖基础技术如​​分词、词性标注、句法分析​​,到高级应用如​​机器翻译、情感分析、智能问答、文本摘要和语音识别​​。传统方法依赖统计机器学习与语言学规则,而现代NLP几乎完全由​​深度学习​​驱动:​​词嵌入​​(如Word2Vec)将词语映射为稠密向量,​​循环神经网络(RNN)​​、​​长短期记忆网络(LSTM)​​ 以及​​Transformer架构​​(如BERT、GPT系列)依靠注意力机制彻底改变了序列建模能力,使模型能够捕捉上下文语义的细微差别。预训练大语言模型(LLM)的出现,如ChatGPT,进一步推动NLP进入通用语言理解和生成的新阶段。NLP技术已广泛应用于搜索引擎、智能助理、机器翻译、内容推荐、舆情分析等领域,持续推动人机交互方式的变革,并成为当代AI技术落地最成功的方向之一。
●项目介绍:本项目设计并实现了一个从单张人脸图像预测BMI的端到端系统。我们自行爬取数据并制作数据集,设计并实现了一个轻量级CNN。最终,模型在独立测试集上取得了4.39的平均绝对误差(MAE),并使用Flask框架将其封装成一个可交互的Web应用,完整实现了从数据获取、模型训练到服务部署的全流程。
990Python人工智能
● 高德地图的引入,开发行政区域的展示,点标记,图层多边形模式范围圈选 ● 可视化组织结构树脑图的封装 1. 基于开源插件 vue2-org-tree 的二次封装 2. 增加功能:放大缩小、居中显示、全屏展示、新增/删除/修改节点 ● 机器人和客户进行语音交互过程中提取关键字,填写到对应的 form 表单内 1. 浏览器的语音模块用 websocket 进行语音交互,获取到语音转成文字实时进行传输 2. 浏览器接收到对应类型的话术后,通过修改 element 的底层源码去触发对应表单的更新 ● 技术栈基于 vue2+echarts 进行开发
1520nlp
1. 一个网站,网址为:www.beatsleo.com:8080 2. 主要作用是:当做舆情分析系统,可以深度挖掘全国各省的不同心态以及引起该心态变化的事件,提供指导建议。 3. 通过爬虫技术对微博进行数据爬取、分析和统计。 4. 通过训练文本摘要模型、情感分类模型获得每条微博帖子的核心内容以及评论的心态倾向。 5. 通过训练GPT2生成模型为不同心态和事件提供引导建议。
2290爬虫
在语言级别的模态进行初步的情感识别并进行BERT的特征提取。 对于图片数据,利用CNN,Vi-Transformer进行特征提取,并利用Pytorch计算语言数据的对应程度,完成特征对其。 将对齐的数据进行特征融合,输出到Cross-Attention-Modality网络中进行前向传播与Loss计算。 针对不同的下游任务进行特定的超参数微调(Fine-Tuning).可将该模型迁移至任意给定的多模态任务。
1400机器视觉
1、大一阶段使用mdui、MySQL数据库、原生PHP自己制作并搭建纯原创博客系统2、100%自主开发3、后续会加入文本生成模型4、演示地址https://cms.geeklab.work/login.php5、精通python的flask框架,熟悉api接口规范并能写出
1920PHP人工智能
自然语言处理基准库评测平台,人工智能算法展示、评测平台。团队长期致力于自然语言处理技术的研发和应用,采用迁移学习、对抗学习、条件随机场、图神经网络、动态图卷积网络等先进的深度学习技术,结合千亿级全球多语言文本语料数据资源,构建了精准高效的多语自然语言处理算法,包括分词、词性标注、语种识别、相似度计算、句法依存、情感分析、文本摘要、关键词抽取、文本分类、文本质量评估、命名实体识别、三元组抽取、事件抽取、知识消歧、文本生成、检索问答等各个层面,能够为深度分析全球跨语言文本提供一站式信息处理解决方案。目前平台可以支持180多种语言的处理,提供10多类算法及60余种算法服务。
2450人工智能
• 对说话人识别系统进行后门攻击 o 设计了一个白盒后门攻击系统,使用 VoxCeleb1 数据集和数据污染,攻击基于 ResNet-34 的说话人识别 系统和开源说话人识别平台 Kaldi。这是首个全面攻击说话人识别系统的工作。 o 设计了两个常见说话人识别任务的数字和物理后门攻击:说话人验证任务和闭集说话人识别任务。 o 在这两个任务上实现了 89%以上的数字攻击成功率和 70%以上的物理攻击成功率(ISPEC 2022, Long paper)。 • 通过文本数据增强以提升 NLP 模型的性能 o 通过创建同义词和反义词样本以及特征空间优化来微调RoBERTa。在文本分类任务中比基准RoBERTa 模型准确率提高了约 5.4%,在文本相似性任务中达到了约 0.907 的皮尔逊积矩相关系数。 o 使用数据增强方法将SQuAD问答数据集转换为掩码语言模型数据集,以丰富域外数据的代表性, 并微调了 Hugging Face DistilBERT 模型,将其问答性能提高了约 3.3% (基于 F1 分数)。 o 对Covid19推文文本进行数据增强以预测转推次数,在LSTM-GRU上实现了约149的平均绝对误 差(Kaggle Best Performance 127),在情感分析任务上的分类准确率达到约 93.7%。
4580人工智能
1.项目包含知识体系上传、知识体系修改、知识图谱三元组上传、知识图谱可视化展示、实体检索等功能模块。 2. 本人主要负责所有的后端接口。用MySQL存储必要的列表等信息,用Neo4j存储知识图谱数据,基于Neo4j实现知识图谱中的实体检索。后端整体使用Django框架,前端由前端开发人员基于Vue框架实现。 3. 系统支持用户自定义知识体系,支持知识体系以及三元组数据的上传,自动将数据导入数据库,并支持子图的可视化展示
2990人工智能
深度学习和自然语言处理技术,我们将改进搜索算法和模型,以提供更精准的搜索匹配和更好的用户体验。 项目的关键目标之一是改进搜索结果的相关性和排序。使用DeepQA技术,我们将利用大规模数据集进行训练和优化,以提高搜索系统对用户查询的理解能力,从而生成更准确、相关的搜索结果。通过深入挖掘文本语义和上下文信息,我们的系统将能够更好地理解用户意图,并提供更贴合用户需求的搜索结果。 此外,我们还优化了搜索系统的速度和效率。通过应用深度学习模型和高性能计算技术,我们将提高搜索系统的处理速度和响应时间,使用户能够快速获取搜索结果。我们将优化系统架构和算法,以提高搜索索引的构建和更新速度,从而保证搜索系统的实时性和准确性。
2760nlp
业务问题诊断:  项目一期遗留问题:算法、标注数据的质量等问题,导致一期的知识应用效果不明显。  难以满足业务发展:随着业务规模的发展,标注系统不再局限于小规模使用,还需要实现大规模众包模式的标注。  标注系统智能化待提升:标注系统大规模的运用对标注的智能化需求尤为明显,需要提高标注的智能化水平。  图谱构建门槛高:非结构化文本在构建知识图谱的过程中对业务人员要求的门槛较高,需要花费大量的人力。 解决方案:  一期功能优化:对一期平台功能、流程和算法进行完善和优化,提供从数据采集到应用的一站式管理能力。  标注系统改造:构建众包标注的标注工作体系;构建智能化的标注能力,提升标注任务效率。  知识库构建工具搭建:从0-1搭建一套自底向上的大规模知识库构建工具——知识获取、知识建模、知识融合、知识管理四大核心功能模块,降低构建知识图谱的门槛,提升构建效率。 工作内容:  主要负责业务问题诊断、核心业务流程梳理、原型设计、文档编写、UI设计沟通、组织项目会议、制定开发计划、团队协作、产品测试、产品培训等工作。 项目成果:  标注效率提升:通过对标注系统的众包适配和智能标注的优化,提升了业务人员标注非结构化文档50%的效率。  降低图谱构建门槛:通过知识库构建工具的搭建,降低了业务人员构建知识图谱的门槛和难度,提升了构建效率。  应用场景效果提升:通过对算法模型的优化和数据治理,提升了智能问答、知识搜索结果30%的准确率。
3790文本标注
完整一键预测任务,如分词,词性标注,NER,改写,续写,文本分类,文本分类可解释性等功能,后端搭建服务,用Python语言撰写,flask框架。
2050NLP
当前共11个项目more
×
寻找源码
源码描述
联系方式
提交