自然语言处理

【1】用百川、千问等国内优秀大语言模型测试特定领域知识问答效果,并引入检索增强提升问答准确率 【2】针对特定领域结合传统小模型完成文件拆解、分类等需求,分类准确率高达92%+。
990大模型
项目介绍: 该系统是集成了语音识别,大语言模型的智能面试系统,根据候选人的语音录入转成文字,再把文字输入给大模型进行分析评分。 项目组成: 1、前后端分离框架,后端使用django,前端使用vue框架和element-ui组件布局; 2、项目包含发起面试,报告管理,试卷管理,科目管理,题库管理等模块组成; 3、业务需求收集整理,页面设计,前后端代码编写都是独立一个人完成的; 技术难点: 1、语音识别使用了科大讯飞的语音识别接口,大语音模型分别调用了文心一言,清华GLM,科大星火认证接口进行对候选人的回答进行评分和分析; 2、在试卷管理模块中,需要从不同的题库中选择不同的题目组成试卷,当勾选不同科目下的题目时,需要保存勾选的值,最后完成选择后把问题列表组成试卷,当更新的时候,需要回显不同科目下的问题列表勾选框;
2310pythonpython
负责核心技术平台架构和技术预研,带领团队改造并完成内容数据平台和信息流分发平台,Feed流的智能化推荐、会员增值服务,车型库等基础技术平台建设和部署,支撑亿级用户高并发访问。
1390Java服务框架/平台
模块:特征工程库,高速数据访问,特征筛选,用户画像,生命周期算法,目标识别(根据不同任务类型,产品类型,客户类型,从而推荐产品),流程评价
1250图表(Charting)
大模型有较强的语义理解能力、常识推理能力,任务规划能力,但在面向特定领域时,存在以下挑战: 领域知识匮乏 • 领域应用的本质是复杂决策。通用大模型具备宽 广的知识底座,具有宽度有余但深度不足,无法 直接胜任复杂任务。 大模型的“幻觉”问题 • 没有依据的答案,通过简单类比得出错 误答案,在企业内,需要确保领域问题 的准确性。 数据和知识过时,难更新 • LLM的知识很容易过时,很难更新;难以保证数 据的完整性,容易形成错误回答,或者无法回答。 对于给定信息的“忠实度” • 在领域任务中,我们需要大模型遵循特定领域的规范、制 度、流程和知识进行回答。然而,如果没有进行适当的调 优,大模型往往会抛开给定的文档或信息,而倾向于利用 已习得的通用知识进行自由发挥。飘逸的创造发挥与忠实 的事实陈述是一对难以调和的矛盾。 不可解释 • 生成的答案是否有依据?为什么是A而不是B?
2080机器学习/深度学习
项目描述:采用机器+人工的识别方法挖掘海量网络舆情中特定关注领域负面舆情,实现舆情自动化工单智能去重、分级、分类,解决了舆情爆发时海量舆情工单应急处置问题和舆情实时监控、实时告警问题。 职责/关键技术:负责项目管控和智能算法研发,包括产品设计、智能算法研发、实时、技术文档、项目验收。智能识别算法识别准确率达到92%,减少85%无效人工。熟悉舆情监控市场产品技术,熟悉舆情业务。 成效:实现总部和三十余家二级单位舆情实时监控,已运行3年,每天下派百余条有效工单
1890自然语言处理
通过私有化部署AI模型通义千问,将AI与JIRA打通,使用AI来预处理jira ticket,释放出更多的生产力,为用户带来更好的云上体验 通过AI预处理工单后,人工投入大大降低了35%,并且给用户带来了高效的服务响应体验,特别是新上云的用户,体验最佳,并不断探索通过agent来完成自动化运维工作
2000pythonLLM (大语言模型)
对比了注意力模型,Transformer模型,SeqtoSeq,Glove, BLue,LSTM 等算法在语义识别中的不同; 使用GLOVE矢量库对Transformer模型进行了改进,取得了较好的效果。
1120自然语言处理
爬取各招聘网数据, 进行了视图处理让用户可以更直观进行比较选择更具性价比,我主要进行爬取数据进行整理。
910图形和图像工具
该项目聚焦于大数据挖掘与社交媒体情绪分析领域,借助Python的数据挖掘技术和自然语言处理(NLP)工具,对海量推特数据进行了深度挖掘与精细解析。首先,项目运用爬虫技术获取大量推文数据,并对其进行清洗、预处理和结构化存储;随后,通过情感分析模型,从文本中抽取出用户的情绪倾向,如积极、消极或中立态度,并揭示其随时间、话题变化的趋势。 在此过程中,项目不仅绘制了反映推文情感分布的时间序列图,还采用了词云、热力图等多种可视化方式,直观展现了热点话题的情感色彩及关键词频次,从而为理解公众对特定事件或议题的社会情绪动态提供有力依据,同时也验证了数据挖掘与情感分析技术在社交媒体舆情监控中的强大功能与应用价值。
2050python情感分析
提出一种基于标题正文相似度和作者隐含情感的虚假新闻检测方法: 1.新视角——新闻作者潜在的主观情感来检测虚假新闻 2.新注意力机制——充分挖掘标题和正文之间的相似性
1410自然语言处理
1.项目是为了准确检测出游戏内聊天时,辱骂、敏感等的发言,(敏感词屏蔽,辱骂等分情况禁言) 2.我负责数据标注、模型训练 3.由于对时间响应要求很高,使用了简化的BERT+BLSTM+Attention
2380自然语言处理手机游戏
基于大语言模型ChatGLM创建的检索增强项目,可完成输入pdf文档后一站式直接创建可用于直接检索增强的问答小助手。内置技术模块有:word discovery, bm25, word embedding retrieval, inverted index, HyDE等
1290python
作为创业公司CTO, 在基于openAI技术的基础上,从头搭建了一个自然语言理解平台。 该系统能够克服现有大语言模型的幻觉的重大缺陷,也能够克服现有deep learning难以修正错误的重大缺陷。 该系统已投入使用。
1470
1.数据导入、处理构建知识图谱模块 2.问题分词处理分类模块 3.问题匹配、知识图谱交互模块。 4.前端显示处理:问题输入、回答模块
1460python知识图谱
主要利用大语言模型、pyhton、jiava等实现企业知识库管理、证书管理、报表训练、智能问答等功能。 主要负责产品设计、原型设计、设计文档编写、平台应用设计和调试等工作。
1480图数据库
技术支持:springboot、redis、mybatis-plus、milvus、react,socket 项目描述:GeniusAI 是基于 OpenAI 、文心一言、星火等大模型的集成平台,已迭代至 v4.0.0 版本。平 台包含 C 端(面向用户)和 B 端(业务管理后台)两个部分,C 端平台集成了聊天、应用广场、Midjourney 绘画、知识库(RAG)、GPTS、Chat 生成式思维导图等多个模块。具备完善的会员、商品、分销、广告和支 付功能。支持企业级对接和私有化知识库配置。微信对话开放平台,5分钟搭建自己的小程序客服。网址:https://chat.apeto.cn 业绩指标: 1. 注册用户超过 8000+ 私有化部署超过 300+ 2. 1.4 版本 GitHub 开源 主要职责: 1. 产品设计与架构:负责项目从零到一,包括产品定位、布局交互、架构设计和技术选型。 2. AI 集成与优化:调研 AI 领域最佳实践,并集成应用到项目中。 3. 运营与推广:负责项目的运营策略。
1600JavaJava
【1】论文研究深度学习中弱监督问题,发表在CCF-A会议Neurips2020,被引用次数50+,https://arxiv.org/abs/1906.00642 【2】我主要负责其中算法设计,代码实现,实验对比测试、论文撰写等方面。
1260
研发过舆情系统、智能客服系统、智能制单、文本处理、语义分析、大模型、llm,熟悉自然语言处理常见算法,比如lstm、bert、cnn、rnn、transformer,熟悉chatgpt、chatglm、baichuan、yi-34b等大预言模型
1200自然语言处理
项目背景与目标 AliceMind-PALM模型不支持图片生成任务。需要参考现有图片生成模型如DALLE,为PALM补充下游图片生成的代码; 调研并实现图片生成代码的训练和推理; 待解决的问题 缺少算力提供 独立完成调研与代码调试 主要工作 调研大量文字到图片模型,最终找到VQGAN+CLIP 完成代码的调试,将PALM生成的文字接入到搭建好的模型 commit代码到主仓库,2k Star
1490图形/图像处理
当前共275个项目
×
寻找源码
源码描述
联系方式
提交