自然语言处理

项目模块: 主要是针对Text2SQL三期的任务进行了相关的优化。 项目分工: 完成LLM Text2SQL任务的全链路优化。主要包括: 知识扩充优化,COT链路优化,Table Prompt Ensemble, RAG数据增强,渐进式学习优化等。 成果: 对比开源State of theArt的方案,提升超过10个百分点,对比上期V1.0的优化成果,提升5.6% 欢迎合作: 作者在对话领域有多年的研究经验,LLM应用落地上有丰富的实战经验,欢迎有相关业务需求的公司进行合作。价格优惠,质量有保障。
2481系统架构大模型
项目简介: 项目的目标是根据用户的输入query,结合大模型配置信息中的多个表的schema信息,返回对应的标准化的SQL语句。 如假设有以下几张表和对应的列: Table advisor, columns = [*,s_ID,i_ID] Table classroom, columns = [*,building,room_number,capacity] Table course, columns = [*,course_id,title,dept_name,credits] Table department, columns = [*,dept_name,building,budget] Table instructor, columns = [*,ID,name,dept_name,salary] Table prereq, columns = [*,course_id,prereq_id] Table section, columns
1531系统架构ChatGPT
第一步,肯定要加载数据,处理成词元对应的索引形式,之后构建数据生成器,第二步使用预训练模型,之后设置评估指标,设置学习率调节器,设置优化器,第三步,训练,在每个轮次后评估模型,返回准确率,召回率,F1分数,最后使用测试数据预测模型
40深度学习自然语言处理
项目简介: 项目主要是基于ChatGLM2等大模型实现了影视角色的人设问答,这里的人设选型为封神榜中的角色。用户可以设置对应的角色(如: 商纣王),在和系统进行对话交互时,系统会以商纣王的人设风格对用户输入的信息进行回复。 项目分工: 本人在项目中负责对话整体业务的设计和算法部分业务的实现。主要包括大模型的选型,大模型微调,PEFT, SFT, 模型推理加速和服务部署等。通过对比GPT, 百川,千问,ChatGLM, 书生,Lamma等大模型的效果。针对人设角色的形象设定,做对应Prompt Engineering优化等。 解决问题: 完成了项目整体的开发与部署,对话系统整体上支持了人设大模型生成式对话的业务场景。
631系统架构大模型
作品地址:http://www.latexai.com/ 分为渲染、识别、生成模块,均由本人完成 渲染模块功能为,帮助大家写latex表达式,并渲染出来,可导出png\svg\word格式的公式表示。 同时支持有限的AI公式识别转换为latex表达式,可选输出可视化的模型内部的attention部分
420深度学习LaTeX排版系统
项目介绍:项目整体是针对金融新闻领域的各类子任务做相关的识别和信息抽取任务,包括金融新闻舆情分析,金融事件信息抽取,新闻领域实体识别,金融关系抽取等多个子任务。 工作说明: 利用当前所有开源的大模型(LAMMA2, Falcon, MPT, Bloom, ChatGLM2, Qwen, InternLM),进行横向的对比实验分析,针对具体的任务,对每个大模型进行fine-turing。然后进行对比实验。
1681系统架构自然语言处理
医疗综合信息分析平台 项目背景: 以用户的病例信息作为输入,抽取疾病信息,所属领域类别信息,病状的描述信息,处方信息以及对应的禁忌事项信息等。将该信息抽取完成后存储至数据库。最后由专业人员对相关信息进行质检,完成医疗信息的知识落库。 项目分工: 本人主要负责对病例信息的领域分类,疾病名称识别,病状信息描述,处方信息抽取和禁忌事项的抽取业务。即通过大模型对病例信息的数据实现多个维度的信息抽取工作。 项目成果: 完成外科和耳鼻喉科领域下,数百种疾病信息的知识抽取,准确率达到90%以上。 欢迎合作: 作者在对话领域有多年的研究经验,LLM应用落地上有丰富的实战经验,在这块有大量的交付案例,欢迎有相关业务需求的公司进行合作。
400深度学习大模型
项目简介: 项目的目标是根据用户的输入query,结合大模型配置信息中的多个表的schema信息,返回对应的标准化的SQL语句。 项目分工: 本人利用相关的文章和部分大模型实现了该功能,主要包括底座大模型的选型,大模型的微调,结合对应任务下的先进技术,进行了prompt engineering。并对几种不同的prompt engineering进行了横向的对比实验。利用工业界的电商数据进行建模,针对简单的SQL查询功能能基本覆盖,对于级联查询问题,特别是对于5%这类数据,可能会出现模型幻觉,需要进一步SFT。 项目心得: 对于复杂的大模型生成问题,将其进行合理的子任务拆解,prompt engineering微调的效果提升会比较好。 解决问题: 基本实现了自然语言到SQL转换的功能,支持大模型自动学习表和schema和SQL生成。 欢迎合作: 作者2017年毕业,主要从事对话系统,语义理解和推荐,大模型应用等方向的研发工作。曾在小爱同学细分赛道上业务做到业界No.1。对话系统领域研发经验6年,推荐领域研发经验3年,团队管理经验3年。 2022年起,调研并落地了大模型在文本生成的技术方案
1191系统架构Text2SQL
机器人基于人工智能技术,面向企业场景的 AI 服务,可应用于智能客服、服务咨询、业务办理等场景,还可以帮助企业实现智能营销和智能企业内部服务。 主要负责知识库管理,将知识类型进行分析,支持文本问答,文件统一管理
211javascriptvue
项目简介: 项目主要是利用大模型实现了法律垂直领域的智能问答,主要是覆盖了法律咨询的业务场景。数据主要由论坛、新闻、法条、司法解释、法律咨询、法考题、判决文书组成。大模型能根据相关的业务场景实现智能问答。 项目分工: 本人在项目中负责对话整体业务的设计和算法部分业务的实现。主要包括大模型的选型,大模型微调,PEFT, SFT, 模型推理加速和服务部署等。通过对比GPT, 百川,千问,ChatGLM, 书生,Lamma等大模型的效果。做对应Prompt Engineering优化等。 解决问题: 完成了项目整体的开发与部署,整体上支持了法律AI场景下的对话业务。
551系统架构大模型
项目简介: 项目主要是基于ChatGLM2等大模型实现了影视角色的人设问答,这里的人设选型为一人之下中的角色-武当王也。在和系统进行对话交互时,系统会以王也的人设风格对用户输入的信息进行回复。 项目分工: 本人在项目中负责对话整体业务的设计和算法部分业务的实现。主要包括大模型的选型,大模型微调,PEFT, SFT, 模型推理加速和服务部署等。通过对比GPT, 百川,千问,ChatGLM, 书生,Lamma等大模型的效果。针对人设角色的形象设定,做对应Prompt Engineering优化等。 解决问题: 完成了项目整体的开发与部署,对话系统整体上支持了人设大模型生成式对话的业务场景。
591系统架构大模型
全栈开发,独立完成 该项目使用自研的医疗知识图谱问答算法以及自构建的医疗知识图谱作为数据源 算法主要包含知识图谱嵌入模块、自然语言语义分析模块、答案匹配模块 后端使用python与nginx实现 前端使用vue搭建,并实现窗口自适应功能 为用户提供简单的医疗知识问答功能
440pythonvue
项目简介: 对上期Text2SQL任务进行优化,达到业界顶尖水平。 项目分工: 本人在目前业界效果Text2SQL模型的基础上进行优化,主要针对LLM输出结构的对齐,SFT优化的效率问题,大模型幻觉的问题进行了相关的优化,达到了远超目前State of The Art的效果。 项目心得: 对于复杂的大模型生成问题,将其进行合理的子任务拆解,prompt engineering微调的效果提升会比较好。 解决问题: 基本实现了自然语言到SQL转换的功能,支持大模型自动学习表和schema和SQL生成。 欢迎合作: 作者2017年毕业,主要从事对话系统,语义理解和推荐,大模型应用等方向的研发工作。曾在小爱同学细分赛道上业务做到业界No.1。对话系统领域研发经验6年,推荐领域研发经验3年,团队管理经验3年。 2022年起,调研并落地了大模型在文本生成的技术方案,落地的场景主要包括: 人设问答,本地知识库问答和搜索式问答,NL2SQL。在大模型的应用和优化方向,如PEFT, SFT,Prompt Engineering,推理加速等,都有着相关的实践经验。 熟悉聊天机器人、对话系统等项目,熟悉
2491系统架构GPT
项目介绍: 虚拟人电商直播主要是提供一个虚拟人作为主播,像用户介绍相关的产品信息,回复用户的问答,业务上包括直播商品介绍,基于商品的信息抽取问答,虚拟人口型驱动,语音渲染等等。 职责: 负责完成对话模块整理的业务架构设计和工程化落地,覆盖多个直播业务场景。完成业界前沿底座大模型的效果对比和评测。基于BaiChuan等大模型完成相关的微调和优化,推理加速优化,一站式服务部署等等。
681系统架构对话系统
某企业AI智能客服项目旨在利用人工智能技术,为企业打造一个高效、智能的客户服务系统。该项目通过模拟人类客服的对话方式,与用户进行实时交流,解答用户的问题、提供帮助和建议,从而提升企业服务效率、降低运营成本,并增强用户的满意度和忠诚度。 一、模块组成 智能问答模块:基于自然语言处理、深度学习等技术,对用户的问题进行识别、分析和回答。该模块能够准确理解用户意图,提供精准的答案和解决方案。 用户交互模块:负责与用户进行实时对话,包括语音、文本等多种形式的交互。该模块通过语音识别、语音合成等技术,实现与用户的语音交互;同时,也支持文本输入和输出,方便用户进行文字交流。 知识库管理模块:存储和管理企业的各类知识、常见问题及解决方案。该模块支持知识的动态更新和维护,确保智能客服系统能够随时提供最新、最准确的信息。 数据分析模块:对用户行为、问题类型、服务效果等数据进行收集和分析,为企业提供有价值的业务洞察和改进建议。 二、使用到的技术 自然语言处理技术:用于将用户的语言转化为机器可理解的形式,从而能够准确理解用户的需求和问题。通过分词、词性标注、句法分析等处理,提取出用户问题中的关键
671java人工智能
项目介绍: 本项目实现了对话系统中的规则引擎服务,可以适配复杂的业务需求,整体时间复杂度为O(n)。整体包括三个部分: 业务适配,业务词典和业务规则模版。通过配置不同业务的词典和模板,可以实现独立的规则引擎匹配。数据和服务实现业务分离,支持数据热更新。 适用场景: 1. 基于规则引擎的语义理解,返回对应的意图信息和槽位对,以及置信度打分。 2. 业务场景下的实时干预,避免服务的高频发版,保障线上服务稳定性。 3. 业务功能黑名单处理。 4. 商业化运营事件配置。
681java对话系统
项目分大模型、后端、前端三部分 大模型经数据训练得到领域大模型 后端使用django框架调用大语言模型接口 前端采用vue框架
510django自然语言处理
本项目旨在开发一款创新型陪护机器人,利用基于讯飞星火3.0 的AIGC(Artificial Intelligence Generated Content)指令生成式技术、实时语音流处理技术和iCaRL分类技术,使机器人不仅具备自然而流畅的对话能力,而且能够理解指令并生成智能回应,为用户提供高度个性化的护理和支持。 本项目基于讯飞星火3.0的AIGC模型。 基于该模型,能够在语义理解、文本分类、命名实体识别、情感分析和问答系统等多个自然语言处理任务上表现出色。具备高准确性,能够准确理解输入文本,并生成相应的语义表示和回答。 项目分为语音识别模块,AIGC指令生成模块,动作执行模块,物体识别模块等。
750C/C++LLM
项目模块: 主要是针对text2SQL任务的全链路优化,增加了SQL数据可视化的推理过程,实现整体的数据可视化Agent. 项目分工: 负责对业务整体的建模,包括SQL生成任务的优化,图表关系的业务建模,和API参数的智能生成。 主要包括: SQL生成任务的拆解优化,针对图表分类和参数抽取的业务建模,COT优化,图表和API参数关系抽取,以及参数的对齐优化功能等等。 成果: 跑通了从文本到数据可视化的全流程,支持了5种复杂的数据可视化业务需求,达到业务交付标准。 欢迎合作: 作者在对话领域有多年的研究经验,LLM应用落地上有丰富的实战经验,在这块有大量的交付案例,欢迎有相关业务需求的公司进行合作。
490系统架构大模型
项目主要目的为使用 人工智能技术对新闻进行分类,减少人力成本提高效率。 1. 模型主要分为以下5个步骤进行:数据爬取、数据选择与读取、数据摘要与清洗、模型选择、模型训练与评估、模型组合与预测效验。 2. 使用python及其相关科学库如:numpy、pandas等技术开发,选择的算法模型有:词袋模型BOW(Bag of Words)、词向量(Word Embedding)、神经网络,采用交叉验证的方式训练模型,来降低过拟合情况,最后对上述三个模型的结果组合加权平均。 3. 数据爬取主要使用Python requests库。 4. 使用Jieba中文分词库对中文进行分词处理,来完成数据选择与读取。 5. 独立完成TF-IDF算法对处理好的数据进行摘要与清洗。 6. 使用开源TestCNN和TestRNN模型对数据进行处理。
50pythonPython开发工具
当前共184个项目
×
寻找源码
源码描述
联系方式
提交