LLM (大语言模型)

LangChain 是一个用于构建基于大型语言模型(LLM)的应用程序的库。它可以帮助开发者将 LLM 与其他计算或知识源结合起来,创建更强大的应用程序。 LangChain 提供了以下几个主要...
350PythonLLM(大语言模型)
StarCoder(150 亿参数)是 Hugging Face 联合 ServiceNow 发布的免费大型语言模型,该模型经过训练主要用途是可以生成代码,目的是为了对抗 GitHub Copi...
240PythonLLM(大语言模型)
网站起始页 可以登录注册;自定义网站起始页链接 1. 调用第三方api实现每日壁纸 2. 前后端分离开发模式;后端遵循fast api 规范 3. 跨域调用资源 4. 本地持久化存储 5. 组件化,异步加载
150python网页(Webview)
1、功能是针对用户话术的情感分析,方向为正向,中性、负向; 2、通过开源数据、ChatGPT标注数据、人工标注数据构建数据集; 3、模型选型使用BERT类NLU模型; 4、融合对抗训练等策略训练模型; 5、模型F1达到98%; 6、本人独立完成。
150深度学习LLM (大语言模型)
Chinese-Vicuna 是一个中文低资源的 LLaMA+Lora 方案。 项目包括 finetune 模型的代码 推理的代码 仅使用 CPU 推理的代码 (使用 C++) 下载/转换/量化...
290C/C++LLM(大语言模型)
ChatGLM Efficient Tuning 是基于 PEFT 的高效 ChatGLM-6B 微调。 目前实现了针对以下数据集的支持: Stanford Alpaca Stanford Al...
340PythonLLM(大语言模型)
1. 项目模块: 数据预处理模块:这个模块负责对训练数据进行清洗、标准化和预处理,例如删除无效数据、分割数据集等。 模型训练模块:这个模块负责定义GPT模型的结构和参数,并使用训练数据对其进行训练。选择TensorFlow来实现GPT模型的训练过程。 模型评估模块。 应用模块:搭建一个视频自动生成程序。 2. 我的任务: 爬虫并进行数据预处理;使用分布式训练来加快训练速度;超参数调优:GPT模型具有多个超参数,如层数、隐藏单元数等。调整这些超参数对模型的性能和效果至关重要。你可以使用交叉验证、网格搜索或自动化调参工具来优化超参数选择。 过拟合和模型调优:GPT模型可能会面临过拟合的问题,即在训练数据上表现良好,但在新数据上的泛化能力较差。你可以采用正则化技术(如dropout)或早停策略来缓解过拟合,并进行模型调优以提高性能。
80pythonLLM (大语言模型)
CodeGeeX是一个具有130亿参数的多编程语言代码生成预训练模型。CodeGeeX采用华为MindSpore框架实现,在鹏城实验室“鹏城云脑II”中的192个节点(共1536个国产昇腾910...
230PythonLLM(大语言模型)
GPTCache 是一个用于创建语义缓存以存储来自 LLM 查询的响应的库。将你的 LLM API 成本削减 10 倍,将速度提高 100 倍。 ChatGPT 和各种大型语言模型(LLM)拥有...
260PythonLLM(大语言模型)
针对有一定数据沉淀的客户,提供基于ChatGLM的LLM的BI分析解决方案,让普通业务人员实现复杂SQL编写和数据分析,满足Adhoc分析需求,优化数据分析和运营团队成本。
200pythonLLM (大语言模型)
所有流程都是独自完成,包括关键词、模型以及细节调试。 只要关键字,就能透过AI算法生成相对应的图片,不需要消耗大量的时间以及精力。
310原画设计LLM (大语言模型)
EdgeGPT 是 Bing Chat AI 逆向工程的 API。 设置 安装模块 python3 -m pip install EdgeGPT --upgrade 要求 python 3....
180PythonLLM(大语言模型)
Pre-Training with Whole Word Masking for Chinese BERT(中文 BERT-wwm 系列模型) 在自然语言处理领域中,预训练语言模型(Pre-tr...
450PythonLLM(大语言模型)
1. 系统描述:本系统为AI多模态人工智能聊天系统,展示的模块为青少年问卷调查智能问卷。系统根据用户对问卷内容的回答,智能分析诊断用户的心理健康状况,为医生提供指导性建议 2. 责任描述: 整个系统架构搭建,问卷流程设计,以及AI核心模块的开发 3. 成果:已经与上海卫建委成功签订合作合同,并申报为24年度政府相关科研课题
30javaredis
Exllama 是对 Llama 的 HF 转换器实现进行更高效的内存重写,以用于量化权重。 设计用于量化权重 快速且节省内存的推理(不仅仅是注意力) 跨多个设备映射 内置(多)LoRA 支持 ...
360PythonLLM(大语言模型)
AutoChain:构建轻量级、可扩展且可测试的 LLM 代理。 AutoChain 从 LangChain 和 AutoGPT 中汲取灵感,旨在通过为开发人员提供一个轻量级且可扩展的框架来解决...
250PythonLLM(大语言模型)
LLaVA 是一个面向多模态 GPT-4 级别功能构建的大型语言和视觉助手。代表了一种端到端训练的大型多模态模型,连接视觉编码器和 LLM 以实现通用视觉和语言理解。 Demo 早期实验表明,L...
270PythonLLM(大语言模型)
获取金融领域一些股评文章、用户留言发帖等文本,通过自然语言处理、语法处理,构建舆情模型,实时显示舆情方向
140java自然语言处理
Anse AI 聊天 UI开源项目
Anse 是一个极致优化的 AI 聊天 UI,适用于 ChatGPT、DALL-E 和 Stable Diffusion 等 AI 模型。 在线预览: https://anse.app
260TypeScriptLLM(大语言模型)
BBT-2 是包含 120 亿参数的通用大语言模型,在 BBT-2 的基础上训练出了代码,金融,文生图等专业模型。 基于 BBT-2 的系列模型包括: BBT-2-12B-Text:120 亿参...
320PythonLLM(大语言模型)
当前共55个项目
×
寻找源码
源码描述
联系方式
提交