深度学习

本项目是一个面向计算机视觉领域的算法库,聚焦于图像分类任务,旨在为科研开发者提供简洁、可复用的模型实现与实验基础。其主要功能模块包括:核心模型集:提供多种经典卷积神经网络实现,包括LeNet、AlexNet、VGG、GoogLeNet、ResNet、Inception系列、DenseNet等,涵盖从
2140Python人工智能
TextGAN-Researcher开源项目
该项目引入了基于新颖的TextGAN-D 框架构建的深度研究代理 (DRA)。 TextGAN-D重新概念化了生成对抗网络 (GAN),以状态管理为核心,并以代理对话为对抗机制。它将软件工程的稳健性(例如,单一事实来源、不可变日志)与 GAN 固有的动态演化能力相结合。这种融合创造了一个高度通用且强大的智能生成系统,该系统能够从自身历史中学习,并通过结构化的对抗过程进行自我改进。本文提出的深度研究代理正是利用了 TextGAN-D 的这些固有特性,实现了卓越的知识发现、信息合成和自我优化能力。
650PythonLLM
项目内容:构建美国科学研究系统的知识图谱,由NIH和NSF数据构建网络,并用复杂网络理论对合作模式进行挖掘。 项目技术:Schema设计、ER图、Scrapy爬虫、知识图谱、Neo4j、复杂网络分析(节点中心性、聚类系数)、Mediawiki 项目成果:爬取数据后,构建极大连通子图包含52883条12年NIH数据、47949条14年NSF数据,数据融合后总计100832条数据43个特征,并绘制4类实体UML类图、Protege本体图,构建含71489个节点86177个关系的Neo4j知识图谱,并通过复杂网络统计指标分析,揭示跨机构合作模式,通过MediaWiki展示在SMW平台
1320Python知识图谱
项目技术:数据增强(镜像反转、左右各旋转30度、增加噪点、MSRCR处理光线)、迁移学习、ReduceLROnPlateau缩小学习率、Xception/InceptionResNet-V2特征融合 项目成果:从Kaggle中获取999条数据,采用迁移学习及微调模型比较多个深度学习模型的准确率后,得到Xception模型最高仅为95.6%,对模型进行特征融合,模型准确率提升至98.4%
590Python机器学习
项目技术:随机森林、LSTM、SVR 项目成果:总计1825条数据20个特征,构建了4个新特征总计24个特征,绘制饼状图、箱形图等对特征选择并比较不同特征效果,随机森林、SVR采用R2、MAE、MSE评估指标,LSTM采用MAE、MSE评估指标,比较两个模型的结果后,最终采用LSTM模型,MAE与MSE分别为0.01416,0.0026
610Python机器学习
本项目通过对近千张工人安全帽佩戴与未佩戴的有标注数据集,使用paddleDetection神经网络模型对其进行训练,最终的获得了一个可以针对视频流中未带安全帽人物发出识别报警的视觉神经网络。 同时又通过对近千张工人睡岗与未睡岗的有标注数据集,使用pp-Human神经网络模型对其进行训练,最终的获得了一个可以针对视频流中睡岗人物发出识别报警的视觉神经网络。 开源地址是训练过程与部署文档
1340python工业互联网
百度PaddlePaddle开源项目
百度飞桨(PaddlePaddle)是中国首个自主研发的开源深度学习框架,解决了从模型训练到部署的全流程难题,提供多样化的工具(如PaddleOCR、PaddleNLP、PaddleSlim),优化中文任务及低资源设备上的AI应用。其灵活的动态图与静态图结合、强大的分布式训练与模型压缩能力,使其在性能和产业落地中表现优异。通过简单的安装和丰富的预训练模型,用户可以快速上手并实现高效开发。
1850深度学习人工智能
1. 解决了术前术后ct配准的问题 2. 使用分割算法和点云配准 3. 使用:1.准备ct数据;2.准备cbct数据。3.运行Main.cpp。即可得到骨头的分割结果。然后调用regist函数进行配准即可。
1750深度学习人工智能
本项目为首个支持Typst数学公式的OCR模型. 该模型基于TrOCR结构, 包含一个ViT Encoder和一个GPT2 Decoder. 提供了一个Python后端和Vue前端供用户使用. 详细信息见: https://github.com/ParaN3xus/typress
2830python人工智能
灵动ai开源项目
基于人工智能的AI问诊导巡大模型项目旨在提升患者的就医效率,缓解医疗资源压力。以下是项目的详细讲解: 遇到的问题: · 整体架构: 如何在项目框架中选择前后端以及模型api的响应。 · 流式回答:如何实现用户能够获得流式回答,减少模型的响应时间。 · 模型裁决:如何让两个大模型的回答能够自动进行裁决,生成最优的回复。 · 意图识别:如何确保模型能够识别用户的问题是在进行问诊,而非闲聊。 · 信息整合:如何将RAG检索和知识图谱的信息与提示词相结合,提供给大模型用于回复。 项目搭建过程: · 系统架构:项目使用前端页面与FastAPI框架进行前后端系统搭建,实现无缝交互。 · 数据来源:数据主要来自爬取的医学网站和开源医学对话数据集,用于训练意图识别模型,以准确判断用户输入的意图,分为闲聊和问诊两类。 · 项目流程与LangChain应用结合: 对于闲聊场景,系统直接与大模型进行对话。 对于问诊场景,系统首先检索RAG向量数据库,召回相关文本,并使用命名实体识别技术识别用户提问的疾病 或症状。利用知识图谱(Neo4j)获取相关命名实体识别的科室和症状信息,最终构建提示词模板供大模型使用。 · 模型使用:项目涉及五个模型,包括千问7B和14B的LoRA训练模型、自预训练的意图识别模型、ModelScope中的RAG检索模型和命名实体识别模型。 · VllM部署:所有模型和相关数据均在本地服务器部署,使用VLLM对千问7B和14B模型进行加速推理,实现实时对话功能。 · Agent智能决策:在此基础上,使用本地千问14B的智能体对两个模型的回复进行裁决,模型能够自主判断并返回最优回复给用户。 最终效果: · 实现了模型的实时回复, 比单次推理快上3秒; · 使用agent对模型的回复进行裁决, 效果测试接近于人工审核; · 实现了模型自动思考决策行为+rag和知识图谱的信息作为提示词工程, 减少了模型的幻觉问题;
3290python人工智能
本方案面向企业级客户,解决他们在实际业务中对图像处理的需求,如产品缺陷检测、医疗影像分析等。 【50%】相比于市场常规方案,本方案具有以下特点: 高精度:采用先进的深度学习模型,如YOLO(You Only Look Once)和Transformer变体(DINO等),在物体检测和图像分割任务上表现出色。 快速响应:通过优化算法和硬件配置,实现快速实时处理大量图像数据,满足工业生产线上高效率的要求。 灵活定制:可根据客户需求进行个性化定制,包括但不限于特定场景下的目标检测、多类别的图像分类等。 可扩展性:支持模块化设计,方便后续功能升级或与其他系统集成。 【20%】方案的产品组成和技术选型: 数据采集:使用高清摄像头或其他传感器设备获取原始图像数据。 前端处理:利用GPU加速计算平台进行实时预处理,如图像缩放、色彩转换等。 模型训练:基于TensorFlow或PyTorch等深度学习框架构建YOLOv5或ViT(Vision Transformer)模型,并在标注好的数据集上进行训练。 后端应用:将训练好的模型部署到服务器或边缘计算设备上,实现实时图像处理与分析。 用户界面:提供可视化操作界面,便于用户查看处理结果并进行参数调整。 总之,该方案结合了前沿的计算机视觉技术与灵活的定制能力,旨在为企业客户提供高效、精准的图像处理解决方案。
1730深度学习人工智能
rag-best-practices开源项目
1. 项目解决了什么问题? 项目名为:rag-best-practices(大语言模型检索增强生成技术最佳实践),针对“大语言模型数据更新不及时,垂直领域问答多幻觉”的问题给出了改善方案。通过垂直领域知识库检索辅助模型生成内容,减少生成幻觉,将通用大模型在一定程度上专业化;通过更新知识库,使得过往预训练的大模型能够回答实时新闻报道中出现的内容,进一步提高通用大模型的回答能力。 2. 项目采用的技术? - Query Classification:并非所有查询都需要检索增强。 - Sliding Window Chunking:块大小显著影响性能。更大的块提供了更多的上下文,增强了理解,但增加了处理时间。较小的分块提高了检索的召回率,减少了时间,但可能缺乏足够的上下文。使用sliding window技术更加有效,即将文本按照句子进行划分,每个块包含窗口大小个句子。 - Embedding:嵌入模型选择BAAI/big-large-en,并对其在专业数据库中进行微调,提高其检索能力。 - Vector Database:Qdrant支持多种索引类型、十亿规模的向量支持。 - Retrieval:HyDE(pseudoDoc+query)+Hybrid Search(=0.3*BM25+Original embedding)。 - Reranking:monoT5模型参数量小且准确率相对较高,RankLLaMA绝对准确率更高。 - Repacking:reverse方式最好。 - Generator Fine-tuning:混合相关和随机上下文可以增强生成器对无关信息的鲁棒性,同时保证相关信息的有效利用。用一个相关文档和一个随机选择的文档来训练。(待实现) 3. 项目有哪些亮点? 对当前提出的各种RAG方法进行整合,统一实现了论文中提到的技术,方便模块化定制。
1250深度学习人工智能
该科研项目提出并且通过实验证实了一种通过向Stable Diffusion模型增加一个基于CNN特征提取网络的人物形象编码器来实现让Stable Diffusion在生成模型未见过的形象时可以不需要额外训练或者微调主模型或者Lora模型。 文中提出了三种技术路线,最终在其中一种技术路线中成功实践并且在较少数据集上得出了有效的结果,证明了技术路线的可行性。 论文摘要: The current state-of-the-art Diffusion model has demonstrated excellent results in generating images. However, the images are monotonous and are mostly the result of the distribution of images of people in the training set, making it challenging to generate multiple images for a fixed number of individuals. This problem can often only be solved by fine-tuning the training of the model. This means that each individual/animated character image must be trained if it is to be drawn, and the hardware and cost of this training is often beyond the reach of the average user, who accounts for the largest number of people. To solve this problem, the Character Image Feature Encoder model proposed in this paper enables the user to use the process by simply providing a picture of the character to make the image of the character in the generated image match the expectation. In addition, various details can be adjusted during the process using prompts. Unlike traditional Image-to-Image models, the Character Image Feature Encoder extracts only the relevant image features, rather than information about the model's composition or movements. In addition, the Character Image Feature Encoder can be adapted to different models after training. The proposed model can be conveniently incorporated into the Stable Diffusion generation process without modifying the model's ontology or used in combination with Stable Diffusion as a joint model.
1880python人工智能
使用Pytorch基于Unet通过当前云图进行对全球范围内未来三小时内的全球降水量实施预测 目前,气象学中的许多传统降水预测方法都需要输入多种类型的数据作为参数。本研究旨在探索如何利用深度学习技术,仅使用输入的云图进行降水预测。本文建立了利用 U-Net 通过云图数据预测降水的技术路线,并进行了实验。利用 U-Net 成功训练并预测了降雨模型。
1710python人工智能
1. 本项目解决问题:准确重建具有复杂表面结构的 3D 点云模型。 2. 本项目采用基于编码器解码器架构的单幅图像三维重建方法实现,首先实现从图像到稀疏点云,然后实现从稀疏点云到密集点云重建,从而实现对复杂表面结构物体3D模型重建。 3. 结合论文和源代码(论文可私信)。
1970深度学习人工智能
决策支持系统开源项目
通过大量数据分析实现最适合的方案,决策支持系统(Decision Support System, DSS)是一种信息系统,它结合了计算机科学、数据管理和人工智能技术,旨在帮助决策者收集和分析信息,从而做出更好的决策。DSS通常包括以下组件: 数据管理:用于存储和管理数据的系统,包括数据库管理系统(DBMS)和其他数据仓库技术。 模型管理:包括用于处理和分析数据的统计和数学模型。 用户界面:使用户能够与系统交互,输入参数、查询信息以及查看结果的界面。 在您的工作中,如果涉及到植物科研测量和数据分析,一个决策支持系统可以帮助您更有效地管理数据、分析结果,并基于这些信息做出更明智的决策。
1480html5大数据
基于现在比较流行的ECAPA-TDNN神经网络进行改进,提取语音的声学特征并据此进行语种判别,实现了一个更加方便 高效的语种识别系统。 主要工作: 1、理解任务,阅读相关论文以了解语音相关的研究成果和技术,明确研究方法 2、准备合适的数据集,对数据集进行预处理,提取声学特征 3、深入理解 ECAPA-TDNN 模型并设计进行实验 4、分析模型的输出结果,根据模型与问题、数据的匹配性调整参数和训练策略 5、诊断问题、分析错误后积极与导师讨论,合力解决问题
2090深度学习人工智能
AI网站开源项目
运用和gpt一样的逻辑设计的,模块化的小功能会多一点,能AI绘图以及声音处理等小组件 能做简单的视频处理,包括但不限于处理帧数以及画面清晰 也可以训练AI模型,可以随意切换语言大模型,内置gpt4o以及3.5以上语言模型,用户可以根据自己的需求进行购买 当然运用他的组件模型也可以在pdf上面可以帮助用户做一些需求
2461服务器测试人工智能
轴承故障诊断开源项目
本项目针对目前卷积神经网络在轴承故障诊断领域存在的模型参数量大,模型抗噪音干扰能力不足,模型从小样本数据中进行特征学习和泛化的能力不足等问题,提出了一种基于多角度特征融合的轻量化卷积神经网络轴承故障诊断方法。该方法能够很好的融合局部特征和全局特征。实验表明,该方法具有良好的抗噪音干扰能力和小样本泛化能力,能够以极少的参数量达到非常高的识别准确率。
3160深度学习人工智能
应用场景:针对建筑工人的安全帽与反光马甲检测,预防安全事故发生。 1. 训练数据收集与整理; 2. 使用LabelMe进行数据标注; 3. 改进YOLO算法,算法评估与优化; 4. 使用Flask框架进行后端开发 5. 运行环境:NVIDIA Jetson TX2
3870C/C++人工智能
当前共43个项目more
×
寻找源码
源码描述
联系方式
提交