图像处理

本项目是一个面向计算机视觉领域的算法库,聚焦于图像分类任务,旨在为科研开发者提供简洁、可复用的模型实现与实验基础。其主要功能模块包括:核心模型集:提供多种经典卷积神经网络实现,包括LeNet、AlexNet、VGG、GoogLeNet、ResNet、Inception系列、DenseNet等,涵盖从
2220Python人工智能
1.支持实时的对话服务(Real-timeCrawlerIntegration)功能描述:对话系统不再仅限于其内置的静态知识。当用户的提问涉及最新事件、实时数据或特定网站内容时,系统可通过集成的实时服务,动态地从互联网上获取最新信息。价值:彻底解决了大模型知识陈旧、无法回答时效性问题的痛点,使服务能
6090Python人工智能
利用pytorch训练图片集,模型选用mobilenet,识别率95%以上。结合yolov8使用预训练模型,可视频动态识别物品的材质。yolo可以自己搜集图片集训练自己的模型
920深度学习人工智能
人脸识别产品系统
本方案主要研究激活函数在人脸识别模型的搭建与训练过程中所产生的影响,具体分析不同激活函数对模型训练时间和准确率的作用。我们将从以下几个方面进行详细探讨:首先,使用不同的非线性函数进行模型搭建,比较其在训练过程中的表现差异;其次,针对饱和函数和非饱和函数进行分类研究,分析这两类函数在模型训练中的优势和不足。通过这些研究,我们期望能找到一种能够在保证准确率的前提下,缩短训练时间的激活函数,从而优化人脸识别模型的性能。
980Python数据处理
目标检测源文件源码
本方案旨在解决目标检测和视频帧的多目标检测,该任务应用于后续的多目标跟踪和分割等任务。可根据用户需求更换数据集,不仅限于人。本方案使用深度学习框架,相比于传统算法,精度更高,本方案无需训练即可使用。
1620深度学习python
编程语言: Python 深度学习框架: PyTorch 核心算法: AlphaPose(人体姿态估计) + ST-GCN(时空图卷积网络) 工具链: OpenCV(视频处理) 硬件平台: NVIDIA GTX3060 以下是根据您提供的信息整理的项目经历描述模板,突出技术亮点和应用价值: 项目名称 基于深度学习的家庭老人健康监护系统——实时动作识别与危险预警 项目简介 针对居家老人安全监护场景,开发一套基于计算机视觉的智能监测系统,利用AI技术实时分析视频流中老年人的行为特征,精准检测跌倒、抽搐等高风险动作并触发紧急报警。系统采用轻量化模型部署于边缘设备,兼顾实时性与准确性,为家庭提供7×24小时主动防护解决方案。 技术栈 编程语言: Python 深度学习框架: PyTorch 核心算法: AlphaPose(人体姿态估计) + ST-GCN(时空图卷积网络) 工具链: OpenCV(视频处理)、TensorRT(模型加速)、Flask(Web服务)、MySQL(数据存储) 硬件平台: NVIDIA Jetson Nano(嵌入式部署) 核心实现细节 多模态数据采集与标注 整合公开数据集(如HMDB51、UCF-101)与自采家庭场景视频,构建包含10k+标注样本的数据集,覆盖正常动作(行走、坐立)及异常动作(跌倒、颤抖)。 使用LabelImg工具进行精细化标注,同步记录时间戳与动作类型标签。 AlphaPose优化与适配 基于OpenPose改进人体关键点检测模型,引入动态权重调整机制提升复杂背景下的鲁棒性(如遮挡、低光照)。 通过ONNX格式转换实现模型轻量化,推理速度降低至
2430深度学习人工智能
参与课题沟通和重点问题处理;承担交叉口提取与构建任务 • 发明基于实例分割的道路交叉口检测方法,达到90%左右的预测精度(专利); • 基于图形学原理对交叉口内部道路临近路段实现冗余路段融合算法 • 运用Labelme、深度学习框架,针对交叉口检测从数据标注到模型训练测试全流程 该项目针对车载双目影像以及高精度位姿数据中蕴含丰富的道路场景三维语义信息,结合前 沿算法与地图学知识,实现道路三维要素的自动化获取与表达。 • 对双目立体视觉技术及视差匹配模型进行研究,实现双目车载影像的立体匹配与三维视觉点云提取; • 运用空间聚类算法、地图制图学原理对车道整体场景进行表达研究。
1221深度学习大数据
无人机(UAVs)在物流和运输领域的潜力逐渐显现,亚马逊等公司开始探索使用无人机进行货物配送。复现论文数学模型,定义了类似于飞行侧踢旅行商问题(FSTSP)的问题,但适用于多卡车情况,目标是最小化成本。
820深度学习人工智能
视频处理系统,在实时处理视频流时,检测、识别、分割等操作均可实时,精准捕捉画面中的关键元素。不仅如此,还能为用户一键美颜,瞬间提升颜值,或是添加趣味贴纸特效,让视频瞬间变得生动有趣,广泛适用于直播、短视频创作、社交娱乐等众多场景,全方位助力精彩呈现。
680深度学习人工智能
图片生成产品系统
我们的图片视频生成能力具备强大的角色与风格掌控力,能生成精美图片与视频。在小说推文领域,瞬间将精彩情节可视化,吸引读者目光;用于绘本创作,赋予故事鲜活生命力。支持多角色同屏生成,轻松构建复杂场景,换脸、换装随心所 “变”,甚至可按需精准输出文字,全方位助力创意落地。
800深度学习人工智能
1.该项目主要面向智慧城市,城市规划等方向,通过对遥感图像中各类物品的语义分割,达成各类设施统筹管理的目的 2.该项目主要采用pytorch框架,使用的是当下大热的深度学习技术,可以对各类复杂的场景进行对应的数据训练,从而达成良好的分割结果。项目主要采用HRnetV2+OCR为主要的语义分割模型,HRnetV2可以对高分辨率图像进行准确的识别处理,完成第一次分割处理,OCR模型则通过上下文检测技术,挖掘每个像素点与其他像素点的关联,以完成更进一步的精确分割 3. HRNet 联接上下文特征提取和自注意力机制模块 OCR的结合,相较于原始的单一 HRNet 模型的mIOU= 49.79%,提升到了 58.72%,增加了 8.93%,在贫瘠地类的分割上甚至提升了 42.06%,这表明加入 OCR模型后可以有效提升城市遥感图像语义分割的准确率()
1442深度学习数据处理
项目简介:旨在解决传统物理隔离传输系统中外部网络到内部私有网络的单向信息传输面临速度慢、效率低、误码率高等问题。具体为通过对文件进行特殊的编码算法处理,使传输数据以伪二维码图像矩阵的形式呈现,单张图像承载信息容量25KB;通过设计多通道编码展示和拍摄解码方式,实现多进程异步编解码,实现传输速度峰值达700KB/s,是当前国内同类竞品的7倍。 项目业绩:1.攻克传统物理隔离传输系统中单向信息传输速度慢、效率低及误码率高的难题,开发出创新性的物理隔离文件单向传输系统,提升企业与外部网络文件交互的效率与可靠性。 2.运用比特流加密、比特流图像转换编码算法将文件转化为伪二维码矩阵图像,实现高效信息承载与传输,有效减少传输过程中的数据错误与丢失,误码率较传统方式降低70%。3.基于现代计算机视觉和图像处理技术构建多通道展示与拍摄机制,实现多进程异步编解码,使系统传输速度峰值达 700KB/s,远超同类竞品。4.设计并实现系统与上层应用的交互接口,达成实时数据传输管控功能。通过此接口,上层应用能够对传输文件数据进行实时监控、调度与管理,提升数据传输的灵活性与可控性。
1841机器学习人工智能
铝棒识别产品系统
(1) 利用计算机视觉技术和图像处理算法来自动识别铝棒通过对铝棒的图像进行采集和分析,框选出视频或图像中所有的铝棒并进行准确计数。 (2) 基于微信小程序平台,为用户提供简单便利的接口,将用户上传的视频或图片进行实时的识别与计数。 引入智能化、自动化技术极大地提高铝棒识别和分类的效率,并减少错误和延误的风险。这将有助于提高制造和建筑行业的生产效率,并提供更可靠的产品质量保证。同时,自动化技术还能减轻人工操作的负担,释放人力资源,使其可以更好地应用于其他重要的工作领域。 在技术层面上,YOLOv8的引入需要对铝厂的生产流程、产品设计、制造工艺、设备配置等进行全面的重新规划及升级优化,将传统的分散式转变为集中式计数,将小规模扩展为大规模识别,从而提高生产效率和质量;引入物联网技术对传统重工型的产品重新规划,将传统的单一产品转变为智能化、可定制化的产品,可打包集销,从而提高产品的附加值。
931深度学习人工智能
以图搜图产品系统
1、基于最新的算法、最全的数据样本训练、最优的系统架构。 2、支持CPU、GPU兼容。 3、目标类型、车辆品牌、车头车尾、车身颜色、车辆类型、车牌类型、车牌号码、危险品车、出租车、驾驶人员、纸巾盒、遮阳板、天窗、收费类型等检测。
1550python人工智能
1、项目应用于无人车在行进过程中对道路进行正确的识别,便于有效避障 2、功能主要是提取图像信息中的有效特征,实现道路与周围环境的分割,并将道路与环境通过二值图标注出来 3、主要框架为图像增强、特征提取、特征分析、特征降维、贝叶斯多线索融合机制、图像降噪
1740python计算机视觉库/人脸识别
项目背景 随着家电行业的快速发展,冰箱等产品的品牌形象和能效标识成为消费者关注的焦点。冰箱的 Logo 和能效图标不仅是品牌识别的关键元素,也是产品质量认证的标志。因此,在冰箱生产过程中,对 Logo 和能效图标的正确张贴和显示进行自动化检测显得尤为重要。传统的人工检测方式效率低、成本高,容易出现遗漏或误判。本项目旨在开发一套基于图像识别的冰箱 Logo 和能效图标自动检测系统,帮助提高生产线检测效率,保障产品标识合规性。 项目目标 本项目旨在建立一个智能检测系统,通过计算机视觉和深度学习技术对冰箱表面的 Logo 和能效图标进行检测,确保位置、内容、清晰度等符合品牌和能效要求,从而提升冰箱生产过程的合规性和产品质量。 项目功能 Logo 位置与完整性检测:识别冰箱表面的品牌 Logo,检查其位置是否正确、图案是否完整清晰,避免 Logo 缺失、错位或模糊。 能效图标检测:检测冰箱上的能效图标,验证图标内容和能效等级是否符合标准,确保冰箱出厂时符合能效要求。 图像质量分析:对图标和 Logo 的清晰度、色彩等进行分析,识别任何潜在的印刷或张贴质量问题,确保品牌和图标视觉效果一致。 自动报警和提示:若检测到 Logo 或能效图标不合规,系统会自动报警或提示操作人员,及时进行调整或修复。 检测数据存储与报告生成:将检测数据存储至数据库,定期生成合规检测报告,帮助生产线分析产品标识合规情况,为管理层提供数据支持。 项目特点 高准确度识别:通过深度学习模型,准确识别冰箱上的 Logo 和能效图标,提高检测的准确性。 实时检测:系统支持实时检测,能够在生产线的流水作业中快速完成标识检测。 自动化与智能化:无需人工干预,自动识别和报警,提升工厂自动化水平。 数据可追溯性:检测记录可追溯,帮助工厂进行长期数据分析和质量管理。 技术架构 图像采集系统:通过高分辨率摄像头采集冰箱表面的图像数据,传输到后台进行分析。 图像处理与识别模型:使用深度学习模型(如 YOLOv8 或 ResNet 等)进行图像处理和分析,识别 Logo 和能效图标的位置、内容和清晰度。 后台数据管理与报告系统:将检测数据存储至数据库,定期生成检测报告并进行数据分析,便于追溯和质量管理。 报警与通知系统:与生产线的报警系统对接,检测到不合规标识时自动报警,确保生产过程及时纠正。 项目价值 提高检测效率:实现 Logo 和能效图标的自动化检测,降低人工检测成本,提高检测速度。 保证产品合规性:确保冰箱出厂时 Logo 和能效图标符合品牌和能效标准,提升产品在市场中的竞争力。 支持质量管理:通过数据追溯,帮助工厂更好地进行质量分析和改进,推动产品品质提升。 提升品牌形象:确保 Logo 和能效图标的准确显示,提升冰箱产品的品牌形象和市场认可度。 本项目的实施将帮助冰箱生产线显著提高标识合规性和质量控制水平,推动生产智能化升级,为企业发展提供有力的技术支持。
1950python工业互联网
本项目的用户主要面对钢材厂,在以往的初生晶体含量检测都是通过ps或者肉眼判断,价格非常昂贵,本程序解决了此问题。本程序使用python编写,使用了yolo+torch+u-net+opencv+tkbootstarp等技术制作
1480深度学习工业互联网
面向群体:全年龄段 主要功能:主要提供优质资料供于学习,缓解教育资源差距带来的问题 项目获奖:该项目在2024 CCF CAT全国智能体开发大赛获得全国三等 作品图片:提交的是获奖证明 详细看提交的文档(我是第一完成人,队友是长春理工大学硕士,目前在我团队) 商业价值:目前开发阶段,前途无量
1350机器学习人工智能
该科研项目提出并且通过实验证实了一种通过向Stable Diffusion模型增加一个基于CNN特征提取网络的人物形象编码器来实现让Stable Diffusion在生成模型未见过的形象时可以不需要额外训练或者微调主模型或者Lora模型。 文中提出了三种技术路线,最终在其中一种技术路线中成功实践并且在较少数据集上得出了有效的结果,证明了技术路线的可行性。 论文摘要: The current state-of-the-art Diffusion model has demonstrated excellent results in generating images. However, the images are monotonous and are mostly the result of the distribution of images of people in the training set, making it challenging to generate multiple images for a fixed number of individuals. This problem can often only be solved by fine-tuning the training of the model. This means that each individual/animated character image must be trained if it is to be drawn, and the hardware and cost of this training is often beyond the reach of the average user, who accounts for the largest number of people. To solve this problem, the Character Image Feature Encoder model proposed in this paper enables the user to use the process by simply providing a picture of the character to make the image of the character in the generated image match the expectation. In addition, various details can be adjusted during the process using prompts. Unlike traditional Image-to-Image models, the Character Image Feature Encoder extracts only the relevant image features, rather than information about the model's composition or movements. In addition, the Character Image Feature Encoder can be adapted to different models after training. The proposed model can be conveniently incorporated into the Stable Diffusion generation process without modifying the model's ontology or used in combination with Stable Diffusion as a joint model.
1920python人工智能
该系统包含了三个模块,人脸检测模块、数据训练模块和人脸预测模块,三个模块相辅相成,共同组成识别系统。人脸检测模块使用YOLOv3网络获取人脸,对人脸图像预处理并修改尺寸(96*112)并保存;人脸训练模块使用FcaeNet网络(MobileNetV1为主干特征提取网络),MobileNetV1 具有参数少的优势,可以加快训练速度;人脸识别模块使用Pytorch 预测模型对人脸进行预测并识别,如果遇到陌生人将会通过喇叭报警或者保存下陌生人的人脸图像。目前为人脸识别系统设计了三个GUI界面,通过GT creator的UI设计功能实现。
2490python人工智能
当前共112个项目more
×
寻找源码
源码描述
联系方式
提交