图像处理

1.支持实时的对话服务(Real-timeCrawlerIntegration)功能描述:对话系统不再仅限于其内置的静态知识。当用户的提问涉及最新事件、实时数据或特定网站内容时,系统可通过集成的实时服务,动态地从互联网上获取最新信息。价值:彻底解决了大模型知识陈旧、无法回答时效性问题的痛点,使服务能
6090Python人工智能
利用pytorch训练图片集,模型选用mobilenet,识别率95%以上。结合yolov8使用预训练模型,可视频动态识别物品的材质。yolo可以自己搜集图片集训练自己的模型
920深度学习人工智能
人脸识别产品系统
本方案主要研究激活函数在人脸识别模型的搭建与训练过程中所产生的影响,具体分析不同激活函数对模型训练时间和准确率的作用。我们将从以下几个方面进行详细探讨:首先,使用不同的非线性函数进行模型搭建,比较其在训练过程中的表现差异;其次,针对饱和函数和非饱和函数进行分类研究,分析这两类函数在模型训练中的优势和不足。通过这些研究,我们期望能找到一种能够在保证准确率的前提下,缩短训练时间的激活函数,从而优化人脸识别模型的性能。
980Python数据处理
人脸识别产品系统
安防或者工业领域或商用考情打卡,人脸检测算法。 人脸检测工程项目旨在开发一套高效精准的人脸识别系统,基于OpenCV、eigenface实现实时人脸定位与特征分析。系统支持图像、视频流及摄像头输入,可适应复杂光照、多角度及遮挡场景,检测准确率达98%以上。通过优化代码,确保在嵌入式设备与服务器端的高效运行。项目集成数据增强、模型训练及可视化界面开发,应用于安防监控、人脸考勤、智能门禁等领域,提供API接口便于二次开发,满足工业级部署需求。
1670C/C++AI
数字方阵产品系统
1.行业与业务场景(25%) 数字艺术创作工具 面向教育/设计领域,提供将文字或图像转换为Excel艺术画的创作方案,适用于: 教学场景:Excel格式操作教学、像素艺术编程案例 数字艺术:低成本像素画创作(需打印场景) 企业应用:LOGO快速原型制作、会议桌签生成 2.功能模块与用户价值(50%) 核心功能实现分为四大模块: 交亘系统: 通过多级弹窗引导用户完成模式选择(文字/图片)0 动态字体选择器支持主流中文字体切换(黑体/楷体/宋体/微软雅黑)o实时输入校验确保表格尺寸符合规范(正整数值检测)。文字渲染引擎: 动态字体适配算法自动计算最佳字号,确保不同字数内容完整显示0 文字居中排版与灰度反相处理,生成高对比度文字轮廓 支持跨平台字体路径自动探测,解决系统差异导致的字体丢失问题0 图像处理管线: 智能图像缩放采用LANCZOS算法保留细节特征0 。双阶段灰度处理:先反相增强轮廓,后二值化简化像素结构 坐标系翻转映射,匹配Excel行列编号规则0 Excel生成器 单元格样式批处理技术实现毫秒级染色(每秒处理500+单元格)0智能坐标系统自动标注"列-行"标识(如3-15表示第3列第15行)预设打印优化参数(4.3字符列宽/19.2磅行高),生成即用型文件 3.技术选型与架构特点(25%) 混合分层架构设计: 前端层:基于Tkinter构建轻量化GUI,通过对话框控件实现零学习成本操作. 。逻辑层: 。字体适配模块采用二分法搜索算法动态计算字号 。图像处理模块实现灰度转换一智能缩放一像素映射三级流水线 输出层:利用Openpyxl的批量操作API,避免逐单元格修改的性能瓶颈关键技术特性: ·双阈值颜色映射机制:通过85/170两个灰度阈值划分红/黄/白三色区域,平衡视觉效果与Excel色彩限制 动态资源加载:多级字体路径探测策略(Windows→macOS→Linux)保障跨平台字体可用性 工程化设计: 。集中式颜色配置(COLOR CONFIG)与字体路径映射(FONT MAP) 异常处理链覆盖文件权限、图像加载、子进程调用等关键环节。 安全文件名生成机制(正则过滤非法字符+长度限制)
1150python图像(Image)
OpenPower联合储能国家研究院,基于欧盟新电池法规(EU Battery Regulation 2023/1542),共同开发电池产品碳足迹精算系统。该系统专为出海电池企业打造,帮助企业精准计算并追踪电池全生命周期的碳足迹,确保符合欧盟法规的碳足迹申报和合规认证要求,加速产品进入欧盟市场。 随着全球对可持续发展和碳中和的要求不断提升,电池产业链面临前所未有的合规挑战。欧盟法规明确要求电池制造商提交碳足迹报告,并在未来几年内逐步实施碳足迹分级,高碳足迹产品可能面临市场准入限制。本系统通过精准计算、可信存证、智能溯源,助力企业合规应对,提升全球市场竞争力。
1190java能源
借助Cooraft,您的每一张自拍和日常照片都能瞬间蜕变为充满创意与艺术感的动画和渲染作品,仿佛被施了魔法一般!无论是从2D到3D的转换,还是面部表情的生动动画,甚至是素描到写实风格的跨越,Cooraft都能轻松实现。这款工具将人工智能的强大功能融入您的指尖,让普通图像焕发出令人惊叹的艺术魅力。通过Cooraft,您不仅可以为人像照片增添趣味十足的表情动画,还能打造独特的艺术表情符号。此外,Cooraft支持多种艺术风格的转换,从3D卡通到经典绘画,应有尽有。不仅如此,Cooraft还能将素描、绘画和线稿等不同形式的输入,转化为逼真、立体或艺术风格的全新渲染效果,让您的创作无限可能。
1380ios人工智能
编程语言: Python 深度学习框架: PyTorch 核心算法: AlphaPose(人体姿态估计) + ST-GCN(时空图卷积网络) 工具链: OpenCV(视频处理) 硬件平台: NVIDIA GTX3060 以下是根据您提供的信息整理的项目经历描述模板,突出技术亮点和应用价值: 项目名称 基于深度学习的家庭老人健康监护系统——实时动作识别与危险预警 项目简介 针对居家老人安全监护场景,开发一套基于计算机视觉的智能监测系统,利用AI技术实时分析视频流中老年人的行为特征,精准检测跌倒、抽搐等高风险动作并触发紧急报警。系统采用轻量化模型部署于边缘设备,兼顾实时性与准确性,为家庭提供7×24小时主动防护解决方案。 技术栈 编程语言: Python 深度学习框架: PyTorch 核心算法: AlphaPose(人体姿态估计) + ST-GCN(时空图卷积网络) 工具链: OpenCV(视频处理)、TensorRT(模型加速)、Flask(Web服务)、MySQL(数据存储) 硬件平台: NVIDIA Jetson Nano(嵌入式部署) 核心实现细节 多模态数据采集与标注 整合公开数据集(如HMDB51、UCF-101)与自采家庭场景视频,构建包含10k+标注样本的数据集,覆盖正常动作(行走、坐立)及异常动作(跌倒、颤抖)。 使用LabelImg工具进行精细化标注,同步记录时间戳与动作类型标签。 AlphaPose优化与适配 基于OpenPose改进人体关键点检测模型,引入动态权重调整机制提升复杂背景下的鲁棒性(如遮挡、低光照)。 通过ONNX格式转换实现模型轻量化,推理速度降低至
2430深度学习人工智能
数字人直播产品系统
在数字化时代,直播行业已成为信息传播、娱乐互动和商业推广的重要平台。然而,传统直播模式面临着人力成本高、直播时间受限、内容单一等问题。数字人直播系统应运而生,它结合了人工智能、计算机图形学和实时渲染技术,通过高度智能化、个性化的数字人主播,为用户提供全新的直播体验。该系统不仅能够实现24小时不间断直播,还能根据不同的场景和需求进行个性化定制,为直播行业带来创新和变革,推动其向智能化、高效化方向发展。 1、开发2D口型驱动算法; 2、开发TTS语音生成算法; 3、实现数字人实时推流;
1310深度学习人工智能
参与课题沟通和重点问题处理;承担交叉口提取与构建任务 • 发明基于实例分割的道路交叉口检测方法,达到90%左右的预测精度(专利); • 基于图形学原理对交叉口内部道路临近路段实现冗余路段融合算法 • 运用Labelme、深度学习框架,针对交叉口检测从数据标注到模型训练测试全流程 该项目针对车载双目影像以及高精度位姿数据中蕴含丰富的道路场景三维语义信息,结合前 沿算法与地图学知识,实现道路三维要素的自动化获取与表达。 • 对双目立体视觉技术及视差匹配模型进行研究,实现双目车载影像的立体匹配与三维视觉点云提取; • 运用空间聚类算法、地图制图学原理对车道整体场景进行表达研究。
1221深度学习大数据
行为识别作为人工智能领域的关键应用之一,近年来受到了广泛关注,特别是在监控、人机交互及 体育分析等领域展现出巨大潜力。本文利用三维卷积神经网络(3D-CNN)来提升行为识别的精确度与 效率。3D-CNN 通过整合时空信息,相较于传统 CNN,在捕捉视频中动态行为特征方面具有明显优势。 本文选择 UCF YouTube 动作数据集的 UCF11 子集,该数据集以其多样化的动作类别和真实的视频 场景而著称,涵盖了篮球投篮、自行车骑行、跳水等 11 种典型动作。我们对数据进行了预处理,包括 类别编码、数据集划分、视频帧提取和保存,以便于后续的模型训练和评估。采用了随机裁剪、归一化 处理和转换为 PyTorch 张量等方法进行数据增强;模型训练时通过学习率调整及早停策略,防止过拟合, 确保了训练过程的高效与稳定。本文实施迁移学习策略——使用预训练权重,极大加速了训练进程,显 著提升了模型在新数据上的表现。 最后,模型测试部分展示了该方法在实际视频中的应用,通过对视频流进行逐帧处理,采用连续 16 帧作为输入,输出行为预测概率,实现实时行为识别。此阶段不仅验证了模型在复杂场景下的有效 性和准确性,还凸显了该 3D-CNN 框架在行为识别任务中的实战价值。总之,本文的研究不仅深化了对 3D-CNN 应用于行为识别的理解,也为未来相关研究和应用提供了宝贵的思路与实践指引。
2120深度学习人工智能
个人实现 Stable Diffusion(AI 画图) 的安装和使用,比较适内存16G以上的计算机使用。 本文深度剖析了 Stable Diffusion 模型与其创新性扩展——ControlNet,ControlNet 作为一种新颖的条 件控制机制,用于指导扩散模型生成图像,特别是应用于 Stable Diffusion 等文生图模型。它能实现对生 成过程施加更精细的约束,使得输出图像更加符合用户的需求。 在研究中,首先概述了 Stable Diffusion 的基础架构,拆解其组成单元,讨论感知压缩、CLIP 文 本编码器、条件导向机制及核心的 UNet2DModel,揭示了从文本到视觉艺术的转换奥秘。文章聚焦 ControlNet 的核心原理与实现逻辑,在不改变原模型架构的前提下,利用辅助网络巧妙施加外部控制信 号,实现生成图像内容的精准操控。 实验部分展示了 ControlNet 在 Canny edges(边缘检测)、Openpose(人体姿态检测)的效果。结果 表明,ControlNet 在这些任务中都表现出显著的优势,尤其是在保持生成图像的文本相关性和准确性方 面。透过实践案例的棱镜,演示了 ControlNet 在网页部署的可行性,进一步凸显其即时性和普适性价值。 最后,论文总结了 ControlNet 的潜在应用前景,并提出了一些可能的改进方向。
1240深度学习人工智能
1.软件面向建筑施工领域,以实现及时、准确的检测混凝土损伤位置。 2.项目分为三大模块,分别为:构建混凝土病害数据集(解决目前开源数据集较少、多数数据集所含的样本类别单一、大多数数据集图像都取材于同一地点,场景较为单一,无法还原真实场景下的混凝土构件病害的问题。)、图像增强模块(旨在增强后续分割模型的鲁棒性和分割效果)、语义分割检测模块(检测实际应用中场景复杂、存在的密集小尺度目标,提高检测准确度)。 3.项目采用的技术方法有:通过数据搜集、数据清洗、图像增强、数据集标注和数据增强这五个步骤构建数据集;提出基于 Retinex 和图像融合的图像增强算法;提出基于注意力机制和特征金字塔的语义分割算法。
1840深度学习人工智能
无人机(UAVs)在物流和运输领域的潜力逐渐显现,亚马逊等公司开始探索使用无人机进行货物配送。复现论文数学模型,定义了类似于飞行侧踢旅行商问题(FSTSP)的问题,但适用于多卡车情况,目标是最小化成本。
810深度学习人工智能
视频描述产品系统
1. 使用transformer模型,完成视频序列到文本序列的转换,可以用在监控视频的存档和视频理解上; 2. 主要编程语言为Python,为了方便展示,使用JavaScript语言编写了前段页面。 3. 本项目利用先进的Transformer模型,实现高效、精准的视频内容转文字功能。通过深度学习技术,自动识别视频中的语音对话,转换为文字文本,助力信息快速获取与整理。适用于会议记录、视频编辑等多场景,提升工作效率,让视频信息传递更便捷。
1861深度学习人工智能
1.本项目为半导体行业芯片植球印锡的视觉检测应用。通过这个检测方案,检测少锡,偏锡,少球,偏球,异物的检测。 2.本案例可应用在该行业的所有客户。 3.本案例可离线或在线应用,通过灵活的模板制作,实现同类产品的检测需求。
1571深度学习人工智能
图像风格迁移产品系统
项目旨在实现基于ImageNet的图像风格迁移,将一种图片转化为另一种风格。本项目使用预训练的VGG16网络作为基础的特征提取器,VGG16在数据集上进行了充分的训练,具有强大的特征提取能力,并采用AdaIN方法,通过调整内容图像特征图的均值和标准差,使其与风格图像特征图相匹配,从而实现风格转换。并且定义了内容损失和风格损失,使风格上接近风格图像,内容接近内容图像。在性能方面,由于采用AdaIN方法,相比传统的迭代方法,大大提高了运行效率,并且模型具有良好的泛化能力。
1431图像处理python
视频处理系统,在实时处理视频流时,检测、识别、分割等操作均可实时,精准捕捉画面中的关键元素。不仅如此,还能为用户一键美颜,瞬间提升颜值,或是添加趣味贴纸特效,让视频瞬间变得生动有趣,广泛适用于直播、短视频创作、社交娱乐等众多场景,全方位助力精彩呈现。
680深度学习人工智能
图片生成产品系统
我们的图片视频生成能力具备强大的角色与风格掌控力,能生成精美图片与视频。在小说推文领域,瞬间将精彩情节可视化,吸引读者目光;用于绘本创作,赋予故事鲜活生命力。支持多角色同屏生成,轻松构建复杂场景,换脸、换装随心所 “变”,甚至可按需精准输出文字,全方位助力创意落地。
800深度学习人工智能
1.该项目主要面向智慧城市,城市规划等方向,通过对遥感图像中各类物品的语义分割,达成各类设施统筹管理的目的 2.该项目主要采用pytorch框架,使用的是当下大热的深度学习技术,可以对各类复杂的场景进行对应的数据训练,从而达成良好的分割结果。项目主要采用HRnetV2+OCR为主要的语义分割模型,HRnetV2可以对高分辨率图像进行准确的识别处理,完成第一次分割处理,OCR模型则通过上下文检测技术,挖掘每个像素点与其他像素点的关联,以完成更进一步的精确分割 3. HRNet 联接上下文特征提取和自注意力机制模块 OCR的结合,相较于原始的单一 HRNet 模型的mIOU= 49.79%,提升到了 58.72%,增加了 8.93%,在贫瘠地类的分割上甚至提升了 42.06%,这表明加入 OCR模型后可以有效提升城市遥感图像语义分割的准确率()
1442深度学习数据处理
当前共69个项目more
×
寻找源码
源码描述
联系方式
提交