图像识别

本项目是一个面向计算机视觉领域的算法库,聚焦于图像分类任务,旨在为科研开发者提供简洁、可复用的模型实现与实验基础。其主要功能模块包括:核心模型集:提供多种经典卷积神经网络实现,包括LeNet、AlexNet、VGG、GoogLeNet、ResNet、Inception系列、DenseNet等,涵盖从
2220Python人工智能
1.支持实时的对话服务(Real-timeCrawlerIntegration)功能描述:对话系统不再仅限于其内置的静态知识。当用户的提问涉及最新事件、实时数据或特定网站内容时,系统可通过集成的实时服务,动态地从互联网上获取最新信息。价值:彻底解决了大模型知识陈旧、无法回答时效性问题的痛点,使服务能
6090Python人工智能
利用pytorch训练图片集,模型选用mobilenet,识别率95%以上。结合yolov8使用预训练模型,可视频动态识别物品的材质。yolo可以自己搜集图片集训练自己的模型
920深度学习人工智能
使用RPA技术可以自动化处理图片修改等重复性任务,一年自动生成图片50000张以上,至少节省工时3000小时以上,不需要人工任何操作,并且避免了人工操作可能出现的操作失误;使用RPA技术可以自动采集不同系统和平台的多维度数据,避免人为失误,实现全面且准确的数据采集。
11970Python物流仓储
通过RPA自动化数据采集和处理应用,实现对各类数据的自动抓取、整合和处理,大幅提高数据处理效率和准确性;通过影刀RPA实现对多个平台和多个品牌店铺的优惠活动设置的自动化执行,大幅提高活动报名效率和准确性;通过RPA搭建种草内容搬运应用,实现对内容的自动搬运和发布,提高搬运效率和准确性,同时减少人力成
2610Python物流仓储
?智能监控三区域监控:支持同时监控3个屏幕区域(Boss血量、技能读条、技能喊话)实时OCR识别:使用PaddleOCR进行高精度中文文本识别规则匹配:支持自定义监控规则,精确匹配关键文本?语音播报EdgeTTS:使用微软EdgeTTS引擎,支持多种中文语音智能缓存:自动生成和缓存音频文件,提高响应
960Python人工智能
1.支持单张/批量上传物流单据图片,自动识别集装箱号、托书号等关键信息。2.提供RESTfulAPI接口,可直接集成到企业管理系统中,支持远程调用。3.支持结果结构化输出(JSON格式),便于后续对接数据库或ERP系统。4.具备基础的图像预处理功能,提升识别准确率,对模糊/倾斜图片也能有效识别。
490Python企业服务
1.工具介绍 PicSearch是一个基于纹理图像内容进行搜索的工具,直接通过上传纹理照片或图片即可找到相似的图片结果。 提供石纹、木纹等各种纹理的产品搜索,能根据客户随意拍摄的照片或图片,帮助企业精确找到本地图库中的纹理图片。 2、使用步骤 (1)点击上传按钮选择需要搜索的图片 (2)选择需要搜索的图片库目录 (3)开始搜索 (4)系统自动分析图片特征 (5)搜索完毕后相似图片会显示在结果区域 (6)双击结果图片的名称,可以打开图片查看
570Python图像识别
对图像进行识别并评估图像识别的准确率 1) 对推理的数据集进行分割; 2) 网络分配已分割的数据集; 3) 远程控制推理; a. 初始化推理设备 b. 加载推理模型 c. 数据推理前处理 d. 数据推理 4) 返回推理后的推理结果; 5) 对推理结果进行处理获得FPS值(加速卡每秒钟推理的图片数量,其中推理包括推理前处理、推理及推理后处理三个部分)及推理的精度值;
1470C/C++AI
该智能摄像机采用RV1126方案,自带2T算力,可配套4G模型,广泛适用于监控安防,视频结构化,可端侧实现各种AI算法,例如人脸抓拍、人体抓拍、人群态势分析、机动车抓拍、交通数据分析、行为分析,烟火,安全帽等。
2210Torch智能硬件
本方案用于实现车载智能视频分析,通过AI算法模型在端侧对实时视频进行分析处理,用于采集客流量、司机疲劳驾驶等等, 从而实现给业务侧提供精准数据支撑。主要用于公交车、大巴车等场景,也可以扩展应用到各类视频分析的其他场景。
1730Torch智能硬件
农业病虫害识别源文件源码
该项目面向农业行业,识别农业病虫害; 该项目包含如下模块: 1、数据处理模块,包括图片裁剪、增强、灰度处理等; 2、目标检测模块,检测图片中是否存在病虫害,识别病虫害的种类和位置; 3、可视化模块,对模型预测结果进行可视化; 4、API模块,访问API识别图片 该项目基于YOLO系列模型为框架,进行模型微调,满足特定图片和区域的识别
1580python计算机视觉库/人脸识别10000.00元
借助Cooraft,您的每一张自拍和日常照片都能瞬间蜕变为充满创意与艺术感的动画和渲染作品,仿佛被施了魔法一般!无论是从2D到3D的转换,还是面部表情的生动动画,甚至是素描到写实风格的跨越,Cooraft都能轻松实现。这款工具将人工智能的强大功能融入您的指尖,让普通图像焕发出令人惊叹的艺术魅力。通过Cooraft,您不仅可以为人像照片增添趣味十足的表情动画,还能打造独特的艺术表情符号。此外,Cooraft支持多种艺术风格的转换,从3D卡通到经典绘画,应有尽有。不仅如此,Cooraft还能将素描、绘画和线稿等不同形式的输入,转化为逼真、立体或艺术风格的全新渲染效果,让您的创作无限可能。
1390ios人工智能
OpenGO™(原生绿电证明)是基于OpenPower dMRV平台开发的绿色电力追踪和核查系统(也称可再生能源证书系统),其通过德国TUV莱茵审定和验证、符合RE100技术标准,主要面向分布式光伏、风电项目场景,为项目的自发自用电量开发满足RE100要求的可再生能源属性证书(绿电使用凭证)。 OpenGO™和GEC(中国绿色电力证书)、I-REC(国际绿证)、APX Tigrs形成了良好的互补,为分布式光伏、风电项目提供高效且低成本的RECs开发工具。
950javavue
编程语言: Python 深度学习框架: PyTorch 核心算法: AlphaPose(人体姿态估计) + ST-GCN(时空图卷积网络) 工具链: OpenCV(视频处理) 硬件平台: NVIDIA GTX3060 以下是根据您提供的信息整理的项目经历描述模板,突出技术亮点和应用价值: 项目名称 基于深度学习的家庭老人健康监护系统——实时动作识别与危险预警 项目简介 针对居家老人安全监护场景,开发一套基于计算机视觉的智能监测系统,利用AI技术实时分析视频流中老年人的行为特征,精准检测跌倒、抽搐等高风险动作并触发紧急报警。系统采用轻量化模型部署于边缘设备,兼顾实时性与准确性,为家庭提供7×24小时主动防护解决方案。 技术栈 编程语言: Python 深度学习框架: PyTorch 核心算法: AlphaPose(人体姿态估计) + ST-GCN(时空图卷积网络) 工具链: OpenCV(视频处理)、TensorRT(模型加速)、Flask(Web服务)、MySQL(数据存储) 硬件平台: NVIDIA Jetson Nano(嵌入式部署) 核心实现细节 多模态数据采集与标注 整合公开数据集(如HMDB51、UCF-101)与自采家庭场景视频,构建包含10k+标注样本的数据集,覆盖正常动作(行走、坐立)及异常动作(跌倒、颤抖)。 使用LabelImg工具进行精细化标注,同步记录时间戳与动作类型标签。 AlphaPose优化与适配 基于OpenPose改进人体关键点检测模型,引入动态权重调整机制提升复杂背景下的鲁棒性(如遮挡、低光照)。 通过ONNX格式转换实现模型轻量化,推理速度降低至
2440深度学习人工智能
本方案面向做AI项目的企业团队,同时面向AI小白,刚接手新项目而缺少经验的朋友; 本方案优势在于具备丰富的AI算法及行业落地相关经验,包括计算机视觉、多模态、大模型等; 本方案基于yolo、ByteTrack、ReID、llava、SAM、CLIP、docker、fast-api等相关技术组成!
1350深度学习人工智能
1、随着大模型技术的不断发展,其在智能工程质检系统中的应用前景广阔。大模型不仅能有效解决传统质检方法中存在的效率低下、成本高昂等问题,还能克服小模型在数据标注和识别率方面的局限性。因此,构建基于大模型的智能工程质检系统成为提升工程质量检测水平的关键路径之一。这样的系统不仅可以提高质检工作的自动化程度和准确性,还能为企业节省大量的人力物力资源,促进工程建设行业的数字化转型和技术升级; 2、实时视频交互,大模型与小模型结合,完善整个质检流程,提升识别率;
810深度学习大模型
目前的TCT筛查由细胞病理医生完成,由于受医生专业水平和检测机器的影响,存在部分判别错误的情况。构建AI辅助TCT筛查系统,对给定的可识别的TCT图片去识别,可识别非典型鳞状细胞、低度鳞状上皮内病变、高度鳞状上皮内病变等。全力确保不漏诊,避免假阴性,提高诊断效率;
980图像处理医疗图像;图像识别10000.00元
针对国外的一款小游戏,开发类似产品,满足少儿游戏需求及实现亲子陪伴,同时在玩游戏时可以学习一些知识。学生用马克笔在图纸上画出各种颜色物体,以红黄蓝绿为主要功能颜色,并能从相机选择照片上传,可实现障碍跑酷、接水果、飞机大战、翻牌对对碰等小游戏。该项目主要功能点包括:颜色识别分 割、通用分割、相似性图片检测、文字识别及语音识别等,丰富小学生生活同时,并其实现相应的教育价值。
740深度学习图像处理10000.00元
仪表盘读数识别源文件源码
算法分为4个流程,首先用yolov5s模型从原图中识别出仪,接着用yolov8x-pose模型检测出仪表中的刻度线、指针的关键点,再用DBNetpp模型检测出数值框并用SATRN模型进行文本识别,最后后处理得到读数结果。
700深度学习图像识别10000.00元
当前共388个项目more
×
寻找源码
源码描述
联系方式
提交