机器视觉

利用pytorch训练图片集,模型选用mobilenet,识别率95%以上。结合yolov8使用预训练模型,可视频动态识别物品的材质。yolo可以自己搜集图片集训练自己的模型
830深度学习人工智能
1,理解装有mvs和basler相机、各种光源控制、io控制、motion马达控制的软件。 2,定义与机械手通信的逻辑,并在上述软件基础上加入与机械手进行PLC通信的代码控制功能。 3,将控制家里光源的代码做成dll,便于软件实现动态加载。 4,使用qt5.15.2+vs2019开发自动根据工件类型加载不同工件展示界面,并按照检测顺序设置特定FOV颜色。 5,更改日志存储、读写run.ini文件、存储数据为csv文件功能。 6,在软件中加载aidi训练生成的Ai模型,加载特定工件使用的程式。 7, 7,在软件中添加FTP自动上传特定文件的逻辑代码。 6,使用mysql解决检测产品的各项查找功能。
470C/C++MySQL
职工健康管理系统全面涵盖了职工健康管理子系统与岗前健康筛查子系统两大核心模块。职工健康管理子系统功能丰富,包括建立并维护职工电子健康档案、实施职工健康状况的分级精准管理、定制个性化健康管理计划、记录并分析职工体检数据、开展职工心理测验以及持续监测健康数据等,旨在全方位促进职工身心健康;岗前健康筛查子系统则侧重于在职工上岗前或入职初期,通过智能穿戴设备的佩戴,结合先进的智能情绪分析仪技术,实时捕捉并分析职工的生理及心理指标。该系统能够依据预设模型对分析结果进行快速判定,一旦发现职工存在异常情况,立即触发预警机制,并将相关信息及时推送给相关管理人员,确保能够迅速响应并采取有效措施,从而有效保障企业的人力资源质量与工作效率。 系统完成建设投用后,通过对相关人员培训指导,辅助录入相关基础资料及建立相关系统策略,达到以下目标: 1)提升职工健康管理水平,健康管理体系与电子健康档案管理功能使得每个职工的体检记录、健康状况都有详细记录,便于管理者全面掌握职工健康情况。个性化健康管理计划能够根据职工的个人健康状况和需求,提供定制化的健康建议和指导,提高职工的健康意识和自我管理能力。 2)有效降低企业的健康风险与运营成本,岗前健康筛查机制被引入以实现对职工心率、血压、情绪等关键生理及心理指标的实时监控,预防带病上岗和疲劳作业等情况的发生。这一机制的核心在于实现“三及时”——及时监测、及时发现、及时预警,确保相关管理人员能够迅速洞察并妥善处理职工的生理与心理健康问题。通过这一举措,企业不仅能够显著减少因健康问题引发的安全隐患,还能在整体上提升企业的安全等级,为员工营造一个更加安全、健康的工作环境。
1270Java智慧矿山
1.本方案面向谁,解决了什么问题 本方案面向小微园智能制造产业园的数字化建设项目,包括1个数据中心,3个平台:实景可视化平台、数字化园区业务平台、智能制造服务平台,提供业务上云、设备上云,解决传统工业园区的数据孤岛、安全管理响应滞后、资源浪费不透明、能效低下、招商困难、产城分离和配套缺失等问题。 2.相比于市场常规方案,本方案有哪些特点 项目是一套专门针对小微工业园区的管理软件,通过一卡通管理园区企业员工的消费、门禁、考勤等日常行为; 集成了车辆管理系统,对进出园区车辆有了更好的控制,对园区的安全有了更大的保障; 集成了智能水/电表管理系统,更加方便的管理园区使用水电等能耗情况; 集成了电梯控制系统,可以对厂房电梯分权控制,对应的企业控制电梯的相应楼层,安全保障了园区企业资产的安全; 设计开发了基于机器视觉和 DJL 模型的人工智能监控系统,使用javaCV视觉库和ffmpeg技术开发和封装视频流编转码、转封装、中继拉推流、基于 Onvif 协议的云台反控等流媒体功能; 封装人脸/口罩/人体/车辆识别/区域入侵/烟火识别/图像对比/流量统计/OCR等AI算法接口,提供封装了行业经验的AI服务,通过SDK和接口为各业务模块赋能AI能力; 设计开发物联综管平台,封装基于不同设备通讯协议的 SDK,实现设备实时管理和基于Restful/EMQ/BACnetIP/OPC协议的物联设备数据集成和反控; 设计搭建工业大数据平台,对外提供数据可视化接口,为BI系统和其他业务模块提供数据采集SDK和统计结果查询接口。 3.方案的产品组成或技术选型 1.架构设计使用领域驱动模型(DDD),主要框架使用Rose、PowerDesigner建模,并定制开发了一套符合DDD方法论的代码生成工具; 2.使用Spring Cloud生态圈搭建微服务架构; 3.单体微服务采用Spring Boot+Spring Data Jpa Restful/Mybatis+SpringMvc零配置全注解框架; 4.分权分域模块采用OAuth2、JWT、Shiro实现; 5.爬虫项目采用WebMagic框架; 6.工业大数据分析平台使用Hadoop、Hive、HBase等大数据框架生态圈组件、BI可视化系统采用SuperSet、Grafana和自定义BIM可视化系统; 7.物联综管项目以不同方式对接三方设备平台,包括三方Http Api接口、webService、设备数据接入DTU、接入EMQ、基于javaCV/ffmpeg/nginx+rtmp/ zlmediakit的流媒体服务,并集成摄像头人脸识别、行为分析等AI功能; 8.监控系统采用Promethius+Grafana搭建; 9.前端采用Angular、Vue实现动静分离
1250Java工业园区数字化建设
编程语言: Python 深度学习框架: PyTorch 核心算法: AlphaPose(人体姿态估计) + ST-GCN(时空图卷积网络) 工具链: OpenCV(视频处理) 硬件平台: NVIDIA GTX3060 以下是根据您提供的信息整理的项目经历描述模板,突出技术亮点和应用价值: 项目名称 基于深度学习的家庭老人健康监护系统——实时动作识别与危险预警 项目简介 针对居家老人安全监护场景,开发一套基于计算机视觉的智能监测系统,利用AI技术实时分析视频流中老年人的行为特征,精准检测跌倒、抽搐等高风险动作并触发紧急报警。系统采用轻量化模型部署于边缘设备,兼顾实时性与准确性,为家庭提供7×24小时主动防护解决方案。 技术栈 编程语言: Python 深度学习框架: PyTorch 核心算法: AlphaPose(人体姿态估计) + ST-GCN(时空图卷积网络) 工具链: OpenCV(视频处理)、TensorRT(模型加速)、Flask(Web服务)、MySQL(数据存储) 硬件平台: NVIDIA Jetson Nano(嵌入式部署) 核心实现细节 多模态数据采集与标注 整合公开数据集(如HMDB51、UCF-101)与自采家庭场景视频,构建包含10k+标注样本的数据集,覆盖正常动作(行走、坐立)及异常动作(跌倒、颤抖)。 使用LabelImg工具进行精细化标注,同步记录时间戳与动作类型标签。 AlphaPose优化与适配 基于OpenPose改进人体关键点检测模型,引入动态权重调整机制提升复杂背景下的鲁棒性(如遮挡、低光照)。 通过ONNX格式转换实现模型轻量化,推理速度降低至
2280深度学习人工智能
本方案面向做AI项目的企业团队,同时面向AI小白,刚接手新项目而缺少经验的朋友; 本方案优势在于具备丰富的AI算法及行业落地相关经验,包括计算机视觉、多模态、大模型等; 本方案基于yolo、ByteTrack、ReID、llava、SAM、CLIP、docker、fast-api等相关技术组成!
1290深度学习人工智能
行为识别作为人工智能领域的关键应用之一,近年来受到了广泛关注,特别是在监控、人机交互及 体育分析等领域展现出巨大潜力。本文利用三维卷积神经网络(3D-CNN)来提升行为识别的精确度与 效率。3D-CNN 通过整合时空信息,相较于传统 CNN,在捕捉视频中动态行为特征方面具有明显优势。 本文选择 UCF YouTube 动作数据集的 UCF11 子集,该数据集以其多样化的动作类别和真实的视频 场景而著称,涵盖了篮球投篮、自行车骑行、跳水等 11 种典型动作。我们对数据进行了预处理,包括 类别编码、数据集划分、视频帧提取和保存,以便于后续的模型训练和评估。采用了随机裁剪、归一化 处理和转换为 PyTorch 张量等方法进行数据增强;模型训练时通过学习率调整及早停策略,防止过拟合, 确保了训练过程的高效与稳定。本文实施迁移学习策略——使用预训练权重,极大加速了训练进程,显 著提升了模型在新数据上的表现。 最后,模型测试部分展示了该方法在实际视频中的应用,通过对视频流进行逐帧处理,采用连续 16 帧作为输入,输出行为预测概率,实现实时行为识别。此阶段不仅验证了模型在复杂场景下的有效 性和准确性,还凸显了该 3D-CNN 框架在行为识别任务中的实战价值。总之,本文的研究不仅深化了对 3D-CNN 应用于行为识别的理解,也为未来相关研究和应用提供了宝贵的思路与实践指引。
2060深度学习人工智能
1.软件面向建筑施工领域,以实现及时、准确的检测混凝土损伤位置。 2.项目分为三大模块,分别为:构建混凝土病害数据集(解决目前开源数据集较少、多数数据集所含的样本类别单一、大多数数据集图像都取材于同一地点,场景较为单一,无法还原真实场景下的混凝土构件病害的问题。)、图像增强模块(旨在增强后续分割模型的鲁棒性和分割效果)、语义分割检测模块(检测实际应用中场景复杂、存在的密集小尺度目标,提高检测准确度)。 3.项目采用的技术方法有:通过数据搜集、数据清洗、图像增强、数据集标注和数据增强这五个步骤构建数据集;提出基于 Retinex 和图像融合的图像增强算法;提出基于注意力机制和特征金字塔的语义分割算法。
1760深度学习人工智能
在科技时代,技术每天都在进步。AIOT是一种高效的自动化系统,可以帮助工厂减少重复性劳动,减少人力。借助AIOT,系统可以自动执行需要大量精力和时间的常规手动任务,如控制设备自动启停,控制设备角度、压力,自动故障报警检修等。 另一方面,AIOT系统全天候运行,减少了晚班对人健康损耗;同时,在恶劣环境下仍然能够工作,保障人员安全。 福建三明钢铁厂智能降尘系统,正是AIOT落地典型场景,通过摄像头-》人工智能识别-》PLC设备,进行自动化作业;同时依照上级部门要求,对粉尘、PM2.5/PM10等状态进行上传,提供环保达标有力证明。
810图像识别工业互联网
视频描述产品系统
1. 使用transformer模型,完成视频序列到文本序列的转换,可以用在监控视频的存档和视频理解上; 2. 主要编程语言为Python,为了方便展示,使用JavaScript语言编写了前段页面。 3. 本项目利用先进的Transformer模型,实现高效、精准的视频内容转文字功能。通过深度学习技术,自动识别视频中的语音对话,转换为文字文本,助力信息快速获取与整理。适用于会议记录、视频编辑等多场景,提升工作效率,让视频信息传递更便捷。
1841深度学习人工智能
1.本项目为半导体行业芯片植球印锡的视觉检测应用。通过这个检测方案,检测少锡,偏锡,少球,偏球,异物的检测。 2.本案例可应用在该行业的所有客户。 3.本案例可离线或在线应用,通过灵活的模板制作,实现同类产品的检测需求。
1541深度学习人工智能
视频处理系统,在实时处理视频流时,检测、识别、分割等操作均可实时,精准捕捉画面中的关键元素。不仅如此,还能为用户一键美颜,瞬间提升颜值,或是添加趣味贴纸特效,让视频瞬间变得生动有趣,广泛适用于直播、短视频创作、社交娱乐等众多场景,全方位助力精彩呈现。
660深度学习人工智能
图片生成产品系统
我们的图片视频生成能力具备强大的角色与风格掌控力,能生成精美图片与视频。在小说推文领域,瞬间将精彩情节可视化,吸引读者目光;用于绘本创作,赋予故事鲜活生命力。支持多角色同屏生成,轻松构建复杂场景,换脸、换装随心所 “变”,甚至可按需精准输出文字,全方位助力创意落地。
750深度学习人工智能
本系统采用ssd_mobilenet_v1_coco 模型进行物体检测,运用集成工具mjpg-streamer进行图像读取,并将图像转变成HTTP流媒体,集成在Flask框架的Web应用中。电机控制块方面我们采用树莓派官方推荐的GPIOZero库来控制树莓派上的引脚进行输入输出,从而实现对电机的控制,以此为基础进行开发和设计。运用Python,Javascript开发语言,结合COCO数据集,配合Tomcat服务器。在树莓派系统上,调用微软官方训练好的ssd_mobilenet_v1_coco 模型,配合上述的集成工具mjpg-streamer,Flask框架进行开发,搭建一个基于B/S架构的小车物体检测跟踪系统。
1300图像处理生活服务
项目简介:旨在解决传统物理隔离传输系统中外部网络到内部私有网络的单向信息传输面临速度慢、效率低、误码率高等问题。具体为通过对文件进行特殊的编码算法处理,使传输数据以伪二维码图像矩阵的形式呈现,单张图像承载信息容量25KB;通过设计多通道编码展示和拍摄解码方式,实现多进程异步编解码,实现传输速度峰值达700KB/s,是当前国内同类竞品的7倍。 项目业绩:1.攻克传统物理隔离传输系统中单向信息传输速度慢、效率低及误码率高的难题,开发出创新性的物理隔离文件单向传输系统,提升企业与外部网络文件交互的效率与可靠性。 2.运用比特流加密、比特流图像转换编码算法将文件转化为伪二维码矩阵图像,实现高效信息承载与传输,有效减少传输过程中的数据错误与丢失,误码率较传统方式降低70%。3.基于现代计算机视觉和图像处理技术构建多通道展示与拍摄机制,实现多进程异步编解码,使系统传输速度峰值达 700KB/s,远超同类竞品。4.设计并实现系统与上层应用的交互接口,达成实时数据传输管控功能。通过此接口,上层应用能够对传输文件数据进行实时监控、调度与管理,提升数据传输的灵活性与可控性。
1781机器学习人工智能
AI绘画工具1.0产品系统
1.本软件面向使用AI绘画的用户,解决了用户在本地电脑使用AI工具进行绘画的问题。 2.相比于同类型的AI绘画产品,使用本软件的用户无需联网使用第三方提供的API即可在本地机器进行AI绘画,且出图质量高能够达到商用或者准商用水准。 3.本软件使用了目前较先进的绘画模型,可以由AI生成单张图片也可以批量生成图片。
980深度学习人工智能
一、提供个性化大模型解决方案咨询(指令咨询、POC) 服务内容全部包含: 1、大模型咨询服务:针对企业流程,提供个性化的大模型解决方案咨询,包括指令咨询、POC概念验证等。 2、大模型项目实施:帮助企业实施大模型应用,涵盖数据分析、流程自动化、预测模型等。 3、AI培训与落地:为企业内部人员提供大模型及AI技术培训,确保技术落地和持续优化。 4、Python模型应用开发:精通Python开发,能够快速为企业搭建大模型应用。 服务优势: 曾在智谱AI担任指令工程师,在使用大模型能力赋能传统企业完成流程再造方面具有丰富经验,曾负责知识库问答、NL2SQL、智能体、汽车座舱助手、信息抽取、AIPC、AI手机、营销报告生成、PPT生成、金融快讯生成等项目,覆盖汽车、手机、电商、金融、传媒、电信运营商等领域。 服务前需客户提供的信息: 1、选用的模型是什么; 2、部署方式:API/云端私有化/本地私有 3、客户提供不少于50条测试用例、输入输出范例、评测标准,响应速度等技术要求。 二、计算机视觉算法解决方案 服务内容全部包含: 1000+算法集成,可自由定制 智慧园区: 明火与烟雾检测、电梯间电动车识别、写字楼消防门堵塞、越界检测、离岗检测、垃圾桶满溢识别、攀爬识别 智慧工地:安全帽识别、反光衣识别、抽烟识别、打电话识别、离岗检测、明火与烟雾检测 智慧充电站:新能源车位燃油车驶入、跨位停车检测、车牌特征与车牌识别 智慧交通:车辆违停识别、机动车占道识别、电动车头盔识别、车牌识别 服务优势: 低成本 1、局域网环境本地部署,无数据安全风险; 2、充分利旧,不改造任何硬件; 3、1000+成熟算法,赋能千行百业; 4、作品:https://www.kancloud.cn/vinsonwang/aigc/3224775 服务前需客户提供的信息: 你的摄像头都有哪些品牌 你需要的部署环境是什么样的 你的需求场景的详细描述 你需要开发的功能有哪些 你预计需要哪几种算法
1850图像识别人工智能
车辆识别系统产品系统
1、基于最新的算法、最全的数据样本训练、最优的系统架构。 2、支持CPU、GPU兼容。 3、目标类型、车辆品牌、车头车尾、车身颜色、车辆类型、车牌类型、车牌号码、危险品车、出租车、驾驶人员、纸巾盒、遮阳板、天窗、收费类型等检测。
1260python人工智能
AI家庭助理产品系统
AI家庭助理是一款软硬件结合的智能家庭产品,它具有人脸识别,语音识别,智能聊天,智能提醒等多种功能。 它是将多种AI功能融合在一台笔记本中,或者也可以集成到一个小型机器人中。 它可以作为一款智能家居助手来使用,可以识别到各位家庭成员,提供聊天,打招呼,日程提醒,天气播报等。
1860图像处理人工智能
多模态GPT DoVI产品系统
本产品面向MCN公司、企业、主播,可以合成声音、音乐、视频。 基于vllm和阿里千问,结合OpenCV,做了微调,更适合音视频特定领域。支持离线部署,可以为企业定制训练模型,也可以接入第三方的NLP模型。
1590python人工智能
当前共32个项目more
×
寻找源码
源码描述
联系方式
提交