机器视觉

利用pytorch训练图片集,模型选用mobilenet,识别率95%以上。结合yolov8使用预训练模型,可视频动态识别物品的材质。yolo可以自己搜集图片集训练自己的模型
830深度学习人工智能
?智能监控三区域监控:支持同时监控3个屏幕区域(Boss血量、技能读条、技能喊话)实时OCR识别:使用PaddleOCR进行高精度中文文本识别规则匹配:支持自定义监控规则,精确匹配关键文本?语音播报EdgeTTS:使用微软EdgeTTS引擎,支持多种中文语音智能缓存:自动生成和缓存音频文件,提高响应
860Python人工智能
软件主要包括视觉算法模块、人机交互局模块、通信模块,软件主要功能是实现换向器表面缺陷的视觉检测 本人主要负责上位机软件开发和部分视觉检测算法的开发和部署 主要难点:视觉算法调试
1980MFC
该机场安检视觉识别系统为旅客安检提供了便利,主要功能为自动回收旅客置放行李的安检框。 项目主要分为: 1. 识别安检框内的物品 2. 运用机器视觉算法判断安检框是否可以回收 3. 回收安检框 我们负责设计整套视觉识别系统的方案设计,使用RFID技术辅助机械控制做空框自动回收;研发机器视觉的人工智能算法;最终达到了98%的准确率
1870人工智能
识别本项目目标是实现对自动生成的带有各种噪声的车牌识别。此次车牌识别是将车牌7个字符同时训练,字符包括31个省份简称、10个阿拉伯数字、2,共有65个类别,7个字符使用单独的loss函数进行训练。 添加了通过H(色调)和S(饱和度)来对车牌颜色进行判断,然后使用tkinter搭建了简单的GUI,可以实现打开摄像头拍摄照片然后再对照片进行识别
1950机器视觉
在语言级别的模态进行初步的情感识别并进行BERT的特征提取。 对于图片数据,利用CNN,Vi-Transformer进行特征提取,并利用Pytorch计算语言数据的对应程度,完成特征对其。 将对齐的数据进行特征融合,输出到Cross-Attention-Modality网络中进行前向传播与Loss计算。 针对不同的下游任务进行特定的超参数微调(Fine-Tuning).可将该模型迁移至任意给定的多模态任务。
1260机器视觉
也是我们自研的算法,适用于单目RGB相机,落地也很简单,适用于体感游戏、场馆演示等对精度要求不高的场景 RGB算法演示视频可以联系我私发
3031机器视觉
自研的主要产品,提供绝对的精确到mm级别的骨骼坐标,基于三维视觉和深度相机的高精度无穿戴VR全身追踪、动作捕捉,涉及的主要自研发明专利: 1、基于多TOF激光雷达和RGB摄像头的室内高精度实时建模和空间定位的装置和方法CN202111267813.3 2、一种基于多视角深度相机和深度学习的无需穿戴传感器的高精度360度全身追踪的方法CN202210977331.5 Steam搜索VR EZ FBT可直接下载 Bilibili搜索起源跃动官方账号有实机演示视频
1950VR/AR
极简的多深度相机进行点云融合和处理,相关自研发明专利: 1、一种低成本适用少量重合区域的高精度多RGB-D相机的外参标定方法CN202211032496.1 2、一种少量重合区域无需特制标定物的多深度相机外参标定的方法CN202210976978.6 3、一种基于深度学习的目标检测算法和点云配准算法的深度相机外参标定方法CN202210473661.0 4、基于多TOF激光雷达和RGB摄像头的室内高精度实时建模和空间定位的装置和方法CN202111267813.3
3210机器视觉
面部识别开门器。 实现一种基于眨眼检测的面部活动检测算法。 该算法通过网络摄像头实时工作,并且仅在眨眼时才显示该人的姓名。
1270机器视觉
给轮胎拍摄图片,通过计算机视觉算法去定位相关的孔的位置,定位的数据要给到后面双目摄像头。 测试定位精准度(精准度在真正圆心位置的几十个像素范围内,在实际中范围在0.5cm左右): 1、圆心通过减小框的粗度,用肉眼观察。 2、通过与传统方法计算得出的圆心进行比对。
1860机器视觉
当前共11个项目more
×
寻找源码
源码描述
联系方式
提交