计算机视觉库/人脸识别

阿斯蒂芬阿斯顿发生代发收到发斯蒂芬阿斯蒂芬阿斯蒂芬阿斯蒂芬撒的发生打发斯蒂芬阿斯蒂芬水岸东方艾师傅阿斯蒂芬阿斯蒂芬
1060javascript计算机视觉库/人脸识别
背景:AMR,即自主移动机器人(Autonomous Mobile Robot),其具有智能感知、自主规 划路径、灵活避障以及可安全地人机协作等能力。该项目旨在研发一款 AMR 能够更加 灵活地应用于比亚迪仓库或工厂等环境,以实现更加智能、安全、柔性、高效的物流运 输与仓储管理。 贡献:开发实现了避障功能、动态电子围栏功能、物料对接功能,解决了迷航、定位偏 移常等问题。
2360C/C++服务框架/平台
整个系统包括硬件系统和软件系统,其中硬件系统采用STM32作为核心处理器,采用摄像头进行图像采集,软件系统包括图像的二值化识别和显示
2830计算机视觉库/人脸识别
项目介绍:票据识别模块:OCR 平台系统基于深度学习算法及中英文检测识别技术 ,通过对上传图片信息进行获取和定位 ,实现图像文字信息自动识 别和分析。提供多种场景下整体文字检测识别与信息提取 ,提供包含位置信息 、生僻字及部分手写字的识别服务 ,能够实现对多种卡 证 、网络图片文字 、表格文字 、发票 、银行票据 、合同等 50 多种凭证的精准识别。 信息采集模块:以 WEB 方式提供“OCR +人工 ”可自由组合的要素信息输出服务 。以业务网段反向发布办公网的形式 ,像全行人员提供 OCR 服务。服务支持 UIAS 统一身份登录 、本地图像上传编辑 、多种识别模式 、识别结果查询下载等功能。 发工具以及所用技术:Springboot+Springcloud+mybatis+redis+Pulsar +webservice + vue + Typescript + oracle +python 责任描述:业绩: 业务测试:该功能就是在web 页面上传报文 ,通过 httpClient 发送请求测试是否联通。 通用表格标注:前端使用 fabric 操作 canvas 加画线功能 ,将文件
1970计算机视觉库/人脸识别
依据网页分析,获取需要的数据,采用多线程方式,加快爬取速度和运行速度。充分使用python自带的库,完成项目需求
1350数据查询
本项目旨在提供一个docker容器实现人脸检测和性别识别的效果,运行在一些不支持python的环境上(如openharmony)。 我主要负责制作docker镜像,根据提供的算法模型调用他们的接口并通过flask框架提供http请求可访问的接口
1270python计算机视觉库/人脸识别
基于人脸关键点框架获取到400+人脸3D关键点数据,并绘制到人脸上。 关键点数据覆盖:眼周、瞳孔、鼻子、额头、内外嘴唇…… MediaPipe
1770计算机视觉库/人脸识别
1、SSM框架搭建项目架构,SpringCloudAlibaba作为服务注册中心和配置中心。 2、数据库选用Mysql,以及Mybatis框架强化版的Mybatis-Plus简化开发。 3、使用Redis缓存服务器来减轻数据库访问压力。 4、使用Elastic-Job 分布式调度框架来处理定时任务。 5、使用Maven管理、构建项目,Gitea托管项目代码。 6、GitLab+Jenkins+Maven构建与部署项目
1250Java计算机视觉库/人脸识别
项目主要是在DETR系列目标检测算法的基础上进行改进的,将其与多模态模型进行融合,将单模态目标检测算法改进为多模态目标检测算法,实现检测能力和识别能力上的提升。
3700图形/图像处理
当前越多越多的业务开始使用多模态大模型,尤其是视觉-语言预训练模型。在实际使用中,我们通常需要对预训练模型进行调优来适配实际的业务场景,而这需要大量的资源介入且费时费力,尤其是对视觉基座的调优在资源有限的情形下几乎是不可行的。本项目探索了在不调优视觉基座的前提下,仅通过对语言端进行调优并优化推理过程,实现语言增强的零样本多标签分类任务 (Zero-shot Multi-label Classification)。本项目为国际比赛获奖项目。
1940图像(Image)
1数据加载,对数据进行分析,使用数据增强训练等,优化数据分布; 2模型设计,考虑使用卷积神经网络还是transformer等网络结构; 3 模型训练,使用不同的策略进行训练; 4模型验证
1330计算机视觉库/人脸识别
目前能够跑通深度学习中目标检测、目标分割、对抗网络的代码,主要对这三个方向比较了解与专攻,几乎有所有的代码,包括一些最新的CVPR的代码,能够实现在自己电脑中训练、推理与部署。曾经尝试郭修改算法结构,使其达到更好的效果。
2050C/C++程序调试工具
作品最终在新乡市实现批量化生产,自己主要负责视觉与传感器融合的算法调优、QT 界面部分设计,掌握了 QT 界面设计与基础深度学习算法;后续还有下一代机器,主要负责深度学习在嵌入式设备推理部署,掌握PyTorch模型在TensoRT中的推理部署。通过该作品,自己能够掌握神经网络的训练、优化与部署,并且具备一定的前沿视野,能够跑通部分的CVPR代码。
1730python图形/图像处理
1.项目有邮箱注册,审核注册,系统登录,任务发布,算法推荐,任务受理,任务跟踪,即时沟通,评价反馈,资源共享 2.全部由我自己开发完成 3.挺好的,看看吧老板,么么哒
3250Java邮件服务器
1、主要模块有: 垃圾检测模块,在无人机巡检的视频中检测出相应的垃圾信息,并反馈给用户 2、我主要负责的工作: 整个程序全部由我负责完成 技术栈: 后端:Python 目标识别:yolov5 前端: Python的 tkinter模块 3 遇到的困难: 主要是垃圾的形状、颜色、大小、都不固定,这给识别目标带来了一定的困难。 解决:通过增加喂给AI模型更多数据、更细致的人工打标签,使得识别率达到了90%以上
2590pythonPython开发工具
我们的交通标志识别系统利用先进的卷积神经网络(CNN),特别是YOLO-v5模型,来实现对交通标志的实时识别。这一系统经过大量数据的训练,已开发出高精度的识别模型,并成功集成到车载设备中。该车载设备配备摄像头,能够实时捕捉道路图像并通过模型进行分析,从而准确识别出各种交通标志。 主要功能: 1. 实时识别: 高效处理:基于YOLO-v5模型,系统能够在毫秒级别内处理图像并识别交通标志,确保在行车过程中不延迟。 精准识别:通过大量数据训练,模型具备高精度识别能力,能够准确分辨各种类型的交通标志。 2. 车载设备集成: 硬件集成:系统已成功嵌入车载设备,设备内置高性能摄像头,实时捕捉道路影像。 低功耗高性能:设备设计兼顾性能和功耗,确保长时间稳定运行。 3. 图像处理与分析: 实时图像输入:摄像头实时捕捉道路图像,系统即时处理输入图像。 标志识别输出:系统处理图像并输出识别结果,包括交通标志的类型和位置。 4. 项目优势: 高精度识别:利用YOLO-v5模型的优势,通过大量数据训练,实现对交通标志的高精度识别。 实时处理:系统能够在行驶过程中实时处理图像并识别交通标志,提供即时反馈,提升
2320C/C++嵌入式操作系统
项目包含图像处理模块、图像加载模块、参数控制模块、训练验证模块、模型导出模块…… 使用迁移学习、Pytorch、sklearn、混淆矩阵
1130计算机视觉库/人脸识别
1.双相机标定是相机标定技术研发的便携式光学三坐标测量仪系统可全面替代门架式三坐标测量机,用于长度、轴矢量、角度、平面度等数据的测量。 2.使用的硬件工具:磁力支架 滑台 光栅尺 双相机 大屏幕 3.功能:三坐标测量(靶标列表:(靶标显示)、探针标定:(Width、Height、Length、探头直径、初始化、探针标定、一键标定)、点测量:(点A、点B)线测量:(线A、先B)、面测量:(面A、面B)、测量模式:(内侧、外侧、内外侧);轴测量(图片列表、width、height、初始化、靶标显示、靶标中心(结果:轴1轴2、轴2轴3、轴1轴3)、选中:轴1、轴2、轴3)。 4.我负责整个软件和硬件的使用。
1500计算机视觉库/人脸识别
针对XX加固键盘人工检验效率低、易疲劳、主观性强、判断标准难量化、存在误检与漏检风险等问题,充分借鉴国内外先进制造及检测经验,开发一套键盘外观自动检测系统,以“机器视觉”代替“人工视觉”进行键盘外观缺陷检验。该系统可以对键帽错装、反装、漏装、脏污、字符丝印错误等外观缺陷进行检验,具体如下: 1、字符未镭雕透澈检测; 2、字符错键检测; 3、LED背光颜色错误检测; 4、颜色过亮或过暗检测; 5、位置偏移检测; 6、角度旋转检测; 7、机械半成品LED颜色及亮度检测等。
3230C/C++图像(Image)
使用VIT把图片分成小补丁,编码补丁,使用多头自注意力,前馈全连接层,跳过连接构成编码器层,使用多个编码器层进行编码,最后形成边界框坐标输出
1520计算机视觉库/人脸识别
当前共137个项目
×
寻找源码
源码描述
联系方式
提交