计算机视觉库/人脸识别

人脸3D关键点检测

基于人脸关键点框架获取到400+人脸3D关键点数据，并绘制到人脸上。关键点数据覆盖：眼周、瞳孔、鼻子、额头、内外嘴唇…… MediaPipe

1990深度学习计算机视觉库/人脸识别

基于win或者ubuntu的深度学习算法调试

目前能够跑通深度学习中目标检测、目标分割、对抗网络的代码，主要对这三个方向比较了解与专攻，几乎有所有的代码，包括一些最新的CVPR的代码，能够实现在自己电脑中训练、推理与部署。曾经尝试郭修改算法结构，使其达到更好的效果。

2440C/C++程序调试工具

咽拭子自主采样设备研发

作品最终在新乡市实现批量化生产，自己主要负责视觉与传感器融合的算法调优、QT 界面部分设计，掌握了 QT 界面设计与基础深度学习算法；后续还有下一代机器，主要负责深度学习在嵌入式设备推理部署，掌握PyTorch模型在TensoRT中的推理部署。通过该作品，自己能够掌握神经网络的训练、优化与部署，并且具备一定的前沿视野，能够跑通部分的CVPR代码。

1900python图形/图像处理

人员及车辆计数及跟踪模型

1、YOLOv5m+deepsort视觉跟踪算法。结合YOLOv5m的目标检测和deepsort的特征跟踪，该算法在复杂环境下确保了目标的准确与稳定跟踪。在计算机视觉中，这种跟踪技术在安全监控、无人驾驶等领域有着广泛应用。 2、调用实时摄像头拍摄数据，检测道路人员及车辆数量，判断道路拥堵情况。 3、在画面中自定义边界线，统计进出数量。

2310图像处理计算机视觉库/人脸识别

浦发ocr通信采集平台

项目介绍：票据识别模块：OCR 平台系统基于深度学习算法及中英文检测识别技术，通过对上传图片信息进行获取和定位，实现图像文字信息自动识别和分析。提供多种场景下整体文字检测识别与信息提取，提供包含位置信息、生僻字及部分手写字的识别服务，能够实现对多种卡证、网络图片文字、表格文字、发票、银行票据、合同等 50 多种凭证的精准识别。信息采集模块：以 WEB 方式提供“OCR +人工 ”可自由组合的要素信息输出服务。以业务网段反向发布办公网的形式，像全行人员提供 OCR 服务。服务支持 UIAS 统一身份登录、本地图像上传编辑、多种识别模式、识别结果查询下载等功能。发工具以及所用技术：Springboot+Springcloud+mybatis+redis+Pulsar +webservice + vue + Typescript + oracle +python 责任描述：业绩: 业务测试:该功能就是在web 页面上传报文，通过 httpClient 发送请求测试是否联通。通用表格标注:前端使用 fabric 操作 canvas 加画线功能，将文件转换图片存储到服务器，调用识别微服务识别。识别发起:在 canvas 框内添加拖拽，粘贴功能文本转换:前端导入 pdf 文档，将 pdf 转换成文本文档接口配置分离:通过 k8s的 secret 功能将密码配置从应用本身剥离。业务查询优化:基于 redis 缓存技术，提升识别结果查询的性能，优化查询速度。持久化识别记录:使用多线程定时持久化数据库识别记录。影像脱敏:上传印章，人像，二维码关键部位信息模糊处理。添加熔断机制

2330spring计算机视觉库/人脸识别

语言增强的零样本多模态物体识别模型

当前越多越多的业务开始使用多模态大模型，尤其是视觉-语言预训练模型。在实际使用中，我们通常需要对预训练模型进行调优来适配实际的业务场景，而这需要大量的资源介入且费时费力，尤其是对视觉基座的调优在资源有限的情形下几乎是不可行的。本项目探索了在不调优视觉基座的前提下，仅通过对语言端进行调优并优化推理过程，实现语言增强的零样本多标签分类任务 (Zero-shot Multi-label Classification)。本项目为国际比赛获奖项目。

2340深度学习图像(Image)

AMR 物料运输车

背景：AMR，即自主移动机器人（Autonomous Mobile Robot），其具有智能感知、自主规划路径、灵活避障以及可安全地人机协作等能力。该项目旨在研发一款 AMR 能够更加灵活地应用于比亚迪仓库或工厂等环境，以实现更加智能、安全、柔性、高效的物流运输与仓储管理。贡献：开发实现了避障功能、动态电子围栏功能、物料对接功能，解决了迷航、定位偏移常等问题。

2900C/C++服务框架/平台

基于多模态的目标检测算法

项目主要是在DETR系列目标检测算法的基础上进行改进的，将其与多模态模型进行融合，将单模态目标检测算法改进为多模态目标检测算法，实现检测能力和识别能力上的提升。

4460深度学习图形/图像处理

龙岗敬老院服务平台

1.项目有邮箱注册，审核注册，系统登录，任务发布，算法推荐，任务受理，任务跟踪，即时沟通，评价反馈，资源共享 2.全部由我自己开发完成 3.挺好的，看看吧老板，么么哒

3590java邮件服务器

住佳云

1、SSM框架搭建项目架构，SpringCloudAlibaba作为服务注册中心和配置中心。 2、数据库选用Mysql，以及Mybatis框架强化版的Mybatis-Plus简化开发。 3、使用Redis缓存服务器来减轻数据库访问压力。 4、使用Elastic-Job 分布式调度框架来处理定时任务。 5、使用Maven管理、构建项目，Gitea托管项目代码。 6、GitLab+Jenkins+Maven构建与部署项目

1450java计算机视觉库/人脸识别

双相机标定

1.双相机标定是相机标定技术研发的便携式光学三坐标测量仪系统可全面替代门架式三坐标测量机，用于长度、轴矢量、角度、平面度等数据的测量。 2.使用的硬件工具：磁力支架滑台光栅尺双相机大屏幕 3.功能：三坐标测量（靶标列表：（靶标显示）、探针标定：（Width、Height、Length、探头直径、初始化、探针标定、一键标定）、点测量：（点A、点B）线测量：（线A、先B）、面测量：（面A、面B）、测量模式：（内侧、外侧、内外侧）；轴测量（图片列表、width、height、初始化、靶标显示、靶标中心（结果：轴1轴2、轴2轴3、轴1轴3）、选中：轴1、轴2、轴3）。 4.我负责整个软件和硬件的使用。

1790黑盒测试计算机视觉库/人脸识别

键盘外观自动检测系统（AOI）

针对XX加固键盘人工检验效率低、易疲劳、主观性强、判断标准难量化、存在误检与漏检风险等问题，充分借鉴国内外先进制造及检测经验，开发一套键盘外观自动检测系统，以“机器视觉”代替“人工视觉”进行键盘外观缺陷检验。该系统可以对键帽错装、反装、漏装、脏污、字符丝印错误等外观缺陷进行检验，具体如下： 1、字符未镭雕透澈检测； 2、字符错键检测； 3、LED背光颜色错误检测； 4、颜色过亮或过暗检测； 5、位置偏移检测； 6、角度旋转检测； 7、机械半成品LED颜色及亮度检测等。

3820C/C++图像(Image)

人脸识别

本项目旨在提供一个docker容器实现人脸检测和性别识别的效果，运行在一些不支持python的环境上（如openharmony）。我主要负责制作docker镜像，根据提供的算法模型调用他们的接口并通过flask框架提供http请求可访问的接口

1500python计算机视觉库/人脸识别

使用VIT进行目标检测

使用VIT把图片分成小补丁,编码补丁,使用多头自注意力,前馈全连接层,跳过连接构成编码器层,使用多个编码器层进行编码,最后形成边界框坐标输出

1840图像识别计算机视觉库/人脸识别

基于STM32芯片的图像识别算法开发

整个系统包括硬件系统和软件系统，其中硬件系统采用STM32作为核心处理器，采用摄像头进行图像采集，软件系统包括图像的二值化识别和显示

3090嵌入式计算机视觉库/人脸识别

阿萨德发撒的

阿斯蒂芬阿斯顿发生代发收到发斯蒂芬阿斯蒂芬阿斯蒂芬阿斯蒂芬撒的发生打发斯蒂芬阿斯蒂芬水岸东方艾师傅阿斯蒂芬阿斯蒂芬

1180javascript计算机视觉库/人脸识别

基于深度学习的生物标本图像训练与分类系统

项目分为控制模块、算法模块与数据库模块。其中控制模块主要负责控制硬件系统、与动作及传感机构通讯交互等功能；算法模块主要负责算法加载与管理、数据分析与结果生成等功能；数据库模块主要负责数据记录的查询和修改等功能。我负责全部的模块编写和系统组建。核心部分是基于深度学习的细胞识别，包括标注训练与测试，采用python编写dll由C#调用

1590深度学习计算机视觉库/人脸识别