计算机视觉库/人脸识别

1.嵌入式AI检测跟踪算法部署,可实时运行 2.上位机控制,网络下发指令和图像流, 3,返回下位机结果,在上位机综合决策并绘制信息。 4. 下位机可拓展开发控制外设(如伺服运动机构) 5. 算法之间可交互,可输入外部辅助信息,综合决策 6,示例中下位机使用的atlas200平台,同时支持海思3559/3403,RK35XX系列,以及其他 带NPU核心的平台移植开发。
380C/C++图像(Image)
游戏自动化产品系统
本方案面向手游玩家,解放双手 1、使用模拟器运行游戏 2、通过adb抓取游戏图像 3、使用yolo识别游戏元素 4、根据识别内容,生成相应操作指令 5、通过adb执行 点击,滑动等操作 循环执行上面的步骤,就可以实现游戏自动化,繁琐任务不用不停的点点点,目前采用的是固定逻辑,看起来有点死板,后续会添加PPO强化学习算法,通过训练,可以多开挑战boss,本项目是个人爱好开发,有需求的朋友可定制
520Python计算机视觉库/人脸识别
针对营区目前实际建设需求,提出建设数字化营区建设构想,建设以物联网及信息化技术为基础的数字营区管控系统,以提高业务管理效率和安全防范等级。 该系统以物联网及安全技术为基础,通过对人、车、物、装的全领域、全过程、全要素、全时段进行精细和系统的管理,推进营区管理模式由手工粗放管理到自动精确管理转变,由被动反应式向主动预见性转变,由数量规模型向质量效能型转变,实现营区诸要素数字化、设施设备智能化、信息资源网络化和日常管理可视化。以信息化的手段与营区业务相结合,提高部队生活工作效率、降低营区消耗、加强安全防范,同时能将部队的基本情况进行统一呈现和管理,作为部队的日常管理和决策的数据依据。
440C/C++视频网站系统
AI麻将训练营产品系统
想要提升麻将技巧却苦于没有专业指导?我们的智能麻将教练系统为您提供全方位提升方案!系统内置超过百万道专业题库,涵盖从基础到进阶的各种舍牌技巧训练,让您通过系统化练习快速掌握精准舍牌的要领。更配备AI智能教练功能,当您遇到复杂牌局时,只需输入当前牌型,AI将立即进行专业分析,为您计算出最优打牌思路和胜率最高的出牌策略。最令人惊喜的是我们的实时扫描功能,在实战对局中,通过智能扫描当前牌桌形势,结合您手中的牌型,即时运算出最佳应对策略,让您每手牌都打出职业选手般的水准!无论您是希望系统学习的新手,还是追求突破的进阶玩家,这套智能系统都能为您提供专业级的个性化指导,助您快速提升麻将水平。
610C/C++APP
这款鼠标隔空手势识别系统,让你摆脱物理鼠标束缚,用手势掌控数字世界。通过摄像头捕捉手部动作,精准识别食指移动、拇指点击、握拳拖动等指令,抬手间完成光标定位、左右键操作。基于MediaPipe手部追踪与OpenCV图像处理,响应灵敏,适配多种场景。无论是办公演示中隔空翻页,还是寒冬里蜷在被窝操作电脑,都能带来无接触的流畅体验,重新定义人机交互的便捷与自由。
650Python计算机视觉库/人脸识别
人工智能解决方案开发者,专注金融科技与企业服务领域。通过金融聊天机器人解决客服效率与精准应答难题,利用AI验证小程序保障线上交互安全,开发Python数据处理脚本高效处理文本/图像等多源数据,提升决策效率。 核心优势在于深度融合NLP与CV技术:聊天机器人精准理解金融术语与用户意图,验证系统结合图像识别强化核验可靠性。方案突出金融级合规安全,Python脚本具备高度定制化与自动化扩展能力,显著优于通用工具在复杂场景的局限性。 技术根基为Python全栈开发,精通NLP框架(Transformers/spaCy) 实现意图识别、实体抽取,掌握CV工具链(OpenCV/PyTorch) 完成图像识别与验证处理,设计高并发数据流水线支撑端到端AI落地。
560Python数据库服务器
一.AI配音 1.部署到本地配音模型 2.部署到本地的声音克隆 3.AI逆向翻译第三方生成的配音音频,用于匹配输入文本及后续处理 二.视频画面 1.AI生图: 利用大语言模型生成分镜描述,再使用文心,智谱等当前开放免费使用的生图API 2.视频随机混剪 3.简易高效的本地AI换脸视频生成
790Python图形和图像工具
1. 产品面向科研院所,解决了自动处理遥感图像,自动识别机场和飞机的需求。 2. 相比市场常规方案,此方案具有速度快,识别准确的特点。 3. 方案用到了opencv的图像处理算法,包括图像增强,图像分割。用到了matlab实现的注意力算法,用到了tensorflow架构实现的图片分类和目标检测模型.方案的部署采用了docker技术.
1170C/C++图形/图像处理
bim-viewer开源项目
一款基于Three.JS开发的前端BIM模型查看器,能支持gltf, glb, obj, fbx, stl, ifc 等丰富的三维数据格式。 开发了丰富的功能 - 如距离测量、角度测量、面积测量,同时支持吸附功能。 - 面剖切、盒剖切、轴向等剖切 - 集成了框线图、云线图、箭头、椭圆等标注功能。 - 具有良好的加载性能和运行时性能。
700C/C++计算机视觉库/人脸识别
所属公司: 广东亿讯科技有限公司 项目描述: 广东慧眼平台是广东亿讯科技有限公司旗下政法公安事业部的主要产品,目标客户是有视频监控,下载录像和摄像头告警需求的企业和机关单位,分为内网和外网通讯,界面由duilib编写,使用c++开发,由Advanced Installer工具进行打包,主要实现的功能有视频监控,录像回放,录像下载,视频上墙,添加水印,语音对讲,事件告警,事件回放,电子地图,扩展应用等功能 视频监控,录像回放通过rtmp取流,使用的库为librtmp,srs_librtmp,使用h.264,h265视频编码格式,视频通过DirectX渲染,视频上墙功能是由客户端进行视频窗口布局,布局完毕后发送给解码器进行投屏,事件告警主要是用于现场摄像头触发ai告警事件后,客户端查询后台获取告警信息并进行分页展示和提醒,添加水印功能通过ffempg命令实现,语音对讲功能用于现场摄像头和客户端远程通话或播报一键告警语音,同样通过rtmp传输,客户端采集的语音转成g711a或g711u格式发送给摄像头,摄像头传来的声音通过音频解码后用libzplay库播放 主要用到的库有:ffmpeg,librtmp,srs_librtmp,com组件,界面框架duilib,dxva2硬件解码库,ZPlayer音频播放库,DirectX 责任描述: 1.本人负责开发视频监控功能,使用srs_librtmp解析rtmp流,再使用ffempg解码并播放视频 2.负责开发事件告警,事件回放功能,通过定时向后台发送请求获取告警信息并展示,实现分页查询,告警提示,下载告警事件视频等功能 3.负责语音对讲功能,通过srs_librtmp解析音频流,再用ZPlayer播放语音,实现音频推流给后台,实现一键告警等 4.负责其他功能开发,视频上墙相关的操作界面,客户端登录,找回密码,修改密码,手机号登录,多账号登录,加密传输保证数据安全,电子地图,添加水印等
1690C/C++C/C++开发工具
本程序致力于提供一个强大且实用的人群计数工具,其核心目标在于精准地检测图像或视频流中出现的人体目标,并高效地统计其数量。为实现这一任务,程序采用了当前深度学习领域的主流框架——PyTorch,构建并部署了一个经过优化的YOLOv3 (You Only Look Once, version 3) 目标检测模型。 YOLOv3 被选为本程序的核心算法,主要得益于其卓越的性能平衡。作为一种单阶段(one-stage)检测器,YOLOv3 以其显著的速度优势闻名,能够在保持较高检测精度的同时,满足实时处理的需求。其核心原理是将目标检测视为一个回归问题,通过单次前向传播即可预测图像中所有目标的边界框位置及所属类别概率。本程序特别利用了 YOLOv3 的 Darknet-53 骨干网络提取深度特征,并结合其多尺度预测机制(在三个不同尺度的特征图上进行检测),使其能够有效应对人群计数中常见的尺度变化大(如近处个体大、远处个体小)和密集遮挡等挑战,精准捕捉不同大小的人体目标。
1000Python源文件源码
面向电力系统工人安全问题,聚焦工业生产、建筑施工、矿山作业、电力运维等强安全管控场景,覆盖施工现场、厂区作业区、检修运维区域等,对人员密集、作业风险高的场所进行 7×24 小时智能监测。 算法选型与开发 基础模型:基于 PyTorch深度学习框架,选用目标检测模型YOLOv8 系列,针对安全帽识别场景二次训练优化。 数据处理: 采集多场景(不同光照、角度、人员着装)的安全帽图像 / 视频数据,构建包含 “正确佩戴”“未佩戴”“佩戴不规范”(如帽带未系、歪戴 )的标注数据集; 通过数据增强扩充样本,提升模型泛化性。 功能实现: 检测人员头部区域,识别是否有符合标准的安全帽; 对安全帽佩戴细节(帽带、位置 )做精细化判断,区分 “规范” 与 “不规范” 状态。
850PythonPython开发工具1000.00元
盲区监视系统BSD(Blind Spot Detection)实时监测驾驶员视野盲区,精准识别车辆前、后、左、右盲区范围内的行人及非机动车辆,在判断可能发生危险时系统及时告警,避免意外发生。 可结合距离等维度定义不同等级的盲区预警,实际使用过程中针对不同车型、不同环境灵活搭配不同方向的盲区检测算法。 通过摄像头捕捉盲区内画面,应用视觉测距计算出盲区的风险范围,并结合人体检测、物体识别等技术对获取图像进行处理分析,若在风险区域内检测到车辆、行人,则向驾驶员发起警报。
710C/C++计算机视觉库/人脸识别
DMS​ 是一种基于摄像头、传感器和人工智能技术的车载系统,通过实时监测驾驶员的面部表情、眼部活动、头部姿态及行为状态,判断其是否处于疲劳、分心或危险驾驶状态,并在风险发生时发出预警或联动车辆控制,从而降低交通事故风险。据统计,37%的交通事故与驾驶员状态异常直接相关,而DMS可针对性解决疲劳驾驶、分心操作等核心隐患。
750C/C++计算机视觉库/人脸识别
360全景环视系统使用4个摄像头安装于车辆前后左右4个方向,实现车辆周围360度无死角的拼接,帮助驾驶员在倒车、转弯、窄路情况下安全行驶。 360全景环视系统使用4个摄像头安装于车辆前后左右4个方向,实现车辆周围360度无死角的拼接,帮助驾驶员在倒车、转弯、窄路情况下安全行驶。 360全景环视系统通过多摄像头协同、实时图像处理和智能算法,实现车辆周围环境的无盲区监控。 系统通常在车辆前部(保险杠/车标)、后部(尾门)、两侧(后视镜下方)各安装1个广角摄像头,形成4路主流方案;大型商用车或特种车辆可能扩展至6路(如增加车顶或吊具摄像头)。 广角镜头:视角需≥160°(部分达170°–180°),覆盖车身周边大范围区域。 高性能传感器:支持720P/1080P分辨率,具备星光级夜视、防水防震功能,确保低光照或恶劣环境下成像清晰。
2030C/C++计算机视觉库/人脸识别
通用采集控制器源文件源码
本方案采用4G Cat.1模块作为主控(如移远EC200N),集成ARM Cortex-M4内核,实现农业物联网的智能化控制。系统支持多路RS485传感器(土壤墒情、气象数据等)采集,通过Modbus RTU协议上传至云端。低功耗设计结合太阳能供电(MPPT充电+LiFePO4电池),待机电流
770嵌入式计算机视觉库/人脸识别10000.00元
流媒体系统产品系统
一、 随着安防视频监控技术的不断进步和广泛应用,各行各业对于视频监控系统的需求日益增加。然而,不同平台间缺乏统一的互通协议,使得视频资源的共享和管理变得复杂而困难。在这样的背景下,基于终端标准化、平台互联互通的需求,国标GB28181为视频监控系统的互联互通提供了重要的技术支持。 二、 1、采用的ACE的网络框架(提供丰富的网络编程接口) 2、支持进程守护、支持telnet 调试 3、支持北向和平台侧的HTTP协议交互 4、支持海康Ehome私有协议接入、支持GB28181 IPC设备接入 5、zookeeper分布式协调器,支持集群管理
970C/C++流媒体
一、面向对象与核心价值 本方案主要服务于公安部门、交通管理部门及高速公路运营单位,旨在解决三大核心问题: 车辆精准识别与追踪:通过高清摄像头与智能算法,实现车辆号牌、车型、颜色等特征的快速识别,支持嫌疑车辆布控、违法车辆追踪等场景。 交通流量实时监控:全天候采集道路车流量数据,为交通疏导、信号灯优化提供决策依据,缓解城市拥堵问题。 高效数据管理与分析:解决传统方案中数据分散、检索效率低的问题,支持海量抓拍数据的结构化存储、多维度检索及可视化统计。 本系统通过高稳定性、低延迟的技术架构,弥补了市场常见方案在复杂环境下的识别率低、数据丢失率高及跨平台兼容性不足的缺陷,为智慧交通与公共安全提供可靠支撑。 二、产品组成与技术选型 1. 数据采集系统 技术实现:基于标准C++开发,采用多线程、异步I/O技术,支持高并发数据接收与处理。 功能定位:负责对接高清摄像头、雷达等硬件设备,实时抓拍车辆图像并提取结构化数据(如车牌号、时间戳、地理位置),确保原始数据高效传输至后端。 2. 卡口监控Web平台 前端架构:采用Vue3框架,结合TypeScript与Element Plus组件库,实现动态图表展示、实时视频调阅及多条件复合检索功能。 后端架构:基于Java语言与Spring Boot框架搭建,集成MyBatis-Plus、Redis等组件,提供RESTful API接口,支撑权限管理、数据分发与统计分析服务。 三、核心竞争优势 1. 全栈跨平台兼容性 系统从数据采集到Web平台均采用跨平台技术栈(如C++的POSIX标准、Java的JVM特性、Vue3的浏览器适配能力),支持部署于Windows、Linux及国产化操作系统(如麒麟、统信),避免传统方案对特定操作系统的依赖,显著降低用户硬件采购与运维成本。 2. 高并发数据采集保障 多线程优化:采集系统基于C++11标准线程库,采用“生产者-消费者”模型,通过线程池动态分配计算资源,实现万级/秒的并发数据处理能力,较传统单线程方案效率提升300%以上。 零丢失设计:通过双缓冲队列、断点续传机制及异常状态实时监控,确保极端网络波动或硬件故障下的数据完整性,漏拍率低于0.01%。 3. 前后端分离与高性能架构 前端体验升级:Vue3的响应式编程与虚拟DOM技术,支持复杂交互场景的流畅渲染;结合WebSocket实现违法告警信息实时推送,较传统jQuery方案减少80%的页面卡顿问题。 后端弹性扩展:Spring Cloud微服务架构支持动态扩容,通过Nginx负载均衡与分布式数据库(如MySQL集群),可承载百万级车辆数据的秒级检索;内置规则引擎支持自定义布控策略,提升违法行为的主动拦截效率。 4. 综合附加优势 安全性:采用国密算法对传输数据加密,支持HTTPS协议与OAuth2.0身份认证。 智能化扩展:预留AI算法接口,可无缝集成车型识别、驾驶员行为分析等深度学习模型,满足未来业务升级需求。 总结 本方案通过跨平台兼容性、高并发数据处理与现代化前后端架构,构建了高性能、易扩展的卡口监控体系,为公共安全与交通管理领域提供了兼具稳定性与前瞻性的解决方案,助力用户实现从“被动监控”到“主动治理”的数字化转型。
1150C/C++计算机视觉库/人脸识别
NVIDIA Orin Nano 4GB 硬件平台实现高效的缺陷检测功能。通过一对一部署检测模型支持 Orin Nano 利用摄像头进行自主缺陷检测,适用于工业生产场景中的质量控制。 主要功能 1.Orin 连接与数据库设置支持配置 Orin Nano 的数据库连接,确保检测数据实时存储与管理。 2.摄像头与视频上传提供摄像头选择功能,支持上传测试视频以进行缺陷检测。 3.模型选择与管理允许用户选择预训练的缺陷检测模型,灵活适配不同检测需求。 4.实时画面监控实时显示 Orin Nano 摄像头捕获的检测画面,便于用户监控检测过程。 5.数据库内容查看提供直观的界面,方便用户查询和分析存储在数据库中的检测结果。 应用场景 •制造业:用于生产线上的零件、产品表面缺陷检测。 •自动化质检:结合 Orin Nano 的边缘计算能力,实现高效、低延迟的实时检测。 •工业物联网:通过数据库管理检测数据,支持后续分析与优化。 技术亮点 •高效部署:与 Orin Nano 4GB 硬件紧密集成,充分发挥其边缘计算能力。 •用户友好:PyQt5 打造的图形化界面,操作简单直观。 •灵活扩展:支持多种摄像头与模型,适配不同工业检测场景。 本客户端为工业缺陷检测提供了一体化的解决方案,结合边缘计算与本地化数据库管理,助力智能制造与质量提升。
1880Pythonpython
人体行为识别产品系统
已形成产品,可于英伟达与tpu部署。通过改进轻量化模型形成高精人体骨架识别与行为识别融合模型,对于施工人员的安全检测与低照度有限空间施工现场人员检测有显著作用。本算法已形成相关论文,且支持国产化部署与英伟达端部署。
880Torch计算机视觉库/人脸识别
当前共152个项目
×
寻找源码
源码描述
联系方式
提交