图像处理

目标检测源文件源码
本方案旨在解决目标检测和视频帧的多目标检测,该任务应用于后续的多目标跟踪和分割等任务。可根据用户需求更换数据集,不仅限于人。本方案使用深度学习框架,相比于传统算法,精度更高,本方案无需训练即可使用。
1620深度学习python
农业病虫害识别源文件源码
该项目面向农业行业,识别农业病虫害; 该项目包含如下模块: 1、数据处理模块,包括图片裁剪、增强、灰度处理等; 2、目标检测模块,检测图片中是否存在病虫害,识别病虫害的种类和位置; 3、可视化模块,对模型预测结果进行可视化; 4、API模块,访问API识别图片 该项目基于YOLO系列模型为框架,进行模型微调,满足特定图片和区域的识别
1570python计算机视觉库/人脸识别10000.00元
目前的TCT筛查由细胞病理医生完成,由于受医生专业水平和检测机器的影响,存在部分判别错误的情况。构建AI辅助TCT筛查系统,对给定的可识别的TCT图片去识别,可识别非典型鳞状细胞、低度鳞状上皮内病变、高度鳞状上皮内病变等。全力确保不漏诊,避免假阴性,提高诊断效率;
970图像处理医疗图像;图像识别10000.00元
针对国外的一款小游戏,开发类似产品,满足少儿游戏需求及实现亲子陪伴,同时在玩游戏时可以学习一些知识。学生用马克笔在图纸上画出各种颜色物体,以红黄蓝绿为主要功能颜色,并能从相机选择照片上传,可实现障碍跑酷、接水果、飞机大战、翻牌对对碰等小游戏。该项目主要功能点包括:颜色识别分 割、通用分割、相似性图片检测、文字识别及语音识别等,丰富小学生生活同时,并其实现相应的教育价值。
740深度学习图像处理10000.00元
仪表盘读数识别源文件源码
算法分为4个流程,首先用yolov5s模型从原图中识别出仪,接着用yolov8x-pose模型检测出仪表中的刻度线、指针的关键点,再用DBNetpp模型检测出数值框并用SATRN模型进行文本识别,最后后处理得到读数结果。
700深度学习图像识别10000.00元
1、为了提供优质的乘车体验和便捷的购物服务,在用户的打车过程中,座舱内配备了无人售货服务,供应各类商品如饮料、小食品及广告商提供的化妆品小样等。该服务包括两项主要功能:一是识别乘客从售货机中取出的商品;二是识别司机补充的商品。通过精准识别商品的拿取和补充动作,系统将相关信息反馈给后台,以便支持自动支付流程; 2、实现目标跟踪,动态跟踪识别返回最终的识别结果,召回率0.96; 3、进行数据增强,包括亮度、对比度、翻转、剪切等,训练优化检测模型,优化损失函数,缓解遮挡问题及类别不均衡; 4、FastAPI接口服务、Docker封装私有化部署、Tensorrt推理加速;
690深度学习python10000.00元
商品识别源文件源码
对于售货店的商品进行编号,并将信息录入数据库,程序通过视觉识别是哪些商品,获得对应编号价格等信息.采用改良的yolo算法,运行速度快,效果准确,在多商品的情况下也能良好地检测。在有误导物存在,或遮拦的情况下也能较为准确的检测。源代码内存较小,利于部署。
970深度学习计算机视觉库/人脸识别30.00元
本方案面向需要对图片数据进行标注的行业用户,如人工智能模型训练团队、计算机视觉研究者、教育及科研机构等。针对传统标注工具需安装客户端、不便协作和跨平台使用的痛点,本方案提供了一种轻量化、跨平台、在线化的图片标注解决方案,大幅提升了标注效率和团队协作体验。 无需安装,随时随地使用:系统基于Web技术开发,用户只需通过浏览器访问即可开始标注,无需安装任何软件,支持多平台兼容(Windows、macOS、Linux等)。 实时协作功能:支持多人在线协作标注,通过WebSocket等技术实现实时同步,提高团队协作效率。 高度定制化:提供多种标注工具(矩形、自由曲线、多边形等),并允许用户根据需求自定义标注类型和属性,适应不同领域的标注需求。 友好的用户界面:基于Vue3设计的现代化UI,交互流畅,易于上手。 灵活的数据管理:支持数据导入导出(如COCO、VOC格式),并能通过RESTful API或WebSocket接口与其他系统无缝对接。 上传下载图片资源:支持zip压缩图片文件的上传后系统自动解析,标注完成后可将资源文件自动压缩为zip文件后下载到本地后直接用于yolov8的训练。 高性能与扩展性:通过Node.js Express实现后端服务,轻量高效,适合大规模部署;同时支持与云存储或数据库系统(如MySQL)集成,确保标注数据安全与持久化。 前端:使用Vue3 + TypeScript开发,采用Pinia管理状态,提供动态标注工具与实时协作功能。 后端:基于Node.js和Express实现,提供RESTful API服务,并通过WebSocket支持实时通信。 数据库:可选用MySQL,存储标注数据及用户信息,支持数据高效查询与持久化。 文件存储:支持本地文件系统或云存储(如AWS S3、阿里云OSS),便于图片资源管理。 该系统以简洁高效为核心设计理念,为用户提供一种集便捷性、灵活性和扩展性于一体的在线图片标注解决方案。
9760javascriptvue1991.00元
视频转换gif格式源文件源码
内容创作者:包括博主、短视频制作者、社交媒体用户等,他们经常需要将视频片段转换为GIF以在平台上分享或嵌入文章。 开发者与程序员:需要集成视频转GIF功能的网站或应用开发者,可以利用本项目提供的API或源码进行快速集成。 教育工作者:在制作教学材料或演示文稿时,可能需要将视频中的关键帧转换为GIF来辅助说明。 市场营销人员:用于制作广告素材、产品演示等,GIF格式因其循环播放的特点,非常适合快速传达信息。 便捷性:用户无需下载多个软件或学习复杂的命令行操作,即可快速将视频转换为GIF。 效率:通过优化FFmpeg参数,大幅缩短了转换时间,同时保证了GIF的质量和大小。 定制化:提供丰富的参数设置,如分辨率、帧率、颜色深度等,满足不同场景下的转换需求。 跨平台:基于Node.js的后端服务确保了服务可以部署在多种操作系统上,前端Vue框架使得前端界面能够在各种设备上流畅运行。 高度集成与易用性:集成了FFmpeg的强大功能,同时通过Vue构建了直观易用的用户界面,降低了技术门槛。 高效处理:通过智能分析视频内容,自动选择最优的转换参数,确保转换效率与质量的平衡。 云端部署支持:支持云服务器部署,用户无需在本地安装任何软件,只需通过网页即可享受服务,适合大规模用户访问。 API接口开放:除了前端界面,还提供RESTful API接口,方便其他开发者集成到自己的项目中,扩展性强。 实时预览与编辑:在转换前,用户可以在前端界面实时预览视频片段,并进行简单的编辑(如裁剪、调整速度等),提高了转换的精准度和灵活性。 安全与隐私保护:所有上传的视频文件在转换完成后会自动删除,不存储用户数据,确保用户隐私安全。 后端技术: Node.js: 作为服务器端运行时环境,Node.js 提供了高性能的异步I/O操作,非常适合处理文件上传、转换等I/O密集型任务。 使用Node.js的Express框架搭建服务器,处理HTTP请求,提供RESTful API接口。 FFmpeg: FFmpeg是一个开源的多媒体处理框架,能够解码、编码、转码、混流、过滤和播放几乎所有已知格式的音视频文件。 在本项目中,FFmpeg被用作视频转GIF的核心工具,通过Node.js的子进程模块调用FFmpeg命令行进行视频处理。 文件系统操作: 使用Node.js的文件系统(fs)模块进行视频文件的上传、存储、读取和删除操作。 数据库(可选): 如果需要记录转换任务的状态、用户信息等,可以使用MongoDB、MySQL等数据库。但考虑到本项目的核心功能是即时转换,不存储用户数据,因此数据库可能不是必需的。 前端技术: Vue.js: Vue.js是一个用于构建用户界面的渐进式JavaScript框架。它易于上手,同时提供了强大的数据绑定和组件化开发能力。 使用Vue CLI快速搭建前端项目,通过Vue Router实现页面路由,Vuex管理全局状态。 前端UI框架(如Element UI、Vuetify等): 为了提升用户体验和界面美观度,可以选择使用Element UI、Vuetify等基于Vue的UI框架来构建前端界面。 文件上传组件: 使用Vue的文件上传组件(如vue-file-pond、vue-upload-component等)实现视频文件的上传功能。 前端数据处理与展示: 使用JavaScript进行前端数据处理,如视频预览、转换进度展示等。 使用Vue的模板语法和指令进行数据绑定和动态渲染。
2040vueWeb框架600.00元
1.木材颜色筛选程序可以按模版将不同种类的木材进行分类识别。 2.本项目主要分为Qt界面模块、摄像头采集模块、算法识别模块。分别实现了界面交互、摄像头采集控制、算法识别木材种类。 3.项目使用C++作为主要开发语音,使用Qt进行界面设计加快开发速度,使用OpenCV进行算法开发确保程序的运行速度。
2290C/C++Qt
demosaic算法源文件源码
1. 插值计算G通道:估计raw图红色像素位置的色差G-R,蓝色像素位置的色差G-B,从而完成绿色像素插值。在估计色差时,使用东西方向的水平色差估计值和南北方向的垂直色差估计值,加权平均计算色差。权重与色差梯度成反比。 2. 插值计算R位置上B通道和B位置上的R通道:用上一步计算的色差估计raw图红色像素的色差G-B,蓝色像素的色差G-R。从而完成红色和蓝色像素位置的三通道插值。 3. 插值计算G位置上的R和B通道:使用双线性插值得到raw图G像素上的色差G-R和G-B,至此完成所有位置的RGB插值
3280图像处理图形/图像处理
该项目基于pyTorch的深度学习API实现的一个U-Net的图像分割的深度学习框架。目前用于项目:穿越机的自主导航,作为其中的感知部分。获取穿越赛道门的像素坐标,从而进一步做位姿估计用于下一步的路径规划。该项目下一步使用MPC和DRL结合实现的路径规划方案。
1520深度学习图像分割1000.00元
1.面向行业和所解决问题 行业:面向安防场景,移动端检测场景,自动驾驶场景,门禁轧机,工厂生成线等。 解决问题:目标物体检测和跟踪,目标物体识别,人脸识别,缺陷检测等 2.功能模块和作用 图像处理:图像去噪,去畸变,梯形矫正 检测,分割:使用yolov8模型进行目标物体的检测和分割 识别:使用深度学习模型提取特征并与预存库进行对比识别 3.所选技术和原因 数字图像处理技术:处理各类相机在各类场景下拍摄到的画面,消除由于畸变,噪声等造成的干扰 深度学习技术:使用深度学习模型对特定目标进行训练,保证在个各个复杂常见中能有稳定地检测到,分割出目标物 在移动终端部署:使用各类基于硬件边缘计算厂商的推理框架进行部署(nvidia的TernserRt,rockchip的rknn,海思的nnie等)
6131C/C++计算机视觉库/人脸识别
人脸识别源文件源码
打造一款集成前沿科技的网页应用,需融合精妙的前端设计与强大的后端支持。前端采用HTML/CSS/Django构建直观界面,利用Webcam API捕捉图像,实现流畅的人脸识别流程。后端依托Node.js或Python处理复杂逻辑,同时MySQL数据库确保用户数据的安全存储与高效检索。综合运用这些技术,可构建出既安全又便捷的登录系统,让用户体验未来科技的魅力。
3710前端计算机视觉库/人脸识别500.00元
(1)提出了一种基于循环网络框架下的多目标追踪方法(RN-MOT),为解决基于城市交通场景下多目标跟踪算法的精确度较差问题提供了一种新的思路;(2)提出了一种集成学习结合压缩算法的框架,在损失极少精确性的前提下极大地提升了RN-MOT算法的检测及追踪速度;(3)测试了包含目标遮挡、镜头移动、目标较多等挑战场景下的视频序列以验证和优化RN-MOT算法;
1770深度学习标签(Label)5.00元
iimage 是 Flutter 开发中图像处理专业库,它包含多种针对图像二进制数据的处理。例如: 图像的反色、图像的镜像、图像的翻转、图像灰度等等。本作品不用于商业,是针对想对 Flutter 图像处理相关知识人员的相互学习。如果有想更深入的了解图像的处理,不如绘制(PS)一样,请私下联系我。
3980镜像
1、识别模块:基于opencv通过模板匹配算法进行音乐乐符的识别与解析,生成包含乐符音种以及时长的json文件 2、自动演奏模块:基于tkinter的前端弹奏页面,通过选择歌曲的json文件进行数据的整理以及自动化弹奏
3630模板匹配
当前共17个项目more
×
寻找源码
源码描述
联系方式
提交