机器视觉

农业病虫害识别源文件源码
该项目面向农业行业,识别农业病虫害; 该项目包含如下模块: 1、数据处理模块,包括图片裁剪、增强、灰度处理等; 2、目标检测模块,检测图片中是否存在病虫害,识别病虫害的种类和位置; 3、可视化模块,对模型预测结果进行可视化; 4、API模块,访问API识别图片 该项目基于YOLO系列模型为框架,进行模型微调,满足特定图片和区域的识别
1470python计算机视觉库/人脸识别10000.00元
商品识别源文件源码
对于售货店的商品进行编号,并将信息录入数据库,程序通过视觉识别是哪些商品,获得对应编号价格等信息.采用改良的yolo算法,运行速度快,效果准确,在多商品的情况下也能良好地检测。在有误导物存在,或遮拦的情况下也能较为准确的检测。源代码内存较小,利于部署。
920深度学习计算机视觉库/人脸识别30.00元
分布式训练框架源文件源码
项目概述 本项目旨在构建一个分布式深度学习训练系统,涵盖客户端、主服务器和从服务器,实现用户登录、数据上传、任务管理、模型训练、监控与可视化等功能。系统支持高并发、易扩展和高容错的训练任务处理,适用于大规模深度学习任务的分布式管理。 客户端功能(PyQt) 客户端基于PyQt开发,提供用户登录、数据上传和任务状态查看功能。用户通过账号密码登录,获取JWT令牌以验证身份。数据上传模块支持多线程上传标注数据压缩包,并提交包含用户信息和任务参数的训练请求。任务状态查看模块定期查询主服务器,以表格形式展示任务列表,支持按状态、提交时间排序和筛选功能。 主服务器功能(Django + Nginx + Kafka + NFS + Prometheus + Grafana) 主服务器采用Django框架,结合Nginx、Kafka、NFS、Prometheus和Grafana,实现用户管理、任务管理、数据存储、监控与可视化功能。 用户管理 使用Django内置用户认证系统,支持用户注册、登录和权限分配。管理员可通过Django Admin界面操作用户数据,实现灵活的用户角色管理。 任务管理 主服务器接收客户端的训练请求,解析任务信息并存储到数据库中。任务通过Kafka队列管理,分发给从服务器。系统提供任务状态查询接口,返回任务的当前状态,包括任务ID、提交时间、状态、预计完成时间和结果路径等信息。 数据存储 使用NFS构建共享存储,上传的训练数据存储在主服务器的/nfs/data//路径下,供从服务器拉取。任务信息中包含数据路径,确保从服务器能够高效获取所需数据。 监控与可视化 Prometheus用于监控主服务器和从服务器的运行状态,包括CPU、内存、磁盘等指标。Grafana集成用于展示系统运行状态、任务轨迹和性能数据,支持系统状态、任务状态和历史统计的可视化。通过Django模板,将Grafana仪表盘嵌入到管理界面,实现直观的系统监控。 从服务器功能(Python + Prometheus Node Exporter + Kafka Consumer) 从服务器负责任务执行和状态监控。通过Kafka消费任务,从NFS拉取数据,执行深度学习模型训练,并将结果上传到主服务器。从服务器运行Prometheus Node Exporter监控资源使用情况,并将任务执行状态上传到Kafka,供主服务器监控。
1560flaskc++2000.00元
OCR文字识别源文件源码
文字识别是一种将图像中的文本内容转换为可编辑和搜索的数字文本的技术。它广泛应用于各种场景,包括文档数字化、自动化数据输入、信息检索等。OCR的应用场景 文档数字化: 将纸质文档扫描成图片,并通过OCR转换为可编辑、可搜索的数字格式,如PDF或Word文档。 自动数据录入: 在银行、保险、医疗等行业,OCR用于自动识别单据、发票、账单等内容,提高数据录入效率。 车牌识别: 在交通监控系统中,OCR技术用于自动识别车牌号码。 手写体识别: OCR不仅用于打印文本的识别,也可以扩展到手写体的识别,尽管手写体识别相对复杂。 图像中的文字提取: OCR还可以应用于从图像或照片中提取文本,常见于广告、宣传单、商品标签等场景。 OCR技术的演进 传统OCR:早期的OCR技术主要基于模板匹配和规则的方法,效果较为单一,识别准确度受限。 机器学习OCR:随着机器学习的进展,OCR开始采用训练模型来识别字符,通过大规模数据的训练,提高了对不同字体、语言和格式的适应能力。 深度学习OCR:近年来,深度学习(特别是卷积神经网络CNN和循环神经网络RNN)的发展,使得OCR技术大幅提升,尤其在手写体识别和多语言文本识别方面,表现得尤为出色。现代OCR系统能够处理更加复杂的文本图像,并且能够适应各种字体、噪声和变形情况。
1731图像处理自然语言处理
该项目基于pyTorch的深度学习API实现的一个U-Net的图像分割的深度学习框架。目前用于项目:穿越机的自主导航,作为其中的感知部分。获取穿越赛道门的像素坐标,从而进一步做位姿估计用于下一步的路径规划。该项目下一步使用MPC和DRL结合实现的路径规划方案。
1430深度学习图像分割1000.00元
AI数字人源文件源码
本数字人平台面向需要高度拟人化交互的企业和开发者,解决了当前市场上声音和视觉AI缺乏一致性与人性化的问题。通过这个平台,用户可以快速构建从声音克隆到数字人视频、再到拟人化AI角色的完整解决方案,极大提升了用户体验的真实感和互动性。 与市场上常规的数字人解决方案相比,本平台具有以下特点:首先,它整合了最新的声音克隆和数字人视频生成技术,确保了声音与形象的高度一致性。其次,平台支持创建具备个性化特征的AI角色(AIgent),这些角色不仅能模仿人类的声音和外貌,还能具备智能互动能力,提供更自然的用户体验。 在技术选型方面,本平台采用了业内领先的声音克隆技术、尖端的数字人视频生成工具,以及先进的AI模型,确保了平台的稳定性和性能。同时,我全程负责了从技术选型、编程开发到最终部署的每一个环节,确保了方案的高效落地。
2540深度学习人工智能5000.00元
皮肤癌分类预测源文件源码
代码实现了使用PyTorch进行深度学习模型的训练,包括数据预处理、模型构建、训练和验证。它支持分布式训练、多GPU并行计算,采用了EfficientNet、SEResNet等模型。代码还包含参数解析、学习率调度、模型保存等功能。同时,通过WandB进行训练日志记录和可视化。
2810深度学习python1000.00元
软件面对网页信息收集,使用反反爬虫技术,伪装成pc端手动访问。爬虫项目是一种自动化程序,用于从互联网上抓取和收集数据。这些数据可以来自各种网站,如新闻网站、社交媒体、电子商务平台等。爬虫项目通常使用编程技术来模拟人类浏览器行为,访问网页并提取所需信息,如文本、图片、链接等。其主要功能包括数据采集、信息监控、搜索引擎优化(SEO)以及大数据分析等。爬虫项目的设计涵盖了数据处理和存储,同时需要考虑网站的爬取规则和伦理道德问题,确保遵守相关法律和条例。
1810机器视觉python
图像分割,使用上下采样构建模型,用三重损失指引模型梯度下降,用到的技术有cnn,残差网络,se模块,逐点卷积切换通道的技术,关键在于特征提取,牙齿属于精细化的输出,不是仅仅iou,dice高,能够看到分割的细节,彩色 图的分割,属于分割前景和背景,能够相当好的区分前景和背景
1410图像处理图形/图像处理
基于robomaster机甲大师; 为个人视觉组初稿,仍有较多问题,远不及开源的大佬所作,但文本通俗易懂,为初学者提供入门思路; 代码注释行也会有相应讲解,非技术人员可以跳过; 部分技术可在博主其他博文中略知一二; 本算法最终测试帧率在150帧左右(单线程);
5101机器视觉
当前共10个项目more
×
寻找源码
源码描述
联系方式
提交