图像处理

本项目是一个面向计算机视觉领域的算法库,聚焦于图像分类任务,旨在为科研开发者提供简洁、可复用的模型实现与实验基础。其主要功能模块包括:核心模型集:提供多种经典卷积神经网络实现,包括LeNet、AlexNet、VGG、GoogLeNet、ResNet、Inception系列、DenseNet等,涵盖从
2220Python人工智能
?智能监控三区域监控:支持同时监控3个屏幕区域(Boss血量、技能读条、技能喊话)实时OCR识别:使用PaddleOCR进行高精度中文文本识别规则匹配:支持自定义监控规则,精确匹配关键文本?语音播报EdgeTTS:使用微软EdgeTTS引擎,支持多种中文语音智能缓存:自动生成和缓存音频文件,提高响应
960Python人工智能
Ace-Translate开源项目
1.在信息全球化的今天,语言跨越不再成为障碍是每个跨文化交流者的梦想。因此,我们为您隆重推荐【Ace-Translate】——一款突破性的本地离线翻译工具,为您的学习、工作与生活带来前所未有的便利。 2.这款翻译工具的特色是支持多种翻译场景分别有:文本翻译,划词翻译,截图翻译,视频翻译,文件翻译,包,TXT文件、Excel、PPT、PDF、图片和Word,文档图片翻译。 3.在开源项目地址中有上手的教程
2120图像处理人工智能
最早一批的Comfyui插件作者 A100训练过大语言模型,对语言模型数据处理、训练有一定的了解 训练图像模型,在sd模型civitai上有发布有、comfyui插件作者。与达摩院合作开发开源项目 facechain Agent方面:langchain-chatchat贡献者,熟悉langchain、eliza开源项目贡献者
1590图像处理人工智能
1. 解决了术前术后ct配准的问题 2. 使用分割算法和点云配准 3. 使用:1.准备ct数据;2.准备cbct数据。3.运行Main.cpp。即可得到骨头的分割结果。然后调用regist函数进行配准即可。
1830深度学习人工智能
本方案面向企业级客户,解决他们在实际业务中对图像处理的需求,如产品缺陷检测、医疗影像分析等。 【50%】相比于市场常规方案,本方案具有以下特点: 高精度:采用先进的深度学习模型,如YOLO(You Only Look Once)和Transformer变体(DINO等),在物体检测和图像分割任务上表现出色。 快速响应:通过优化算法和硬件配置,实现快速实时处理大量图像数据,满足工业生产线上高效率的要求。 灵活定制:可根据客户需求进行个性化定制,包括但不限于特定场景下的目标检测、多类别的图像分类等。 可扩展性:支持模块化设计,方便后续功能升级或与其他系统集成。 【20%】方案的产品组成和技术选型: 数据采集:使用高清摄像头或其他传感器设备获取原始图像数据。 前端处理:利用GPU加速计算平台进行实时预处理,如图像缩放、色彩转换等。 模型训练:基于TensorFlow或PyTorch等深度学习框架构建YOLOv5或ViT(Vision Transformer)模型,并在标注好的数据集上进行训练。 后端应用:将训练好的模型部署到服务器或边缘计算设备上,实现实时图像处理与分析。 用户界面:提供可视化操作界面,便于用户查看处理结果并进行参数调整。 总之,该方案结合了前沿的计算机视觉技术与灵活的定制能力,旨在为企业客户提供高效、精准的图像处理解决方案。
1790深度学习人工智能
该科研项目提出并且通过实验证实了一种通过向Stable Diffusion模型增加一个基于CNN特征提取网络的人物形象编码器来实现让Stable Diffusion在生成模型未见过的形象时可以不需要额外训练或者微调主模型或者Lora模型。 文中提出了三种技术路线,最终在其中一种技术路线中成功实践并且在较少数据集上得出了有效的结果,证明了技术路线的可行性。 论文摘要: The current state-of-the-art Diffusion model has demonstrated excellent results in generating images. However, the images are monotonous and are mostly the result of the distribution of images of people in the training set, making it challenging to generate multiple images for a fixed number of individuals. This problem can often only be solved by fine-tuning the training of the model. This means that each individual/animated character image must be trained if it is to be drawn, and the hardware and cost of this training is often beyond the reach of the average user, who accounts for the largest number of people. To solve this problem, the Character Image Feature Encoder model proposed in this paper enables the user to use the process by simply providing a picture of the character to make the image of the character in the generated image match the expectation. In addition, various details can be adjusted during the process using prompts. Unlike traditional Image-to-Image models, the Character Image Feature Encoder extracts only the relevant image features, rather than information about the model's composition or movements. In addition, the Character Image Feature Encoder can be adapted to different models after training. The proposed model can be conveniently incorporated into the Stable Diffusion generation process without modifying the model's ontology or used in combination with Stable Diffusion as a joint model.
1920python人工智能
使用Pytorch基于Unet通过当前云图进行对全球范围内未来三小时内的全球降水量实施预测 目前,气象学中的许多传统降水预测方法都需要输入多种类型的数据作为参数。本研究旨在探索如何利用深度学习技术,仅使用输入的云图进行降水预测。本文建立了利用 U-Net 通过云图数据预测降水的技术路线,并进行了实验。利用 U-Net 成功训练并预测了降雨模型。
1760python人工智能
1. 本项目解决问题:准确重建具有复杂表面结构的 3D 点云模型。 2. 本项目采用基于编码器解码器架构的单幅图像三维重建方法实现,首先实现从图像到稀疏点云,然后实现从稀疏点云到密集点云重建,从而实现对复杂表面结构物体3D模型重建。 3. 结合论文和源代码(论文可私信)。
2000深度学习人工智能
AI网站开源项目
运用和gpt一样的逻辑设计的,模块化的小功能会多一点,能AI绘图以及声音处理等小组件 能做简单的视频处理,包括但不限于处理帧数以及画面清晰 也可以训练AI模型,可以随意切换语言大模型,内置gpt4o以及3.5以上语言模型,用户可以根据自己的需求进行购买 当然运用他的组件模型也可以在pdf上面可以帮助用户做一些需求
2491服务器测试人工智能
应用场景:针对建筑工人的安全帽与反光马甲检测,预防安全事故发生。 1. 训练数据收集与整理; 2. 使用LabelMe进行数据标注; 3. 改进YOLO算法,算法评估与优化; 4. 使用Flask框架进行后端开发 5. 运行环境:NVIDIA Jetson TX2
3960C/C++人工智能
本项目开发一个书籍自动翻译器,该翻译器能够对pdf或word格式的文档进行自动翻译成中文,并输出为pdf或markdown格式的文件。 该工具使用了大语言模型LLMs(GPT-4o等),可以根据配置文件选用不同的大模型 主要开发语言为Python,该项目是模块化的,并且面向对象的设计,易于定制或拓展
3520深度学习人工智能
由于之前一直在公司工作,很多项目无法截图,这边写上自己个人技能: 独立开发过CV/NLP/机器学习项目,具备独立解决问题的能力。 精通医疗/通用场景图像分类、检测、信息抽取、OCR及一维信号分类。 自学能力强,能够快速学习、掌握新技术和工具,持续跟踪业内最新技术进展(AIGC、LLM)。 熟悉BERT相关预训练模型的使用及其NLU任务定制等通用NLP技术及LLM大模型的微调。 在天池CBLUE医疗信息大数据比赛中排名第27名,KAGGLE毒性评论打分比赛获得银牌。 熟练使用PYTHON开发,熟悉C、MATLAB。
2330深度学习人工智能
该项目纯自己手写,无复用其他GitHub。 该GitHub使用C++算法对yolo算法进行改写,此外还做了一些推理加速,减少使用内存的操作。
3540C/C++图形和图像工具
网站地址:www.zhiyangroup.com 该网站展示了之前我们做过的一些能力,目前还在做一些新的技术,包括深度学习算法部署、AIGC等。
2410flask图形/图像处理
1.懂目标检测,语义分割,物体分类的基本范式代码实现,pytorch框架为基础的深度学习代码调试,复现,改进;目标检测的yolo,fasterrcnn,detr等算法 2.进阶框架openmmlab系列,包括mmdetection,mmseg,mmcls,mmfewshot熟练使用和实现想法;yolo官方代码库ultralytics的熟练使用和实现想法;paddlepaddle的基础使用(熟练待学); 3.还在自学大模型相关知识和java全套 4.语言:python,java,c++
1141深度学习目标检测
当前共16个项目more
×
寻找源码
源码描述
联系方式
提交