图像分类

OFA-图片分类 (ImageNet-1K) ImageNet-1K图片分类 ImageNet-1K图片分类任务:给定一张图片,要求模型从1K个候选类别中正确给出图片分类标签。 快速玩起来 玩转OFA
1780pytorchmulti-modal
基于深度学习算法的图像数据分割、图像分类预测、图像目标检测,数据挖掘比赛top20选手、深度学习、机器学习爱好者
2060python机器学习
大学生期末大作业,要求完成图像分类任务,用户可输入手写图像,程序会输出对应数字,我仅需负责代码部分并做出相应标注,教导用户每一步代码原理 应用卷积神经网络,项目可对0到9的数字进行识别并分类
1660图像识别图像分类
【描述】本工程是深度学习在计算机视觉图像分类方面的应用,基于 Vision Transformer 架构(Vit),采用的 Kaggle X光胸片数据集,共4个分类,7,100多张图片,数据集压缩包占用1.8GB 的磁盘空间,该数据集 Kaggle 持续在更新中。 【项目源码】https://github.com/tgltt/ChestXRayVit 【技术】Transformer、VisionTransformer(ViT)、Pytorch等 【职责】 1、阅读 Transformer、VisionTransformer(ViT )相关论文,制定模改方案; 2、数据探索,浏览数据集,并根据数据集特点,确定 ViT 输入图像的尺寸及 Transformer 输入数据的 embedding 大小; 3、数据预处理,删除无效图片(不支持的格式及过大分辨率的图像),统计训练集均值及标准差,随后使用随机策略裁减原图、颜色抖动、随机水平镜像、缩放、转 Tensor 、标准化等预处理对图像数据进行增强; 4、模型改造,裁减 Transformer 模型,只保留其 Encoder 提取图像特征,然后使用 ViT 将图片切碎(Patch),并将每个 碎片 Flatten 后导入 Transformer的 Encoder ,经 Encoder 提取特征后,最后经由一个 Linear 作分类,损失函数采用交叉熵; 4、模型训练,使用 Adam 优化策略训练模型; 5、模型评估,监控模型损失函数的下降过程,及横向和纵向比较训练集准确率、验证集准确率及测试集准确率; 6、 模型调优,根据训练情况,调整 Adam 参数、训练集批量大小、ViT 输入图像的尺寸及 Transformer 输入数据的 embedding 大小等,以提高模型性能。
4430java计算机视觉
基于resnet50深度学习网络,实现对花数据集的分类,准确率达到98%,对将来各种问题的研究提供了一定的帮助,比如说杂草问题的研究等
3840人工智能
使用Python深度学习API框架keras 构建卷积神经网络进行图像分类,基于卷积神经网络,代码简单易懂,是进入计算机视觉领域学习的绝佳项目。
3010AI
当前共6个项目more
×
寻找源码
源码描述
联系方式
提交