X光胸片肺部疾病检测项目

我要开发同款
tanguilong10252023年11月13日
72阅读
开发技术javascriptcss、html5、java
所属分类图像分类、AI、ViT、Transformer、计算机视觉
作品源文件
zip格式 4.17 MB
¥免费

作品详情

【描述】本工程是深度学习在计算机视觉图像分类方面的应用,基于 Vision Transformer 架构(Vit),采用的 Kaggle X光胸片数据集,共4个分类,7,100多张图片,数据集压缩包占用1.8GB 的磁盘空间,该数据集 Kaggle 持续在更新中。【项目源码】https://github.com/tgltt/ChestXRayVit【技术】Transformer、VisionTransformer(ViT)、Pytorch等【职责】1、阅读 Transformer、VisionTransformer(ViT )相关论文,制定模改方案;2、数据探索,浏览数据集,并根据数据集特点,确定 ViT 输入图像的尺寸及 Transformer 输入数据的 embedding 大小;3、数据预处理,删除无效图片(不支持的格式及过大分辨率的图像),统计训练集均值及标准差,随后使用随机策略裁减原图、颜色抖动、随机水平镜像、缩放、转 Tensor 、标准化等预处理对图像数据进行增强;4、模型改造,裁减 Transformer 模型,只保留其 Encoder 提取图像特征,然后使用 ViT 将图片切碎(Patch),并将每个碎片 Flatten 后导入 Transformer的 Encoder ,经 Encoder 提取特征后,最后经由一个 Linear 作分类,损失函数采用交叉熵;4、模型训练,使用 Adam 优化策略训练模型;5、模型评估,监控模型损失函数的下降过程,及横向和纵向比较训练集准确率、验证集准确率及测试集准确率;6、 模型调优,根据训练情况,调整 Adam 参数、训练集批量大小、ViT 输入图像的尺寸及 Transformer 输入数据的 embedding 大小等,以提高模型性能。
查看全文
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论