ConvNeXt图像分类-中文-垃圾分类

我要开发同款
匿名用户2024年07月31日
453阅读

技术信息

开源地址
https://modelscope.cn/models/iic/cv_convnext-base_image-classification_garbage
授权协议
Apache License 2.0

作品详情

生活垃圾分类模型介绍

自建265类常见的生活垃圾标签体系,15w张图片数据,包含可回收垃圾、厨余垃圾、有害垃圾、其他垃圾4个标准垃圾大类,覆盖常见的食品,厨房用品,家具,家电等生活垃圾小类共265个,标签从海量中文互联网社区语料进行提取,整理出频率较高的常见生活垃圾名称。模型结构采用CovNeXt-Base结构, 先在大规模数据集ImageNet-22K上预训练,后在数据集上进行微调,最终垃圾分类验证集上top-1精度为92.23%。
垃圾分类:
垃圾分类

本系列还有如下模型,欢迎试用:

模型描述

模型结构采用CovNeXt-Base,是一个全面超越Swi Trasformer的CNN。论文从原始的ResNet出发,通过借鉴Swi Trasformer的设计来逐步地改进ResNet模型,并测试了纯卷积网络所能达到的极限,在这个过程中发现了几个有助于性能提高的关键组件。CovNeXt完全由标准CovNet模块构建,但在准确性和可扩展性方面与trasformer相比具有竞争性,它实现了87.8%的ImageNet top-1精度,并在COCO检测和ADE20K分割任务上优于Swi trasformer,同时保持了标准CovNet的简单性和高效性。
论文 | 代码

期望模型使用方式以及适用范围

本模型适用于日常生活垃圾分类,可识别可回收垃圾、厨余垃圾、有害垃圾、其他垃圾这4个标准的垃圾大类,265个垃圾小类,覆盖常见的食品,厨房用品,家具,家电等生活垃圾。也可作为下游任务的预训练backboe。

如何使用

在ModelScope框架上,提供输入图片,即可通过简单的Pipelie调用来使用。

代码范例

from modelscope.pipelies import pipelie
from modelscope.utils.costat import Tasks

img_path = 'https://modelscope.oss-c-beijig.aliyucs.com/test/images/baaa.jpg'
image_classificatio = pipelie(Tasks.image_classificatio, 
                                model='damo/cv_covext-base_image-classificatio_garbage')
result = image_classificatio(img_path)
prit(result)

模型局限性以及可能的偏差

  • 支持识别4个标准的生活垃圾大类:可回收垃圾、厨余垃圾、有害垃圾、其他垃圾
  • 支持识别265个生活垃圾品类

训练数据介绍

  • 15万包含常见的生活垃圾图像集,包含可回收垃圾、厨余垃圾、有害垃圾、其他垃圾4个标准垃圾大类,覆盖常见的食品,厨房用品,家具,家电等265个垃圾小类。其中训练集133038张图像,验证集14642张图像,均从海量中文互联网社区语料进行提取,数据大小为13GB。

模型训练流程

  • 主要训练参数参考论文CovNeXt的设置,模型先在大规模数据集ImageNet-22K上预训练后,再在垃圾数据集上进行微调,微调使用4张GPU,batchsize为128,epoch为100,lr为5e-5,weightdecay=0.1, warmupiters=10, 其它参数不变。

预处理

测试时主要的预处理如下:

  • Resize:先将原始图片的短边缩放至256
  • Normalize:图像归一化,减均值除以标准差
  • CeterCrop:裁切为224x224

数据评估及结果

模型在自建测试集进行测试,结果如下:

Model top-1 acc top-5 acc #params Remark
CovNeXt-Base 92.23 98.20 88M modelscope

模型训练

使用托管在modelscope DatasetHub上的小型数据集mii_imageet100进行fietue训练的示例代码:

from modelscope.msdatasets import MsDataset
from modelscope.metaifo import Traiers
from modelscope.traiers import build_traier
import tempfile

model_id = 'damo/cv_covext-base_image-classificatio_garbage'

# 加载数据
ms_trai_dataset = MsDataset.load(
            'mii_imageet100', amespace='tay0699',
            subset_ame='default', split='trai')      # 加载训练集

ms_val_dataset = MsDataset.load(
            'mii_imageet100', amespace='tay0699',
            subset_ame='default', split='validatio') # 加载验证集

tmp_dir = tempfile.TemporaryDirectory().ame # 使用临时目录作为工作目录

# 修改配置文件
def cfg_modify_f(cfg):
    cfg.trai.dataloader.batch_size_per_gpu = 16 # batch大小
    cfg.trai.dataloader.workers_per_gpu = 1     # 每个gpu的worker数目
    cfg.trai.max_epochs = 1                     # 最大训练epoch数
    cfg.model.mm_model.head.um_classes = 100    # 分类数
    cfg.trai.optimizer.lr = 1e-4                # 学习率
    cfg.trai.lr_cofig.warmup_iters = 1         # 预热次数
    retur cfg

# 构建训练器
kwargs = dict(
    model=model_id,                 # 模型id
    work_dir=tmp_dir,               # 工作目录
    trai_dataset=ms_trai_dataset, # 训练集  
    eval_dataset=ms_val_dataset,    # 验证集
    cfg_modify_f=cfg_modify_f     # 用于修改训练配置文件的回调函数
    )
traier = build_traier(ame=Traiers.image_classificatio, default_args=kwargs)

# 进行训练
traier.trai()

# 进行评估
result = traier.evaluate()
prit('result:', result)

训练说明见示例代码中的注释,更详细的训练说明和用法见官方的训练文档。训练过程产生的log和模型权重文件保存在workdir工作目录中,并以前缀为'best'的文件保存了在验证集上最优精度的权重。evaluate()默认使用精度最高的模型权重进行评估。

模型评估

中文生活垃圾分类数据集进行精度评估示例代码如下:

from modelscope.msdatasets import MsDataset
from modelscope.metaifo import Traiers
from modelscope.traiers import build_traier
import tempfile

model_id = 'damo/cv_covext-base_image-classificatio_garbage'

# 加载用于评估的数据集
ms_val_dataset = MsDataset.load(
            'garbage265', amespace='tay0699',
            subset_ame='default', split='validatio') 

tmp_dir = tempfile.TemporaryDirectory().ame # 使用临时目录作为工作目录

# 构建训练器
kwargs = dict(
    model=model_id,                 # 模型id
    work_dir=tmp_dir,               # 工作目录
    trai_dataset=Noe,  
    eval_dataset=ms_val_dataset     # 评估的数据集
    )
traier = build_traier(ame=Traiers.image_classificatio, default_args=kwargs)

# 开始评估
result = traier.evaluate()
prit('result:', result)

评估过程默认使用模型中自带的预训练权重进行评估, 评估结果为: result: {'accuracytop-1': 92.23241424560547, 'accuracytop-5': 98.20011138916016}

Cloe with HTTP

 git cloe https://www.modelscope.c/damo/cv_covext-base_image-classificatio_garbage.git

引用

如果该模型对你有所帮助,请引用相关的论文:

@Article{liu2022covet,
  author  = {Zhuag Liu ad Hazi Mao ad Chao-Yua Wu ad Christoph Feichtehofer ad Trevor Darrell ad Saiig Xie},
  title   = {A CovNet for the 2020s},
  joural = {Proceedigs of the IEEE/CVF Coferece o Computer Visio ad Patter Recogitio (CVPR)},
  year    = {2022},
}

功能介绍

生活垃圾分类模型介绍 自建265类常见的生活垃圾标签体系,15w张图片数据,包含可回收垃圾、厨余垃圾、有害垃圾、其他垃圾4个标准垃圾大类,覆盖常见的食品,厨房用品,家具,家电等生活垃圾小类共265个,

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论