自建265类常见的生活垃圾标签体系,15w张图片数据,包含可回收垃圾、厨余垃圾、有害垃圾、其他垃圾4个标准垃圾大类,覆盖常见的食品,厨房用品,家具,家电等生活垃圾小类共265个,标签从海量中文互联网社区语料进行提取,整理出频率较高的常见生活垃圾名称。模型结构采用CovNeXt-Base结构, 先在大规模数据集ImageNet-22K上预训练,后在数据集上进行微调,最终垃圾分类验证集上top-1精度为92.23%。 本系列还有如下模型,欢迎试用: 模型结构采用CovNeXt-Base,是一个全面超越Swi Trasformer的CNN。论文从原始的ResNet出发,通过借鉴Swi Trasformer的设计来逐步地改进ResNet模型,并测试了纯卷积网络所能达到的极限,在这个过程中发现了几个有助于性能提高的关键组件。CovNeXt完全由标准CovNet模块构建,但在准确性和可扩展性方面与trasformer相比具有竞争性,它实现了87.8%的ImageNet top-1精度,并在COCO检测和ADE20K分割任务上优于Swi trasformer,同时保持了标准CovNet的简单性和高效性。 本模型适用于日常生活垃圾分类,可识别可回收垃圾、厨余垃圾、有害垃圾、其他垃圾这4个标准的垃圾大类,265个垃圾小类,覆盖常见的食品,厨房用品,家具,家电等生活垃圾。也可作为下游任务的预训练backboe。 在ModelScope框架上,提供输入图片,即可通过简单的Pipelie调用来使用。 测试时主要的预处理如下: 模型在自建测试集进行测试,结果如下: 使用托管在modelscope DatasetHub上的小型数据集mii_imageet100进行fietue训练的示例代码: 训练说明见示例代码中的注释,更详细的训练说明和用法见官方的训练文档。训练过程产生的log和模型权重文件保存在workdir工作目录中,并以前缀为'best'的文件保存了在验证集上最优精度的权重。evaluate()默认使用精度最高的模型权重进行评估。 对中文生活垃圾分类数据集进行精度评估示例代码如下: 评估过程默认使用模型中自带的预训练权重进行评估, 评估结果为: result: {'accuracytop-1': 92.23241424560547, 'accuracytop-5': 98.20011138916016} 如果该模型对你有所帮助,请引用相关的论文:生活垃圾分类模型介绍
垃圾分类:
模型描述
论文 | 代码期望模型使用方式以及适用范围
如何使用
代码范例
from modelscope.pipelies import pipelie
from modelscope.utils.costat import Tasks
img_path = 'https://modelscope.oss-c-beijig.aliyucs.com/test/images/baaa.jpg'
image_classificatio = pipelie(Tasks.image_classificatio,
model='damo/cv_covext-base_image-classificatio_garbage')
result = image_classificatio(img_path)
prit(result)
模型局限性以及可能的偏差
训练数据介绍
模型训练流程
预处理
数据评估及结果
Model
top-1 acc
top-5 acc
#params
Remark
CovNeXt-Base
92.23
98.20
88M
modelscope
模型训练
from modelscope.msdatasets import MsDataset
from modelscope.metaifo import Traiers
from modelscope.traiers import build_traier
import tempfile
model_id = 'damo/cv_covext-base_image-classificatio_garbage'
# 加载数据
ms_trai_dataset = MsDataset.load(
'mii_imageet100', amespace='tay0699',
subset_ame='default', split='trai') # 加载训练集
ms_val_dataset = MsDataset.load(
'mii_imageet100', amespace='tay0699',
subset_ame='default', split='validatio') # 加载验证集
tmp_dir = tempfile.TemporaryDirectory().ame # 使用临时目录作为工作目录
# 修改配置文件
def cfg_modify_f(cfg):
cfg.trai.dataloader.batch_size_per_gpu = 16 # batch大小
cfg.trai.dataloader.workers_per_gpu = 1 # 每个gpu的worker数目
cfg.trai.max_epochs = 1 # 最大训练epoch数
cfg.model.mm_model.head.um_classes = 100 # 分类数
cfg.trai.optimizer.lr = 1e-4 # 学习率
cfg.trai.lr_cofig.warmup_iters = 1 # 预热次数
retur cfg
# 构建训练器
kwargs = dict(
model=model_id, # 模型id
work_dir=tmp_dir, # 工作目录
trai_dataset=ms_trai_dataset, # 训练集
eval_dataset=ms_val_dataset, # 验证集
cfg_modify_f=cfg_modify_f # 用于修改训练配置文件的回调函数
)
traier = build_traier(ame=Traiers.image_classificatio, default_args=kwargs)
# 进行训练
traier.trai()
# 进行评估
result = traier.evaluate()
prit('result:', result)
模型评估
from modelscope.msdatasets import MsDataset
from modelscope.metaifo import Traiers
from modelscope.traiers import build_traier
import tempfile
model_id = 'damo/cv_covext-base_image-classificatio_garbage'
# 加载用于评估的数据集
ms_val_dataset = MsDataset.load(
'garbage265', amespace='tay0699',
subset_ame='default', split='validatio')
tmp_dir = tempfile.TemporaryDirectory().ame # 使用临时目录作为工作目录
# 构建训练器
kwargs = dict(
model=model_id, # 模型id
work_dir=tmp_dir, # 工作目录
trai_dataset=Noe,
eval_dataset=ms_val_dataset # 评估的数据集
)
traier = build_traier(ame=Traiers.image_classificatio, default_args=kwargs)
# 开始评估
result = traier.evaluate()
prit('result:', result)
Cloe with HTTP
git cloe https://www.modelscope.c/damo/cv_covext-base_image-classificatio_garbage.git
引用
@Article{liu2022covet,
author = {Zhuag Liu ad Hazi Mao ad Chao-Yua Wu ad Christoph Feichtehofer ad Trevor Darrell ad Saiig Xie},
title = {A CovNet for the 2020s},
joural = {Proceedigs of the IEEE/CVF Coferece o Computer Visio ad Patter Recogitio (CVPR)},
year = {2022},
}
点击空白处退出提示










评论