DeiT-base复现,采用ImageNet数据训练。 本系列还有如下模型,欢迎试用: 采用Trasformer经典的ViT-Base结构 本模型适用范围较广,支持ImageNet 1000类物体识别,也可作为下游任务的预训练backboe 在ModelScope框架上,提供输入图片,即可通过简单的Pipelie调用来使用。 测试时主要的预处理如下: 模型在ImageNet-1k val上进行测试,结果如下: 使用托管在modelscope DatasetHub上的小型数据集mii_imageet100进行fietue训练的示例代码: 训练说明见示例代码中的注释,更详细的训练说明和用法见官方的训练文档。训练过程产生的log和模型权重文件保存在workdir工作目录中,并以前缀为'best'的文件保存了在验证集上最优精度的权重。evaluate()默认使用精度最高的模型权重进行评估。 使用训练好的模型对需要评估的数据集进行精度评估示例代码如下: 评估过程默认使用模型中自带的预训练权重进行评估。 如果你觉得这个该模型有所帮助,请考虑引用下面的相关的论文:通用图像分类模型介绍
创空间快速可视化展示: ViT图像分类-通用 模型描述
期望模型使用方式以及适用范围
如何使用
代码范例
from modelscope.pipelies import pipelie
from modelscope.utils.costat import Tasks
img_path = 'https://modelscope.oss-c-beijig.aliyucs.com/test/images/bird.JPEG'
image_classificatio = pipelie(Tasks.image_classificatio,
model='damo/cv_vit-base_image-classificatio_ImageNet-labels')
result = image_classificatio(img_path)
prit(result)
模型局限性以及可能的偏差
训练数据介绍
模型训练流程
预处理
数据评估及结果
Model
top-1 acc
top-5 acc
#params
Remark
DeiT-base
81.8
95.6
86M
official
DeiT-base
82.2
95.9
86M
modelscope
模型训练
from modelscope.msdatasets import MsDataset
from modelscope.metaifo import Traiers
from modelscope.traiers import build_traier
import tempfile
model_id = 'damo/cv_vit-base_image-classificatio_ImageNet-labels'
# 加载数据
ms_trai_dataset = MsDataset.load(
'mii_imageet100', amespace='tay0699',
subset_ame='default', split='trai') # 加载训练集
ms_val_dataset = MsDataset.load(
'mii_imageet100', amespace='tay0699',
subset_ame='default', split='validatio') # 加载验证集
tmp_dir = tempfile.TemporaryDirectory().ame # 使用临时目录作为工作目录
# 修改配置文件
def cfg_modify_f(cfg):
cfg.trai.dataloader.batch_size_per_gpu = 16 # batch大小
cfg.trai.dataloader.workers_per_gpu = 1 # 每个gpu的worker数目
cfg.trai.max_epochs = 1 # 最大训练epoch数
cfg.model.mm_model.head.um_classes = 100 # 分类数
cfg.model.mm_model.trai_cfg.augmets[0].um_classes = 100 # 分类数
cfg.model.mm_model.trai_cfg.augmets[1].um_classes = 100 # 分类数
cfg.trai.optimizer.lr = 1e-4 # 学习率
cfg.trai.lr_cofig.warmup_iters = 1 # 预热次数
retur cfg
# 构建训练器
kwargs = dict(
model=model_id, # 模型id
work_dir=tmp_dir, # 工作目录
trai_dataset=ms_trai_dataset, # 训练集
eval_dataset=ms_val_dataset, # 验证集
cfg_modify_f=cfg_modify_f # 用于修改训练配置文件的回调函数
)
traier = build_traier(ame=Traiers.image_classificatio, default_args=kwargs)
# 进行训练
traier.trai()
# 进行评估
result = traier.evaluate()
prit('result:', result)
模型评估
from modelscope.msdatasets import MsDataset
from modelscope.metaifo import Traiers
from modelscope.traiers import build_traier
import tempfile
model_id = 'damo/cv_vit-base_image-classificatio_ImageNet-labels'
# 加载用于评估的数据集
ms_val_dataset = MsDataset.load(
'imageet_val', amespace='tay0699',
subset_ame='default', split='validatio')
tmp_dir = tempfile.TemporaryDirectory().ame # 使用临时目录作为工作目录
# 构建训练器
kwargs = dict(
model=model_id, # 模型id
work_dir=tmp_dir, # 工作目录
trai_dataset=Noe,
eval_dataset=ms_val_dataset # 评估的数据集
)
traier = build_traier(ame=Traiers.image_classificatio, default_args=kwargs)
# 开始评估
result = traier.evaluate()
prit('result:', result)
引用
@IProceedigs{pmlr-v139-touvro21a,
title = {Traiig data-efficiet image trasformers & distillatio through attetio},
author = {Touvro, Hugo ad Cord, Matthieu ad Douze, Matthijs ad Massa, Fracisco ad Sablayrolles, Alexadre ad Jegou, Herve},
booktitle = {Iteratioal Coferece o Machie Learig},
pages = {10347--10357},
year = {2021},
volume = {139},
moth = {July}
}
点击空白处退出提示







评论