cv_quadtree_attention_image-matching_outdoor

我要开发同款
匿名用户2024年07月31日
29阅读
所属分类aipytorch、3D vision、image matching、XR、Alibaba、cv
开源地址https://modelscope.cn/models/iic/cv_quadtree_attention_image-matching_outdoor
授权协议Apache License 2.0

作品详情

图像匹配算法介绍

任务

输入一对图片,图像匹配算法将输出图片间对应像素的位置。

模型描述

本模型基于QuadTree Attention for Vision Transformers算法,是该算法的官方模型。

技术细节请见:

QuadTree Attention for Vision Transformers
Shitao Tang, Jiahui Zhang, Siyu Zhu and Ping Tan
ICLR 2022
[Paper] | [中文解读]

  

如何使用

代码示例(详见tests/pipelines/testimagematching.py)

from modelscope.outputs import OutputKeys
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks


task = 'image-matching'
model_id = 'damo/cv_quadtree_attention_image-matching_outdoor'

input_location = [
                    ['https://modelscope.oss-cn-beijing.aliyuncs.com/test/images/image_matching1.jpg',
                    'https://modelscope.oss-cn-beijing.aliyuncs.com/test/images/image_matching2.jpg']
                ]
estimator = pipeline(Tasks.image_matching, model=model_id)
result = estimator(input_location)
kpts0, kpts1, conf = result[0][OutputKeys.MATCHES]
print(f'Found {len(kpts0)} matches')

模型精度

在ScanNet及MegaDepth上的结果为

Method AUC@5 AUC@10 AUC@20
ScanNet 24.9 44.7 61.8
Megadepth 53.5 70.2 82.2

更多结果

QuadTreeAttention是通用的transformer build block, 对于图像分类、检测、分割、双目深度估计等任务均适用。

本仓库目前仅包含图像匹配的室外模型(室内数据也可使用本模型),要使用更多模型可见此处

Bibtex

@article{tang2022quadtree,
  title={QuadTree Attention for Vision Transformers},
  author={Tang, Shitao and Zhang, Jiahui and Zhu, Siyu and Tan, Ping},
  journal={ICLR},
  year={2022}
}
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论