OFA-视觉定位(英文) 视觉定位是什么? 如果你想找出某个物体在图片上的位置,你只需要输入对这个物体的描述,比如“a blue turtle-like pokemon with round head
860pytorchmulti-modal
风格迁移介绍 给定内容图像和风格图像作为输入,风格迁移模型会自动地将内容图像的风格、纹理特征变换为风格图像的类型,同时保证图像的内容特征不变 项目主页 模型描述 本模型将视觉注意力与图像风格迁移任务
1840tensorflowcv
GTE英文通用文本表示模型 文本表示是自然语言处理(NLP)领域的核心问题, 其在很多NLP、信息检索的下游任务中发挥着非常重要的作用。近几年, 随着深度学习的发展,尤其是预训练语言模型的出现极大的推
820pytorchnlp
>>返回卡通化系列模型专题页 DCT-Net人像卡通化-扩散模型-插画风 论文 | 项目主页 输入一张人物图像,实现端到端全图卡通化转换,生成插画风格虚拟形象,返回风格化后的结果图像。 其生成效果如下
1280tensorflowcv
NAFNet: Nonlinear Activation Free Network for Image Restoration 模型描述 NAFNet(Nonlinear Activation Fre
1220pytorchcv
Qwen-VL ? ?  | Qwen-VL-Chat ? ?  (Int4: ? ? ) | Qwen-VL-Plus ? ?  |
850pytorch
Stable Diffusion v2 for Image Inpainting 图像填充模型 该模型为图像填充模型,输入一个抹除部分内容的图像,实现端到端的图像填充,返回填充后的完整图像。 模型效果
550pytorchcv
BAStructBERT电商领域中文分词模型介绍 模型描述 电商领域的分词模型, 采用无监督统计特征增强的StructBERT-Lite+softmax序列标注模型,序列标注标签体系(B、I、E、S)
540pytorchnlp
BAStructBERT通用领域中文分词模型介绍 中文分词任务就是把连续的汉字分隔成具有语言语义学意义的词汇。中文的书写习惯不像英文等日耳曼语系语言词与词之前显式的用空格分隔。为了让计算机理解中文文本
440pytorchnlp
RANER介绍 模型描述 本方法采用Transformer-CRF模型,使用StructBERT作为预训练模型底座,结合使用外部工具召回的相关句子作为额外上下文,使用Multi-view Traini
610pytorchnlp
GLM-4-9B-Chat-1M Read this in English. 2024/07/24,我们发布了与长文本相关的最新技术解读,关注 这里 查看我们在训练 GLM-4-9B 开源模型中关于长
670glm
Qwen-7B-Chat-Int8 ? Hugging Face   |   ? ModelScope   |    ? Paper    |   ?️ Demo
310pytorchqwen
Baichuan 2 ?GitHub | ?WeChat ? 百川大模型在线对话平台 已正式向公众开放 ? 目录 ? 模型介绍 ⚙️ 快速开始 ? Benchmark评估 ?
790pytorch
SiameseAOE通用属性情感抽取介绍 SiameseAOE通用信息抽取模型,基于提示(Prompt)+文本(Text)的构建思路,利用指针网络(Pointer Network)实现片段抽取(Spa
600pytorchnlp
RANER介绍 模型描述 本方法采用Transformer-CRF模型,使用StructBERT作为预训练模型底座,结合使用外部工具召回的相关句子作为额外上下文,使用Multi-view Traini
580pytorchnlp
ERes2NetV2 说话人识别模型 ERes2NetV2模型是在ERes2Net的基础上,通过模型剪枝来减小冗余结构并增强短时说话人识别准确率。 模型简述 ERes2NetV2局部融合如下图黄色部分
1350pytorchaudio
Highlights Paraformer-large长音频模型集成VAD、ASR、标点与时间戳功能,可直接对时长为数小时音频进行识别,并输出带标点文字与时间戳: ASR模型:Paraformer-
1600pytorchaudio
vit-object-detection模型介绍 Exploring Plain Vision Transformer Backbones for Object Detection文章复现,采用COC
700pytorchcv
ChatGLM-6B模型介绍 ChatGLM-6B 是一个开源的、支持中英双语问答的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化
480pytorchnlp
OFA-文字识别 News 2023年1月: 优化了finetune流程,支持参数更新、自定义数据及脚本分布式训练等,见finetune示例。 2022年11月: 发布ModelScope 1.0版
1040pytorchmulti-modal
当前共162350个项目
×
寻找源码
源码描述
联系方式
提交