coROM英文通用文本表示模型 文本表示是自然语言处理(NLP)领域的核心问题, 其在很多NLP、信息检索的下游任务中发挥着非常重要的作用。近几年, 随着深度学习的发展,尤其是预训练语言模型的出现极大
350pytorchnlp
语音唤醒模型介绍 模型描述   移动端语音多命令词模型,我们根据以往项目积累,挑选了多个场景常用命令词数据进行模型迭代,所得单一模型支持30+关键词的快速检测:     主唤醒词:小云小云,你好小云
1620pytorchaudio
纠错模型介绍 文本纠错任务检测并纠正句子中存在的拼写、语法、语义等错误,在搜索,写作办公、教育等场景具有重要意义。文书校对评测任务应用纠错技术以辅助司法人员自动检出并纠正法律文书中存在的错误,涵盖了法
510pytorchnlp
Sambert-Hifigan模型介绍 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用,故此处仅涉及参数法。 参数TTS系统可分为两
540pytorchaudio
日常物体识别模型介绍 自建1300类常见物体标签体系,覆盖常见的日用品,动物,植物,家具,设备,食物等物体,标签从海量中文互联网社区语料进行提取,保留了出现频率较高的常见物体名称。模型结构采用基于Tr
430pytorchcv
文本指导的分割模型 此模型在文本分割数据集上进行训练,根据文本将图像中对应文本描述的物体分割出来。 模型在fss1000通用分割数据测试集上进行了zero shot测试。 模型结构信息 模型结构
290pytorchcv
OFA-视觉定位(英文) 视觉定位是什么? 如果你想找出某个物体在图片上的位置,你只需要输入对这个物体的描述,比如“a blue turtle-like pokemon with round head
280pytorchmulti-modal
生成式多模态表征模型GEMM GEMM是在4亿公开英文图文数据训练的多模态模型。视觉encoder采用vit-large-patch14结构,文本encoder采用bert-base结构。 模型在图像
580pytorchmulti-modal
图像超分辨率介绍 输入低分辨率图片,返回4倍超分辨率后的高清晰图片。模型基于RealESRAGN中的降质方式进行训练,在复杂真实降质图片上也有较好的表现。 模型描述 RealESRGAN提出了通过多次
390pytorchcv
Segformer-B5语义分割模型介绍 其它相关模型体验Mask2Former-R50全景分割 模型描述 Neurips2021文章SegFormer: Simple and Efficient
550pytorchcv
UniASR 模型介绍 FunASR开源项目介绍 FunASR希望在语音识别的学术研究和工业应用之间架起一座桥梁。通过发布工业级语音识别模型的训练和微调,研究人员和开发人员可以更方便地进行语音识别模型
450pytorchaudio
[?Homepage] | [? Chat with DeepSeek LLM] | [Discord] | [Wechat(微信)] Paper Link?️ 1. Intr
400pytorch
基于SRResNet改进的轻量级视频超分模型 模型描述 本模型以SRResNet为基础网络,参考EDSR方式对模型结构进行改进,使用前降采样模块降低特征图分辨率,用堆叠残差模块提取特征,最后使用两次p
450pytorchcv
快速传送 点我试用训练好的门址地址要素解析模型 点我试用训练好的地理实体对齐模型 点我试用训练好的Query-POI相关性排序 点我试用训练好的地址Query成分分析模型 点我试用训练好的Where
700pytorchmulti-modal
res2net-camouflaged-detection 模型介绍 给定一张输入图像,找出图中的伪装色目标,并输出视觉显著注意力图。 期望模型使用方式与适用范围 本模型是针对伪装色目标(颜色、纹
390pytorchcv
RANER介绍 What's New 2022年12月: 训练所使用的序列理解统一框架AdaSeq发布,提供30+ SOTA的复现代码! RaNER家族模型均可在链接进行访问!所使用的NER数据集均
290pytorchnlp
RANER介绍 模型描述 本方法采用Transformer-CRF模型,使用StructBERT作为预训练模型底座,结合使用外部工具召回的相关句子作为额外上下文,使用Multi-view Traini
420pytorchnlp
Stable Diffusion v1-5 Model Card Stable Diffusion is a latent text-to-image diffusion model capable
370pytorchmm
Highlights 说话人确认和声纹提取模型,训练数据集 英文数据集 Switchboard, Callhome 支持功能: 提取一段语音的说话人嵌入码 speaker embedding 说
530pytorchaudio
LongShortNet 模型介绍 任务说明 本模型所述的任务为流感知(Streaming Perception)任务,该任务为视频目标检测(Video Object Detection, VOD)
360pytorchcv
当前共161944个项目
×
寻找源码
源码描述
联系方式
提交