17点人体关键点检测模型 输入一张人物图像,实现端到端的人体关键点检测,输出视频中每一帧图像人体的17点人体3D关键点坐标。 17点人体关键点 3D人体关键点系列模型 HDForm
390pytorchcv
UniASR 模型介绍 模型描述 UniASR 模型是一种2遍刷新模型(Two pass)端到端语音识别模型。日益丰富的业务需求,不仅要求识别效果精度高,而且要求能够实时地进行语音识别。一方面,离线语
540pytorchaudio
UniASR 模型介绍 模型描述 UniASR 模型是一种2遍刷新模型(Two pass)端到端语音识别模型。日益丰富的业务需求,不仅要求识别效果精度高,而且要求能够实时地进行语音识别。一方面,离线语
490pytorchaudio
商品图像特征模型介绍 本模型是对商品图像进行表征向量提取,用户可基于表征向量进行大规模的同款/相似款商品搜索;无需额外输入,模型可自动进行箱包商品的主体抠图,并基于主体提取结果完成表征向量提取。 模型
270pytorchcv
English  |   中文 Building the Next Generation of Open-Source and
320
English  |   中文 Building the Next Generation of Open-Source and
390
Vicuna Model Card Model Details Vicuna is a chat assistant trained by fine-tuning Llama 2 on user-sh
420pytorch
Chat & support: TheBloke's Discord server Want to contribute? TheBloke's Patreon p
270llama-2
ChatGLM-6B-Int4模型介绍 ChatGLM-6B 是一个开源的、支持中英双语问答的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结
460pytorchnlp
语音唤醒模型介绍 模型描述   移动端语音唤醒模型,检测关键词为"Yes/No/Up/Down/Left/Right/On/Off/Stop/Go"10个英文单词。   模型网络结构继承自论文《Com
390pytorchaudio
单目标跟踪算法模型介绍 对于一个输入视频,只需在第一帧图像中用矩形框指定待跟踪目标,单目跟踪算法将在整个视频帧中持续跟踪该目标,输出跟踪目标在所有图像帧中的矩形框信息。 模型描述 本模型是基于OST
560pytorchcv
Sambert-Hifigan模型介绍 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用,故此处仅涉及参数法。 参数TTS系统可分为两
570pytorchaudio
模型背景 2018年,Bert等预训练语言模型的出现,给NLP下游任务带来了普遍的效果提升,成为NLP的一个重要里程碑,但这些预训练语言模型并没有反映对话的特点,比如分角色、多轮次、知识约束、讲对话策
420pytorchnlp
RANER介绍 模型描述 本方法采用Transformer-CRF模型,使用XLM-Roberta作为预训练模型底座,结合使用外部工具召回的相关句子作为额外上下文,使用Multi-view Train
280pytorchnlp
模型描述 这里我们提供基于业界领先的目标检测框架DAMO-YOLO训练的检测模型:DAMO-YOLO-M。DAMO-YOLO是一个面向工业落地的目标检测框架,兼顾模型速度与精度,其训练的模型效果超越了
310pytorchcv
视频摘要 输入一段长视频和一段文字描述,算法根据用户输入的文字对输入视频中的相关片段进行自适应的视频摘要,根据帧号可以合成一段短视频(摘要视频)。 模型结构: 如上图所示,用户输入的文字使
250pytorchcv
RANER介绍 模型描述 该模型是基于检索增强(RaNer)方法在俄语数据集MultiCoNER-RU-Russian训练的模型。 本方法采用Transformer-CRF模型,使用XLM-RoBER
290pytorchnlp
RANER介绍 模型描述 该模型是基于检索增强(RaNer)方法在孟加拉语数据集MultiCoNER-BN-Bangla训练的模型。 本方法采用Transformer-CRF模型,使用XLM-RoBE
290pytorchnlp
Segformer-B1语义分割模型介绍 其它相关模型体验Mask2Former-R50全景分割 模型描述 Neurips2021文章SegFormer: Simple and Efficient
380pytorchcv
UniASR 模型介绍 FunASR开源项目介绍 FunASR希望在语音识别的学术研究和工业应用之间架起一座桥梁。通过发布工业级语音识别模型的训练和微调,研究人员和开发人员可以更方便地进行语音识别模型
380pytorchaudio
当前共161938个项目
×
寻找源码
源码描述
联系方式
提交