pytorch

RANER介绍 模型描述 本方法采用Transformer-CRF模型,使用xlm-roberta-large作为预训练模型底座,结合使用外部工具召回的相关句子作为额外上下文,使用Multi-view
320pytorchnlp
VGen VGen is an open-source video synthesis codebase developed by the Tongyi Lab of Alibaba Group,
340pytorchmulti-modal
UniASR 模型介绍 模型描述 UniASR 模型是一种2遍刷新模型(Two pass)端到端语音识别模型。日益丰富的业务需求,不仅要求识别效果精度高,而且要求能够实时地进行语音识别。一方面,离线语
500pytorchaudio
Segformer-B4语义分割模型介绍 其它相关模型体验Mask2Former-R50全景分割 模型描述 Neurips2021文章SegFormer: Simple and Efficient
440pytorchcv
FLXC 模型介绍 稳定调用及效果更好的API,详见视觉开放智能平台:人脸活体检测、红外人脸活体检测、视频活体检测。 静默炫彩人脸活体检测模型FLXC 模型描述 用来检测图片中的人脸是否为来自认证设备
1020pytorchcv
Vicuna Model Card Model Details Vicuna is a chat assistant trained by fine-tuning Llama 2 on user-sh
420pytorch
GitHub | Demo News [2024.04.23] MiniCPM-V 2.0 supports vLLM now! [2024.04.18] We create a HuggingF
440
Sambert-Hifigan模型介绍 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用,故此处仅涉及参数法。 参数TTS系统可分为两
580pytorchaudio
English  |   中文 Building the Next Generation of Open-Source and
320
UniASR 模型介绍 模型描述 UniASR 模型是一种2遍刷新模型(Two pass)端到端语音识别模型。日益丰富的业务需求,不仅要求识别效果精度高,而且要求能够实时地进行语音识别。一方面,离线语
540pytorchaudio
单目标跟踪算法模型介绍 对于一个输入视频,只需在第一帧图像中用矩形框指定待跟踪目标,单目跟踪算法将在整个视频帧中持续跟踪该目标,输出跟踪目标在所有图像帧中的矩形框信息。 模型描述 本模型是基于OST
560pytorchcv
ChatGLM-6B-Int4模型介绍 ChatGLM-6B 是一个开源的、支持中英双语问答的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结
460pytorchnlp
ECAPA-TDNN说话人模型 ECAPA-TDNN模型是基于时延神经网络构建的说话人模型,由于识别性能优异,已经被广泛使用在说话人识别领域中,还可用于说话人日志和语种识别等任务。 模型结构简述 EC
630pytorchaudio
语音唤醒模型介绍 模型描述   移动端语音唤醒模型,检测关键词为"Yes/No/Up/Down/Left/Right/On/Off/Stop/Go"10个英文单词。   模型网络结构继承自论文《Com
400pytorchaudio
模型背景 2018年,Bert等预训练语言模型的出现,给NLP下游任务带来了普遍的效果提升,成为NLP的一个重要里程碑,但这些预训练语言模型并没有反映对话的特点,比如分角色、多轮次、知识约束、讲对话策
420pytorchnlp
商品图像特征模型介绍 本模型是对商品图像进行表征向量提取,用户可基于表征向量进行大规模的同款/相似款商品搜索;无需额外输入,模型可自动进行箱包商品的主体抠图,并基于主体提取结果完成表征向量提取。 模型
270pytorchcv
17点人体关键点检测模型 输入一张人物图像,实现端到端的人体关键点检测,输出视频中每一帧图像人体的17点人体3D关键点坐标。 17点人体关键点 3D人体关键点系列模型 HDForm
390pytorchcv
English  |   中文 Building the Next Generation of Open-Source and
390
DFSMN远场唤醒模型介绍 问题背景 关键词检测(keyword spotting, KWS),即我们通常所说的语音唤醒,指的是一系列从实时音频流中检测出若干预定义关键词的技术。随着远讲免提语音交互(
470pytorchaudio
FLIR 模型介绍 稳定调用及效果更好的API,详见视觉开放智能平台:人脸活体检测、红外人脸活体检测、视频活体检测。 IR 人脸活体检测模型FLIR 模型描述 用来检测图片中的人脸是否为来自认证设备端
950pytorchcv
当前共5187个项目
×
寻找源码
源码描述
联系方式
提交