生活垃圾分类模型介绍 自建265类常见的生活垃圾标签体系,15w张图片数据,包含可回收垃圾、厨余垃圾、有害垃圾、其他垃圾4个标准垃圾大类,覆盖常见的食品,厨房用品,家具,家电等生活垃圾小类共265个,
970pytorchcv
Highlights Paraformer-large长音频模型集成VAD、ASR、标点,可直接对时长为数小时音频进行识别,并输出带标点文字: ASR模型:Parformer-large模型结构为非
820pytorchaudio
ROM语义相关性-中文-医疗领域模型介绍 文本检索是信息检索领域的核心问题, 其在很多信息检索、NLP下游任务中发挥着非常重要的作用。 近几年, BERT等大规模预训练语言模型的出现使得文本表示效果有
480pytorchnlp
Investigating Tradeoffs in Real-World Video Super-Resolution 模型描述 RealBasicVSR提出了一个预清理模块,其可以在传播之前抑制退
660pytorchcv
基于StructBERT的中文Base预训练模型介绍 StructBERT的中文Large预训练模型是使用wikipedia数据和masked language model任务训练的中文自然语言理解预
490pytorchnlp
Highlights UniASR英语语音识别模型,可对近场、低噪、正常语速、朗读形式的英语音频进行语音识别: ASR模型:UniASR模型,英语语音识别模型。 ITN模型:英语ITN模型,可用于语
520pytorchaudio
ROM语义相关性-中文-通用领域模型介绍 文本检索是信息检索领域的核心问题, 其在很多信息检索、NLP下游任务中发挥着非常重要的作用。 近几年, BERT等大规模预训练语言模型的出现使得文本表示效果有
810pytorchnlp
res2net-salient-detection 模型介绍 给定一张输入图像,通过目标边界信息引导找出图中的显著性目标,并输出视觉显著注意力图。 期望模型使用方式与适用范围 本模型适用范围较广,预
560pytorchcv
中文CLIP News 2022年11月: 发布ModelScope 1.0版本,以下能力请使用1.0.2及以上版本。 上线Huge模型(224分辨率) 上线创空间,更强大的demo展示:中文图文检
790pytorchmulti-modal
基于序列建模的文本分割模型 该模型基于wiki-en公开语料训练,对未分割的长文本进行段落分割。提升未分割文本的可读性以 及下游NLP任务的性能。 模型描述 随着在线教学、会议等技术的扩展,口语文档的
400pytorchnlp
OrionStar-Yi-34B-Chat Github | ? Online Demo 目录 ? 模型介绍 ? 模型推理 ? ? 示例输出 ? 企业介绍 ? 声明、协议 模型介绍 Or
630
Baichuan-13B-Base 介绍 Baichuan-13B-Base为Baichuan-13B系列模型中的预训练版本,经过对齐后的模型可见Baichuan-13B-Chat。 Baichua
580pytorch
视频目标检测 自动驾驶实时视频检测模型, 把周围环境检测问题,转化为将来环境预测问题,从问题定义的层面解决自动驾驶中环境感知时延的问题。该任务定义为流感知(Streaming Perceptio
540pytorchcv
Fer 模型介绍 稳定调用及效果更好的API,详见视觉开放智能平台:人脸属性识别、表情识别。 人脸表情识别模型Fer 模型描述 Fer为人脸表情识别领域的明星项目(代码地址)。网络结构比较简单,bac
660pytorchcv
hrnet-crowd-counting模型介绍 人数: 148 给定一张输入图像,输出图像中人群个数的总值,以及对应的heatmap图。 模型基本原理(如下图所示): 针对不同的domain数据,
450pytorchcv
Orion-14B ??中文 | ?English ? HuggingFace主页 | ? ModelScope主页? HuggingFace在线试
590
Orion-14B ??中文 | ?English ? HuggingFace主页 | ? ModelScope主页? HuggingFace在线试
500
Orion-14B ??中文 | ?English ? HuggingFace主页 | ? ModelScope主页? HuggingFace在线试
500
Orion-14B ??中文 | ?English ? HuggingFace主页 | ? ModelScope主页? HuggingFace在线试
490
CAM++说话人识别模型 CAM++模型是基于密集连接时延神经网络的说话人识别模型。相比于一些主流的说话人识别模型,比如ResNet34和ECAPA-TDNN,CAM++具有更准确的说话人识别性能和更
600pytorchaudio
当前共161921个项目
×
寻找源码
源码描述
联系方式
提交