Highlights UniASR德语语音识别模型,可对近场、低噪、正常语速、朗读形式的德语音频进行语音识别: ASR模型:UniASR模型,德语语音识别模型。 ITN模型:德语ITN模型,可用于语
440pytorchaudio
Sambert-Hifigan模型介绍 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用,故此处仅涉及参数法。 参数TTS系统可分为两
370pytorchaudio
视频去场纹模型 视频去场纹模型是一种解决隔行扫描导致的场纹问题的技术,它能够自适应地检测输入视频中的场纹,并针对场纹区域进行场纹去除与画面补全,返回画面干净自然的视频结果。 效果展示 以下是在真实网络
340pytorchcv
Sambert-Hifigan模型介绍 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用,故此处仅涉及参数法。 参数TTS系统可分为两
350pytorchaudio
Sambert-Hifigan模型介绍 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用,故此处仅涉及参数法。 参数TTS系统可分为两
440pytorchaudio
VLDoc文档理解多模态预训练模型介绍 文档理解,即给定一个视觉富文档(visually-rich document),对其自动地分析与处理,包括文档信息抽取、文档版面分析、文档分类与文档VQA等等。
600pytorchmulti-modal
VoP: 通用跨模态视频检索模型 论文 [点击阅读] VoP是第一个同时具有视频和文字Prompt的端到端视频文本跨模态检索框架,基于Prompt的高效微调与完全微调相比,VoP利用0.1%的训练参数
320pytorchcv
Taiyi-Stable-Diffusion-1B-Chinese-v0.1 Github: Fengshenbang-LM Docs: Fengshenbang-Docs API:Fengshen
380pytorchcv
RANER介绍 模型描述 本方法采用Transformer-CRF模型,使用XLM-Roberta作为预训练模型底座,结合使用外部工具召回的相关句子作为额外上下文,使用Multi-view Train
600pytorchnlp
基于连续语义增强的神经机器翻译模型介绍 本模型基于邻域最小风险优化策略,backbone选用先进的transformer-base模型,编码器和解码器深度分别为24和6,相关论文已发表于ACL 202
460tensorflownlp
BAStructBERT通用领域中文词性标注模型介绍 词性标注任务是将给定句子中的每个单词从给定标签组 (tag set)中赋予一个词性标签 (part-of-speech tag)。中文词性标注任务
230pytorchnlp
手部2D关键点检测模型介绍 输入一张手部图像,实现端到端的手部关键点检测,输出完整的手部21个关键点。 模型描述 该模型采用自顶向下的Heatmap手部关键点检测框架,通过端对端的快速推理可
420pytorchcv
中文CLIP News 2022年11月: 发布ModelScope 1.0版本,以下能力请使用1.0.2及以上版本。 上线Huge模型(224分辨率) 上线创空间,更强大的demo展示:中文图文检
520pytorchmulti-modal
构建游戏数据处理器,将文字剧本转为xml、json格式的游戏脚本供驱动。 可以通过修改数据完善游戏脚本 可以关联图片资源和音乐资源
32010
爬虫类应用。主要用于爬取韩国各大免税店的商品,监控爆款商品上货、自动下单抢货(类似于抢火车票的软件) 主要技术栈: 1、爬虫 2、微信小程序、微信公众号、支付、消息推送等 3、高并发处理 4、微信机器人 5、机器人自动短信接收发送 6、自建邮件服务器 等等
1980
”雄安电网智慧供应链运营中心“是国家电网在雄安新区的电力物资仓储管理试点项目,主要解决国家电网在雄安新区电力物资的仓储、检测、调度指挥、配送等相关业。
4310
多个Logo及插图设计。其中包括SVG+CSS实现的图形动画动态图形用于反映网站上图标的交互。 运动可能是实现目标的最佳方法。 我使用Adobe Illustrator为HTML创建SVG格式的图形,并通过CSS代码控制动画效果。
2760
中文  |  English Llama3-Chinese
440
CogAgent CogAgent is an open-source visual language model improved based on CogVLM. ? Paper: https:
310pytorch
Udever 多语言通用文本表示模型 文本表示是将一个输入句子使用机器学习模型转换为一个固定维度的连续向量: 输入: 吃完海鲜可以喝牛奶吗? 输出: [0.27162,-0.66159,0.3303
300nlp
当前共161938个项目
×
寻找源码
源码描述
联系方式
提交