音视频多媒体

本项目的主要目标是通过人工智能技术创建具有与真实人类类似的外貌、声音和行为数字人形象,以帮助用户实现输入文本即可获取具有面部嘴型与姿态符合需求的授课需求的视频。同时,本产品还支持多个场景与多个人物模型的选择,以满足用户的不同需求。基础功能包括:1、通过人工智能技术创建具有与真实人类类似的外貌、声音和
120Python人工智能
本项目是基于大模型技术的语音质量检查工具,主要包含以下模块和功能:核心模块:-任务调度器:支持有序/无序任务管理,可配置定时执行时间和任务参数-数据服务:datapull(从远程拉取文件)和datapush(提供文件推送服务)-语音处理:extractbyrole服务实现说话人分离,生成单独说话人音
550Python人工智能
系统基于多目相机完成溜井扫场与标定,结合目标检测算法识别石头、破碎机、栅栏、车辆、人员等目标信息;下位机根据识别结果完成自主路径规划、破碎、推石、扫石及人员/车辆避障,并通过CAN通信控制破碎机执行作业;上位机实时接收并展示破碎次数、人员进入次数、车辆进入次数、石头层高等关键数据,同时支持多路RTS
530C++音视频多媒体
#电信诈骗防范系统功能介绍##1.具体功能模块-用户认证模块:支持用户注册、登录、密码找回,区分普通用户和管理员权限,确保系统安全访问-智能识别模块:基于LSTM深度学习模型,提供单条文本和批量文件(CSV/TXT)识别功能-历史记录模块:自动保存用户识别历史,支持按时间、类型等维度查询和管理-教育
510Python机器深度学习
本项目为AI语音转换系统,基于Python+PyTorch开发,支持本地离线部署运行。主要功能包括:支持音色迁移、语音转换,可将输入音频转换为指定目标音色。支持本地模型加载与推理,保障数据隐私,不上传云端。可在Windows/Linux环境运行,转换效率高。可用于内容创作、语音演示、音频处理等场景,
550Python人工智能
1.剧本编辑,根据用户输入创意,自动生成剧本,并允许用户进行编辑修改。2.根据生成剧本自动生成角色描述和多视角人物图像3.根据剧本进行自动分镜,然后结合角色生产分镜图片4.根据分镜设计,生成分镜视频
660Python音视频多媒体
功能简介(精简版)智能切片与剪辑:基于语音识别、语义分析和规则引擎,从长视频中自动识别金句、高光片段,一键生成多个剪辑方案。剪辑工作室(ClipStudio):提供多轨时间线、滤镜、字幕、转场等完整剪辑能力,支持WebGPU加速预览与导出。AI辅助编辑:支持用自然语言下指令,由Agent自动完成剪辑
890Python音视频多媒体
远程医疗系统产品系统
1.5G模块,防止网络带宽对视频流进行影响,选择了使用5G模块2.高清摄像头模块,对远程医疗场景进行实时采集信息3.推拉流视频服务器,保证视频流能稳定传输到远端4.FPGA驱动板,定制的OLED驱动板,可以传输视频到OLED板,并可以通过PWM同时控制OLED背光板的576个LED灯
2410C++物联网
1.用户引导与拍照模块语音+图文引导:明确提示用户如何站立、距离、姿势、衣着建议(如紧身衣)。姿势检测:实时检测用户姿态是否符合要求(如双臂微张、站立笔直),不合格则实时提示重拍。多角度拍照:正面、侧面、背面共三张,支持重拍、预览、确认流程。2.图像上传与预处理图像质量检测:模糊、光线、遮挡、背景复
5100C++人工智能
1.概览及数据分析实时展示当日在线相机、在线设备数量及变化趋势。提供告警数据的统计分析,包括告警类型、告警频次、告警热力图分布。支持风险点位的自动标注与分类展示,为安全管理与决策提供可视化数据支撑。支持数据大屏展示与多维度筛选(时间、区域、企业、设备)。2.设备管理可对视频分析设备(边缘盒子、视频分
3930C++人工智能
当前共10个项目more
×
寻找源码
源码描述
联系方式
提交