音视频多媒体

1、项目有哪些具体功能模块跨平台推理适配模块、五层防误唤醒检测模块、模型加载解析模块、音频梅尔频谱转换模块、多唤醒词并行识别模块。2、项目的主要功能描述支持加载各类框架导出的ONNX唤醒词模型，内置五层独立可控防误触发检测逻辑，搭配倍率、阈值、置信度可视化调节；一套代码兼容ESP32、Android

330Python人工智能

工业级图像质量评估软件产品系统

它可以量化“拍得好不好”，主要分析以下关键指标（KPI）：·清晰度(Sharpness/MTF)：这是最核心的功能。通过斜边测试卡精确计算镜头分辨率，评估图像边缘锐度。·色彩与噪点：测试色彩还原准确度（ΔE值），以及分析暗光下的信噪比(SNR)和动态范围。·镜头畸变与均匀性：分析广角镜头导致的畸变（

240Python开发工具

虚拟数字人引擎（TTS + Talking-Face + Avatar）产品系统

系统由三大引擎构成：1）TTS引擎，包含文本前端（分词/TN/韵律分析）、BERT+LSTM韵律预测、混合语言G2P转换、声学模型与声码器，支持中英混文本，提供流式/非流式gRPC+WebSocket双接口；2）Talking-Face引擎，基于单张图片+语音生成带声视频；3）AvatarEdito

300C++人工智能

AI艺术语音生成系统TTS (刘宝瑞《官场斗》续集)产品系统

构建了一套多情绪/风格合成系统。成功实现对相声大师刘宝瑞音色的高保真克隆，并应用于《官场斗》续集文本的自动化语音生成。续集大概有30集，每集20分钟。推出后得到了广泛好评。

420Python音视频多媒体

教育数字人生成工具产品系统

本项目的主要目标是通过人工智能技术创建具有与真实人类类似的外貌、声音和行为数字人形象，以帮助用户实现输入文本即可获取具有面部嘴型与姿态符合需求的授课需求的视频。同时，本产品还支持多个场景与多个人物模型的选择，以满足用户的不同需求。基础功能包括：1、通过人工智能技术创建具有与真实人类类似的外貌、声音和

500Python人工智能

大模型语音通话分析预警系统产品系统

本项目是基于大模型技术的语音质量检查工具，主要包含以下模块和功能：核心模块：-任务调度器：支持有序/无序任务管理，可配置定时执行时间和任务参数-数据服务：datapull（从远程拉取文件）和datapush（提供文件推送服务）-语音处理：extractbyrole服务实现说话人分离，生成单独说话人音

840Python人工智能

破碎机智能控制系统产品系统

系统基于多目相机完成溜井扫场与标定，结合目标检测算法识别石头、破碎机、栅栏、车辆、人员等目标信息；下位机根据识别结果完成自主路径规划、破碎、推石、扫石及人员/车辆避障，并通过CAN通信控制破碎机执行作业；上位机实时接收并展示破碎次数、人员进入次数、车辆进入次数、石头层高等关键数据，同时支持多路RTS

980C++音视频多媒体

电信诈骗防范系统产品系统

#电信诈骗防范系统功能介绍##1.具体功能模块-用户认证模块：支持用户注册、登录、密码找回，区分普通用户和管理员权限，确保系统安全访问-智能识别模块：基于LSTM深度学习模型，提供单条文本和批量文件（CSV/TXT）识别功能-历史记录模块：自动保存用户识别历史，支持按时间、类型等维度查询和管理-教育

710Python机器深度学习

AI 语音转换助手开源项目

本项目为AI语音转换系统，基于Python+PyTorch开发，支持本地离线部署运行。主要功能包括：支持音色迁移、语音转换，可将输入音频转换为指定目标音色。支持本地模型加载与推理，保障数据隐私，不上传云端。可在Windows/Linux环境运行，转换效率高。可用于内容创作、语音演示、音频处理等场景，

680Python人工智能

短视频生成平台产品系统

1.剧本编辑，根据用户输入创意，自动生成剧本，并允许用户进行编辑修改。2.根据生成剧本自动生成角色描述和多视角人物图像3.根据剧本进行自动分镜，然后结合角色生产分镜图片4.根据分镜设计，生成分镜视频

790Python音视频多媒体

flashclip产品系统Vibe Coding

功能简介（精简版）智能切片与剪辑：基于语音识别、语义分析和规则引擎，从长视频中自动识别金句、高光片段，一键生成多个剪辑方案。剪辑工作室（ClipStudio）：提供多轨时间线、滤镜、字幕、转场等完整剪辑能力，支持WebGPU加速预览与导出。AI辅助编辑：支持用自然语言下指令，由Agent自动完成剪辑

1130Python音视频多媒体

远程医疗系统产品系统

1.5G模块，防止网络带宽对视频流进行影响，选择了使用5G模块2.高清摄像头模块，对远程医疗场景进行实时采集信息3.推拉流视频服务器，保证视频流能稳定传输到远端4.FPGA驱动板，定制的OLED驱动板，可以传输视频到OLED板，并可以通过PWM同时控制OLED背光板的576个LED灯

2570C++物联网

智能分析-人体尺寸计算产品系统

1.用户引导与拍照模块语音+图文引导：明确提示用户如何站立、距离、姿势、衣着建议（如紧身衣）。姿势检测：实时检测用户姿态是否符合要求（如双臂微张、站立笔直），不合格则实时提示重拍。多角度拍照：正面、侧面、背面共三张，支持重拍、预览、确认流程。2.图像上传与预处理图像质量检测：模糊、光线、遮挡、背景复

5480C++人工智能

视频智能分析系统产品系统

1.概览及数据分析实时展示当日在线相机、在线设备数量及变化趋势。提供告警数据的统计分析，包括告警类型、告警频次、告警热力图分布。支持风险点位的自动标注与分类展示，为安全管理与决策提供可视化数据支撑。支持数据大屏展示与多维度筛选（时间、区域、企业、设备）。2.设备管理可对视频分析设备（边缘盒子、视频分

4120C++人工智能

当前共14个项目登录查看更多

登录后即可上传、下载作品

分类

HarmonyOS 机器人 COCOS2D-X Tcp Nginx TiDB 自动驾驶项目任务 Vue 机器深度学习

音视频多媒体

重点城市程序员兼职推荐

重点岗位程序员兼职推荐