语音识别:
基于paddlespeech搭建语音识别模型,识别对话
大语言模型部署:
本地部署大语言模型chatGLM2-6B,给出接口接收语音识别结果,并根据问题给出回答,将输出给到UE
数字人搭建:
使用UE4搭建数字人,在UE中给出端口接受大语言模型输出的文字,在UE中调用语音生成算法,生成相应语音。
唇语算法:
基于facebook唇语算法生成数字人唇形
语音生成:
基于paddlespeech语音生成算法
语音克隆:
基于两百条数据和预训练模型训练个人模型
点击空白处退出提示












评论