可以爬一个B站的视频,只要包含人脸,动作,声音的部分 处理后的效果要求: 1、图片:只留下有表情,有动作的关键画面 2、音频:只保留和画面对齐,有声音的片段 3、数据同步:图片和音频完全同步,适合后续的情绪地图构建 4、占用内存空间小,运行速度快
评论