CNN+RNN+LSTM+Tflite+HMM+vViterbi
项目描述:首先我们先训练一个模型,开始检测器由声学模型CNN组成,接着是一个双向LSTM,在向前和向后方向上都有128个单元,接着是一个完全连接的sigmoid层,有88个输出,用于表示88个钢琴键中每个键的开始概率。接着我们会用tp-spr和hmm文件去match最终的结果,其中算法用到了viterbi,动态规划,朴素贝叶斯,隐形马尔科夫等算法,其中走谱以及识谱模式,我们使用的两种方案,对于计算处理速度比较快的机型我们使用的是tflite,对于那些机型相对较老,CPU计算相对较慢的机型我们使用的onset算法,后来也尝试了silvet,aubio,BBC,qm等同类型机器学习的算法,但是效果相对较差。
点击空白处退出提示
评论