本工作完成了基于OpenCL的卷积神经网络的并行设计,验证了所设计算法在异构并行平台上的可行性和正确性。 在分析手写数字识别的卷积神经网络基本结构的基础上,总结了基于OpenCL的卷积神经网络训练的优化方法,提出了单卷积过程并行、多卷积任务并行、多卷积数据 并行和批处理等基于openCL的并行优化程序,并完成优化程序编程。 CNN算法的训练、测试过程和仿真均在Intel CPU、AMD GPU和NVIDIA GPU平台上实现。 测试结果表明,在相同训练准确率的情况下,本文提出的并行优化方案比串行执行方法快约375倍。
点击空白处退出提示
评论