本问题可以看作“手写数字识别 MINST”的拓展, 在机器学习 领域属于较为常见的问题。采用神经网络的主要原因是神经网络运 算速度较高,容错能力强, 具有自组织能力且较易优化,对于作为 机器学习初学者的我们较为友好。我们在研究过程中遇到的问题及 解决方案如下。
1.1 主要问题
1) 图片识别问题。
2) 处理图片方式选择问题。
3) 运行速率提升问题。
4) 准确率提升问题。
1.2 解决方案
1)将图片按比例划分成训练集,验证集与测试集,分别对图片进行裁剪, 并 通过卷积神经网络进行处理。
2)把训练样本分成若干个子集,这样每个子集包含的数据量就小 了,例如训练集 train 中仅有 2250 个图像,然后每次在单一子集上 进行神经网络训练,速度就会大大提高。
3)不断进行优化,修改 lambda,调整迭代次数,进行多次训练, 并 将训练出的 theta 反复训练。
将上述操作进行整合串联, 确定我们最后的解决方案为:数据处理 →初始化处理→建立模型→优化处理→检验→训练迭代→测试。
点击空白处退出提示
评论