一.功能模块:1.数据可视化:数据为MATLAB格式,首先用scipy库导入数据,共5000个数据样本,每个样本中有401个特征值。其中400个为每个手写数字图片的400个像素亮度值,1个为其实际的真实数字。导入数据后通过matplotlib.pyplot绘制一部分样本图片。2.搭建神经网络模型:模型包括了一个输入层(25个单元)、一个隐藏层(15个单元)、一个输出层(10个单元),激活函数分别使用relu\relu\softmax,损失函数为SparseCategoricalCrossentropy(),最终10个输出的是为各个单元对应数字的概率。3.数据集划分:通过sklearn模块的train_test_split,将数据集划分为490个数据的训练集和10个数据的测试集。4.训练模型:训练之前先处理一下数据集中的实际对应数字,因为其范围为1-10,应该将其进行减一操作至0-9,再进行model.fit,迭代次数设置为100次。5.测试集测试:model.predict方法得出各个数字的概率,取概率最大的那个单元对应的数字,再加一输出。
2.技术栈:机器学习,tensorflow,