机器学习中的数学知识（一）：线性代数

发表: 2017-05-23 浏览: 5120

编程入门机器学习

当我们开始学习编程的时候，第一件事往往是学习打印"Hello World"。机器学习入门的MNIST，就好比编程入门中的Hello World。MNIST是机器学习领域中的一个经典问题，该问题解决的是把28x28像素的灰度手写数字图片识别为相应的数字，其中数字的范围从0到9。MNIST database是一个入门级的计算机视觉数据集，它包含各种手写数字图片：

安装好TensorFlow以后（安装方法请参考：手把手教你搭建谷歌TensorFlow深度学习开发环境！），下载MNIST数据集，我们可以看到数据集的每一张图片包含28x28个像素点，我们可以用一个数字数组来表示这张图片：

我们把这个数组展开成一个向量，长度是 28x28 = 784。如何展开这个数组不重要，只要保持各个图片采用相同的方式展开即可。从这个角度来看，MNIST数据集的图片就是在784维向量空间里面的点，也就是28x28个点展开成1维的结果。这里丢弃了图片的二维结构方面的信息，把一张图片变成一个很长的1维向量。在后面的运算中，TensorFlow将使用卷积神经网络（CNN）对空间结构信息进行分析，获得更高的准确率。