高等代数在机器学习算法中的应用_如何理解机器学习算法在大数据里面的应用

① 高等代数的应用

你问这个问题很正常的，我是设立信息计算科学这个专业的第一批学生。刚到大学的时候我们也是整天问老师这个有什么用那个有什么用。不过学到后来就知道各种用处了。

高等数学里里有“三高三低”的说法，三低指的是数学分析（微积分理论部分）、高等代数和空间解析几何，它们是三高的基础。三高指乏函分析、近世代数和拓扑学。如果三低学不好后面的三高就很难学好。

先就说说你提的高等代数吧
高等代数在大学低年级主要是学习线性代数和代数空间的概念。线性代数在工科有叫做工程数学的，应用非常广泛，这个就不多说了。在数学专业上对后续的课程也非常重要，比如你们后面要开的一门专业课叫数值分析和数值代数的课程（这是这个专业的核心专业课程），用处非常广，还有就是以后要开设的几何作图（或图形学）和图像处理，空间的各种变换都是需要用到线性代数的。再说代数空间，这是现代数学的核心思想的体现，你不仅要好好学会课本的知识，还要掌握代数在处理这些空间上的方式方法，形成数学思维，这对后续课程的学习非常重要。在后续的泛函分析、近世代数和拓扑学上都是要用到的。
学习代数不仅要掌握方法技巧，更重要的是要掌握思想，这是大学和高中数学的区别。从一定意义上说代数是最能锻炼人的思维的，对于数学专业的它以推理证明为主，所以在学习中一定要掌握好概念定义，清楚定理、推论的条件。这样学习起来就轻松了，有时候一道题想上几年都想不通，但是只要对概念稍加研究可能就很轻松地解决了。这就是代数的奇妙之处。

三低中的其他两个我就不多讲了，如有必要你可以给我留言。
最后我我想加两点：
一是他们的用处我没法一一列举，只能点到为止，凸现它的重要地位。上面有人把图论列入代数范围是不对的，但是现代图论是代数的一个很好的应用领域。
二是不管现代数学多么高深，多么前沿的问题，最终都是要化为基本的代数和微积分来处理的，这是丘成桐说的。

不知道楼主满意否？如有疑问可以e_mail:[email protected]

② 线性代数在机器学习上的基本应用

线性代数在机器学习上的基本应用
本人硕渣一枚，之前研究方向为GPU并行计算。现在开始学习机器学习和深度学习。俗话说好记性不如烂笔头。仅以此记录我的学习过程。
线性代数在机器学习方面有着重要的应用，为了更好的理解机器学习，复习一下线性代数。
这里以数字识别为例：
首先一副图像输入如下所示：

我们首先将图片16*16转换成一个256的一维向量，然后我们可以看到如果我们用256维向量作为输入数据，数据量较大。我们可以用一个向量空间去表示输入图像的向量
我们假设u1、u2.....un都是一个标准向量空间，有人可能问 n 为多少呢，如果用标准向量表示256维的向量n还是256，数据维数病没有下降啊但是我们这里要考虑一个问题其实并不是所有的图像都可以表示成手写文字如下图所示，因此我们并不需要使用256基本Basic 去表示，因为如果使用256Basic 我们可以表示任何图像，但是事实上我们并不需要所有图像，我们需要识别出数字首先图像，这样Basic 应该会小于256：这里面 N便会小于256 如下图所示，我们可以把改成Basic 元素表示，如下乳所示：

从而将数据降低维数。

上图是使用4W张图片利用PCA算法找到的Basic.这里面白色为0.黑色为1.灰色介于0到1之间。
利用NMF找出的Basic,这里严格来讲不能算是Basic，因为有可能不是相互独立的

③ 机器学习中涉及到哪些数学工具

在机器学习中涉及到很多的工具，其中最重要的当属数学工具。机器学习涉及到的数据工具总共有三种，分别是线性代数、概率统计和最优化理论。在这篇文章中我们就来详细给大家介绍一下这些知识，让大家在日常的机器学习中可以更好地运用到数学工具。
首先我们给大家介绍一下线性代数，线性代数起到的一个最主要的作用就是把具体的事物转化成抽象的数学模型。不管我们的世界当中有多么纷繁复杂，我们都可以把它转化成一个向量，或者一个矩阵的形式。这就是线性代数最主要的作用。所以，在线性代数解决表示这个问题的过程中，我们主要包括这样两个部分，一方面是线性空间理论，也就是我们说的向量、矩阵、变换这样一些问题。第二个是矩阵分析。给定一个矩阵，我们可以对它做所谓的SVD分解，也就是做奇异值分解，或者是做其他的一些分析。这样两个部分共同构成了我们机器学习当中所需要的线性代数。
然后我们说一下概率统计，在评价过程中，我们需要使用到概率统计。概率统计包括了两个方面，一方面是数理统计，另外一方面是概率论。一般来说数理统计比较好理解，我们机器学习当中应用的很多模型都是来源于数理统计。像最简单的线性回归，还有逻辑回归，它实际上都是来源于统计学。在具体地给定了目标函数之后，我们在实际地去评价这个目标函数的时候，我们会用到一些概率论。当给定了一个分布，我们要求解这个目标函数的期望值。在平均意义上，这个目标函数能达到什么程度呢？这个时候就需要使用到概率论。所以说在评价这个过程中，我们会主要应用到概率统计的一些知识。
最后我们说一下最优化理论，其实关于优化，就不用说了，我们肯定用到的是最优化理论。在最优化理论当中，主要的研究方向是凸优化。凸优化当然它有些限制，但它的好处也很明显，比如说能够简化这个问题的解。因为在优化当中我们都知道，我们要求的是一个最大值，或者是最小值，但实际当中我们可能会遇到一些局部的极大值，局部的极小值，还有鞍点这样的点。凸优化可以避免这个问题。在凸优化当中，极大值就是最大值，极小值也就是最小值。但在实际当中，尤其是引入了神经网络还有深度学习之后，凸优化的应用范围越来越窄，很多情况下它不再适用，所以这里面我们主要用到的是无约束优化。同时，在神经网络当中应用最广的一个算法，一个优化方法，就是反向传播。
在这篇文章中我们给大家介绍了机器学习涉及到的数学工具，分别是线性代数、概率统计和最优化理论。相信大家看了这篇文章以后已经对这些工具的作用有所了解，希望这篇文章能够更好地帮助大家。

④ 如何理解机器学习算法在大数据里面的应用

现在深度学习在机器学习领域是一个很热的概念，不过经过各种媒体的转载播报，这个概念也逐渐变得有些神话的感觉：例如，人们可能认为，深度学习是一种能够模拟出人脑的神经结构的机器学习方式，从而能够让计算机具有人一样的智慧；而这样一种技术在将来无疑是前景无限的。那么深度学习本质上又是一种什么样的技术呢？
深度学习是什么
深度学习是机器学习领域中对模式（声音、图像等等）进行建模的一种方法，它也是一种基于统计的概率模型。在对各种模式进行建模之后，便可以对各种模式进行识别了，例如待建模的模式是声音的话，那么这种识别便可以理解为语音识别。而类比来理解，如果说将机器学习算法类比为排序算法，那么深度学习算法便是众多排序算法当中的一种（例如冒泡排序），这种算法在某些应用场景中，会具有一定的优势。
深度学习的“深度”体现在哪里
论及深度学习中的“深度”一词，人们从感性上可能会认为，深度学习相对于传统的机器学习算法，能够做更多的事情，是一种更为“高深”的算法。而事实可能并非我们想象的那样，因为从算法输入输出的角度考虑，深度学习算法与传统的有监督机器学习算法的输入输出都是类似的，无论是最简单的Logistic Regression，还是到后来的SVM、boosting等算法，它们能够做的事情都是类似的。正如无论使用什么样的排序算法，它们的输入和预期的输出都是类似的，区别在于各种算法在不同环境下的性能不同。
那么深度学习的“深度”本质上又指的是什么呢？深度学习的学名又叫深层神经网络（Deep Neural Networks ），是从很久以前的人工神经网络（Artificial Neural Networks）模型发展而来。这种模型一般采用计算机科学中的图模型来直观的表达，而深度学习的“深度”便指的是图模型的层数以及每一层的节点数量，相对于之前的神经网络而言，有了很大程度的提升。
深度学习也有许多种不同的实现形式，根据解决问题、应用领域甚至论文作者取名创意的不同，它也有不同的名字：例如卷积神经网络（Convolutional Neural

⑤ 学高数线性代数复变函数对计算机专业来说有用吗

有用。

在当下，计算机科学领域里能大量运用高数线代的当属于工程领域。如流体力学弹性力学材料力学中各种工程问题的处理。比较典型的就是使用有限元法处理流体力学中理想流体在粘性流体运动问题。工程中锈钢柔性细管的空拔过程问题。在大量数据矩阵时运用矩阵运算法则简化运算
还有物理学领域中电子设计中复变函数应用较多。如电路理论中解线性方程量子力学中的波函数量子场论，其中Wick's rotation便牵涉到i多体理论中算的积分，很多都要用Resie Theorem，尤其牵涉到波色分布和费米分布（通常推延到Matsubara frequency）还有很多用了复数就可以简化计算的例子
自然语言处理中也有高数线代的大量应用。如如何将不同自然语言使用机器翻译，语音识别。数据通信等。并且这些人工来处理很难，大多需要计算机来辅助。所以计算机专业很有必要学。但是学的精的少些

⑥ 机器学习中的线性代数

机器学习中的线性代数
线性代数作为数学中的一个重要的分支，广发应用在科学与工程中。掌握好线性代数对于理解和从事机器学习算法相关的工作是很有必要的，尤其是对于深度学习而言。因此，在开始介绍深度学习之前，先集中探讨一些必备的线性代数知识。
2.1 标量，向量，矩阵和张量
标量（scalar）：一个标量就是一个单独的数。用斜体表示标量，如s∈R
.
向量（vector）：一个向量是一列数，我们用粗体的小写名称表示向量。比如x
，将向量x
写成方括号包含的纵柱：
x=??????x1x2?xn??????

矩阵（matrix）：矩阵是二维数组，我们通常赋予矩阵粗体大写变量名称，比如A。如果一个矩阵高度是m，宽度是n，那么说A∈Rm×n。一个矩阵可以表示如下：
A=[x11x21x12x22]

张量（tensor）：某些情况下，我们会讨论不止维坐标的数组。如果一组数组中的元素分布在若干维坐标的规则网络中，就将其称为张量。用A表示，如张量中坐标为(i,j,k)的元素记作Ai,j,k。
转置（transpose）：矩阵的转置是以对角线为轴的镜像，这条从左上角到右下角的对角线称为主对角线（main diagonal）。将矩阵A
的转置表示为A?
。定义如下：
(A?)i,j=Aj,i
A=???x11x21x31x12x22x32????A?=[x11x21x21x22x31x32]
2.2 矩阵和向量相乘
矩阵乘法是矩阵运算中最重要的操作之一。两个矩阵A
和B的矩阵乘积(matrix proct)是第三个矩阵C。矩阵乘法中A的列必须和B的行数相同。即如果矩阵A的形状是m×n，矩阵B的形状是n×p，那么矩阵C的形状就是m×p
。即
C=A×B

具体的地，其中的乘法操作定义为
Ci,j=∑kAi,kBk,j

矩阵乘积服从分配律
A(B+C)=AB+AC

矩阵乘积也服从结合律
A(BC)=(AB)C

注意：矩阵乘积没有交换律
点积（dot proct）两个相同维数的向量x
和y的点积可看作是矩阵乘积x?y
矩阵乘积的转置
(AB)?=B?A?

利用向量的乘积是标量，标量的转置是自身的事实，我们可以证明（10）式：
x?y=(x?y)?=y?x

线性方程组
Ax=b
2.3 单位矩阵和逆矩阵
线性代数中提供了矩阵逆（matrix inverse）的工具，使得我们能够解析地求解（11）中的A
.
单位矩阵（identity matrix）：任意向量与单位矩阵相乘都不会改变。我们将保持n
维向量不变地单位矩阵记作为In，形式上In∈Rn×n
，
?x∈Rn,Inx=x

矩阵A的矩阵逆被记作A?1，被定义为如下形式：
A?1A=AA?1=In

（11）式方程组的求解：
Ax=bA?1Ax=A?1bInx=A?1bx=A?1b
方程组的解取决于能否找到一个逆矩阵A?1。接下来讨论逆矩阵A?1的存在的条件。
2.4 线性相关和生成子空间
如果逆矩阵A?1
存在，那么（11）式肯定对于每一个向量b恰好存在一个解。分析方程有多少个解，我们可以看成是A
的列向量的线性组合（linear combination）。
Ax=∑ixiA:,i

形式上，某个集合中向量的线性组合，是指每个向量乘以对应系数之后的和，即
∑iciv(i)

一组向量的生成空间(span)是原始向量线性组合后所能抵达的点的集合。
线性无关（linearly independent）：如果一组向量中的任意一个向量都不能表示成其他向量的线性组合，那么这组向量被称之为线性无关。
要想使矩阵可逆，首先必须矩阵是一个方阵（square），即m=n
，其次，所有的列向量都是线性无关的。
一个列向量线性相关的方阵被称为奇异的（singular）。
2.5 范数
有时候我们需要衡量一个向量的大小，在机器学习中，我们使用称为范数（norm）的函数来衡量矩阵大小，形式上，Lp
范数如下：
||x||p=(∑i|xi|p)12

其中p∈R,p≥1。
范数是将向量映射到非负值的函数。直观上来说，向量x
的范数就是衡量从原点到x
的举例。更严格来说，范数满足下列性质的函数：
f(x)=0?x=0

f(x+y)≤f(x)+f(y)
?α∈R,f(αx)=|α|f(x)

当p=2
时，L2被称作欧几里得范数（Euclidean norm）。它表示从原点出发到向量x确定的点的欧几里得距离。平方L2范数常被用来衡量向量的大小，因为它便于求导计算（如对向量中每个元素的导数只取决于对应的元素，但是它也有缺陷，即它在原点附近增长得十分缓慢），可以简单用点积x?x
来计算。
max 范数（max norm）：这个范数表示向量中具有最大幅度得元素的绝对值，用L∞
范数表示，期形式为：
||x||∞=∑(i,j)A2i,j??????√
两个向量的点积(dot proct)也可以用范数来表示。具体地，

x?y=||x||2||y||2cosθ
2.6 特殊类型的矩阵和向量
对角矩阵(diagonal matrix)只在主对角线上含有非零元素，其它位置都是零。矩阵D
是对角矩阵，当且仅当?i≠j,Di,j=0，用diag(v)表示一个对角元素由向量v
中元素给定的对角矩阵。
对称(symmetric) 矩阵是任意转置和自己相等的矩阵：
A=A?
即在矩阵A中，有Ai,j=Aj,i。
单位向量（unit vector）是具有单位范数（unit norm）的向量：
||x||2=1
如果x?y=0，那么向量x和向量y互相正交（orthogonal）。如果两个向量都有非零范数，那么表示这两个向量之间的夹角是90 度。在Rn中，至多有n个范数非零向量互相正交。如果这些向量不仅互相正交，并且范数都为1，那么我们称它们是标准正交（orthonormal）。
正交矩阵（orthonormal matrix）是指行向量是标准正交的，列向量是标准正交的方阵：
A?A=AA?=I
这意味着
A?1=A?

所以正交矩阵受到关注是因为求逆计算代价小。需要注意正交矩阵的定义。反直觉地，正交矩阵的行向量不仅是正交的，还是标准正交的。对于行向量或列向量互相正交但不是标准正交的矩阵没有对应的专有术语。
2.7 特征分解
许多数学对象可以通过将它们分解成多个组成部分，或者找到它们的一些属性而被更好地理解，这些属性是通用的，而不是由我们选择表示它们的方式引起的。就像我们可以通过分解质因数来发现一些关于整数的真实性质，我们也可以通过分解矩阵来获取一些矩阵表示成数组元素时不明显的函数性质。
特征分解(eigendecomposition)是使用最广的矩阵分解之一，即我们将矩阵分解成一组特征向量和特征值。
方阵A
的特征向量（eigenvector）是指与A相乘后相当于对该向量进行缩放的非零向量v
：
Av=λv
标量λ被称为这个特征向量对应的特征值（eigenvalue）。
如果v
是A的特征向量，那么任何放缩后的向量sv(s∈R,s≠0)也是A
的特征向量并且其与bf v 有相同的特征值。所以我们通常只考虑单位特征向量。
假设矩阵A
有n个线性无关的特征向量{v(1),v(2),...,v(n)}，对应着的特征值{λ1,λ2,...,λn}
，我们将特征向量连成一个矩阵，使得每一列是一个特征向量：
V=[v(1),v(2),...,v(n)]
类似地，特征值连成一个向量：
λ=[λ1,λ2,...,λn]?
因此bf A 的特征分解（eigendecomposition）可以记作：
A=Vdiag(λ)V?1
上面我们构建具体特定的特征值和特征向量，能够使我们在目标方向上延伸空间。我们也常常希望将矩阵分解(decompose)成特征值和特征向量。这样可以帮助我们分析矩阵的特定性质，就像质因数分解有助于我们理解整数。
不是每一个矩阵都可以分解成特征值和特征向量，在某些情况下，特征分解会涉及到复数，而非实数。在本书的机器学习学习中，我们只讨论一类简单分解的矩阵。具体就是，每个实对称矩阵都可以分解为实特征向量和实特征值：
A=QΛQ?
其中Q是A的特征向量组成的正交矩阵，Λ是对角矩阵。特征值Λi,i对应的特征向量是矩阵Q的第i列，记作Q:,i。因为Q是正交矩阵，所以可以将A看作是沿方向v(i)延展λi倍的空间。如下图所示：
2.8 迹运算
迹运算返回的是矩阵对角元素的和：
Tr(A)=∑iAi,i
迹运算因为很多原因而受到关注。若不使用求和符号，有些矩阵运算很难描述，而通过矩阵乘法和迹运算符号，可以进行清楚地表示。例如，迹运算提供了另一种描述矩阵Frobenius 范数的方式:
||A||F=Tr(AA?)????????√
用迹运算表示式，使我们可以用很多有用的性质来操纵表示式。例如迹运算在转置下是不变的：
Tr(A)=Tr(A?)
多个矩阵乘积的迹还满足链式规律，即：
Tr(ABC)=Tr(BCA)=Tr(CAB)

标量的迹是它本身：a=Tr(a)。
2.9 行列式
行列式，记作det(A)
，是一个将方阵A
映射到实数的函数。行列式等于矩阵特征值的乘积。行列式的绝对值可以被认为是衡量矩阵相乘后空间扩大或者缩小了多少。如果行列式是0, 那么空间至少沿着某一维完全收缩了，使其失去了所有的体积。如果行列式是1, 那么矩阵相乘没有改变空间体积。
总结
以上是在机器学习过程中必须了解和掌握的有关线性代数的知识

⑦ 数学分析,高等代数学了有什么用

我们的生活已经完全离不开数学。甚至可以这么说，没有高等数学的发展，就不会有今天的现代化。

高等数学的各主要学科的“用处”。中学数学就不说了，这在数学家眼里都是算术。一些如概率统计、离散数学、运筹学、控制论等纯粹就是为了应用而发展起来的分支也不说了，重点介绍基础方面的。

数学分析：主要包括微积分和级数理论。微积分是高等数学的基础，应用范围非常广，基本上涉及到函数的领域都需要微积分的知识。级数中，傅立叶级数和傅立叶变换主要应用在信号分析领域，包括滤波、数据压缩、电力系统的监控等，电子产品的制造离不开它。

实变函数（实分析）：数学分析的加强版之一。主要应用于经济学等注重数据分析的领域。

复变函数（复分析）：数学分析加强版之二。应用很广的一门学科，在航空力学、流体力学、固体力学、信息工程、电气工程等领域都有广泛的应用，所以工科学生都要学这门课的。

高等代数，主要包括线形代数和多项式理论。线形代数可以说是目前应用很广泛的数学分支，数据结构、程序算法、机械设计、电子电路、电子信号、自动控制、经济分析、管理科学、医学、会计等都需要用到线形代数的知识，是目前经管、理工、计算机专业学生的必修课程。

高等几何：包括空间解析几何、射影几何、球面几何等，主要应用在建筑设计、工程制图方面。

分析学、高等代数、高等几何是近代数学的三大支柱。

微分方程：包括常微分方程和偏微分方程，重要工具之一。流体力学、超导技术、量子力学、数理金融中的稳定性分析、材料科学、模式识别、信号(图像)处理、工业控制、输配电、遥感测控、传染病分析、天气预报等领域都需要它。

泛函分析：主要研究无限维空间上的函数。因为比较抽象，在技术上的直接应用不多，一般应用于连续介质力学、量子物理、计算数学、无穷维商品空间、控制论、最优化理论等理论。

近世代数（抽象代数）：主要研究各种公理化抽象代数系统的。技术上没有应用，物理上用得比较多，尤其是其中的群论。

拓扑学：研究集合在连续变换下的不变性。在自然科学中应用较多，如物理学的液晶结构缺陷的分类、化学的分子拓扑构形、生物学的DNA的环绕和拓扑异构酶等，此外在经济学中的博弈论也有很重要的应用。

泛函分析、近世代数、拓扑学是现代数学三大热门分支。

非欧几何：主要应用在物理上，最着名的是相对论。

导航:首页 > 源码编译 > 高等代数在机器学习算法中的应用

高等代数在机器学习算法中的应用

与高等代数在机器学习算法中的应用相关的资料