linear algebra&3b1b

Created2026-01-22|Updated2026-04-09|other

|Word Count:1.7k|Reading Time:5mins

矩阵向量求导(刘建平博客)

1求导布局

分子布局(numerator layout)和分母(denominator)布局
- 分子求导的结果维度以分子为主，分母同理(两种布局的结果相差一个转置)
  - e.g:标量对矩阵求导，按分母布局就是和矩阵形状相同，分子布局就是相反
- 列向量之间的求导(y:n*1,x:m*1) $\frac{\partial y}{\partial x}$ $\frac{\partial y}{\partial x}$ :
  - 分子布局:雅可比矩阵为n*m(Jacobian)也写作 $\frac{\partial y}{\partial x^T}$
  - 分母布局:梯度矩阵,也写作 $\frac{\partial y^T}{\partial x}$

2 定义法标量对向量求导:

3 微分法求导

矩阵微分及其性质(一般是分子布局)

e.g:

$de^{xb}=e^{xb}\odot d(xb)$

4 链式法则

向量对向量的链式:要求中间都必须是向量
标量对向量:x->y->z(z为标量)

$\frac{\partial z}{\partial x}=(\frac{\partial y}{\partial x})^T\times \frac{\partial z}{\partial y}$

结论(标量对矩阵求导)
- $z=f(y)$

$y=AX+B\text{ then } \frac{\partial z}{\partial x}=A^T\frac{\partial z}{\partial y}$

$y=XA+B\text{ then } \frac{\partial z}{\partial x}=\frac{\partial z}{\partial y}A^T$

5 矩阵对矩阵求导

主流定义是先将矩阵向量化再求导
克罗内克积:前一个矩阵的每一个元素和后一个矩阵整体的求积
hadamard:每个矩阵对应位置乘积

3b1b linear algebra

01 向量的本质

physics:有向，有大小的空间线段
cs:仅仅只是ordered list of numbers
math:服从特定加法和数乘运算即可

02 线性组合，张成的空间，基

基向量(basis vector)
坐标(coordinate)
向量张成的空间(span)
线性组合:控制仅改变一个的系数:这个时候向量的终点形成一条直线
三维空间中:其中两个向量张成的平面随着第三个向量的系数改变扫过整个空间
线性相关(linear dependent)

03 矩阵与线性变换

linear transformation:transformation暗示了这种函数变换有非常自然的几何对应关系
线性 :直线变换后还是直线，并且原点不变(保持网格线平行且等距分布)
使用数值方法表述线性变换，向量分解成的基向量表示，对基向量进行变换，然后使用相同的系数对变换后的基向量进行线性组合，就可以得到变换后的向量(二维线性变换完全由4个数字即可决定)
shear(剪切)，仅改变x或者y坐标的方向
当矩阵的列向量线性相关，其代表的线性变换直接把整个二维空间压缩到了一条直线上

04 矩阵乘法和线性变换复合

矩阵相乘的几何意义:连续进行线性变换

footnote(补充)

05 行列式

通过算行列式是否为0可以体现该线性变换是否将空间压缩到了更小的维度上去
实际上行列式的值就是面积变换的倍数
负值意味着发生了取向改变(原本i在j 的左侧，变成了右侧)三维就是右手定则变成了左手

06 逆矩阵，列空间和零空间

方程组(system of equations)
解线性方程组 $A\vec{x}=\vec{v}$
其实就是找一个向量x使其在给定的线性变换后与v重合
秩(rank)其实就是空间经过对应线性变换后的维数(列空间的维数)
当矩阵非满秩的时候，会有无数的向量(一条线上or一个平面上)压缩到原点，这些向量构成零空间(null space)、核(kernel)
$m\times n\text{ matrix}$ ,将输入的n维映射到m维

07 点积与对偶性(duality)

线性变换会使等距分布的点仍然保持等距分布
1*2的矩阵与二维向量之间实际上有对应关系(对偶向量)，这使得向量点积可以视为矩阵与向量的乘法
所以点积可以理解为先投影后缩放
向量可以仅用一个点表示，其对应着某种线性变换，这种思路在某些理解场景很好用

08叉积

二维向量的叉积
三维向量下的推广
实际意义:找一个向量，满足
几何解释:对偶向量(代表该线性变换的)其一定满足垂直于两向量张成的平面，并且长度等于张成形状的面积

09 基变换

直接给出一个矩阵:其追踪的是该线性变换下基向量的变换

A和A逆其实表示的就是对基向量的变换，中间的M才是最终要进行的变换

10 特征向量与特征值

线性变换后，大部分向量都离开了其原本张成的空间(这里，一个向量张成的空间就是该向量表征方向的一条线)
有的依然沿原方向，这就是特征向量，此时的线性变换对其仅表现为标量压缩

作用:考虑三维空间的旋转，特征值为1的特征向量就是旋转轴
对角矩阵:特征向量拼成的矩阵，每个元素就是其特征值(特征向量就是基向量)特征基向量(eigenbasis)

11 抽象向量空间

12 克莱默法则

一般线性变换会导致其点积变化，不变的就是正交变换(orthonormal transformation)
正交变换(基向量长度不变并且保持角度)，可以想象为刚体的旋转，任何质点间的相对位移都不变
一种向量坐标的表示方法

fourier transform

不同频率的信号混合在一起,可以分离开来
将信号"缠"在圆上,向量长度即为信号值
将其想象为带有质量的物体:通常缠绕方式下质量分步较均匀

如何将"缠绕"与计算联系起来: $e^{\theta i}$ :单位圆沿逆时针转这么多弧度所产生的复数
质心:积分除长度

卷积

lead in:row two dice and count for the probability of number
倒序对齐,乘积求和
也可以正序,二维,找对角线
当一个为短序列并且元素和为1,可以视为在窗口内的滑动平均
两种选择:高斯或者一边正一边负
- 上下区分:用于检测图像的纵向的边缘

Author: yx s

Link: https://neu-china-top-fei.github.io/2026/01/22/linear%20algebra&3b1b/

Copyright Notice: All articles on this blog are licensed under CC BY-NC-SA 4.0 unless otherwise stated.

math supplement

Loading Database