CE7453 Numerical Algorithms 期末高分超详细攻略（第六章：Eigenanalysis）

本章内容：特征值与特征向量、幂迭代、QR算法、PageRank
适用对象：零基础/考前冲刺/快速查漏补缺
内容特色：详细原理、公式推导、算法流程、例题全解、英文关键词

1. 基本概念与背景

特征值与特征向量（Eigenvalue & Eigenvector）：对于 $n \times n$ 矩阵 $A$ ，如果存在非零向量 $x$ 和标量 $λ$ 使 $A x = λ x$ ，则 $λ$ 为特征值， $x$ 为对应特征向量。
实际应用：PCA主成分分析、PageRank、振动分析、图像处理、机器学习等。
数学意义：特征值表示矩阵在某些方向上的缩放因子，特征向量表示这些方向。特征分解可以帮助理解矩阵的性质和行为。

特征值分解（Eigenvalue Decomposition）：如果矩阵 $A$ 可对角化，则可以表示为 $A = Q Λ Q^{- 1}$ ，其中 $Q$ 是特征向量组成的矩阵， $Λ$ 是特征值组成对角矩阵。这种分解在求矩阵幂、解微分方程等场景中非常有用。

2. 幂迭代法（Power Iteration）

2.1 原理

用于求最大模特征值（dominant eigenvalue）及其对应的特征向量。
基本思想是通过反复用矩阵 $A$ 作用于初始向量，逐步放大主特征分量（与最大特征值对应的分量），最终收敛到主特征向量。
数学依据：假设矩阵 $A$ 有特征值 $λ_{1}, λ_{2}, ..., λ_{n}$ ，且 $∣ λ_{1} ∣ > ∣ λ_{2} ∣ \geq ... \geq ∣ λ_{n} ∣$ ，初始向量 $x_{0}$ 可以表示为特征向量的线性组合 $x_{0} = c_{1} v_{1} + c_{2} v_{2} + ... + c_{n} v_{n}$ ，则 $A^{k} x_{0} \approx c_{1} λ_{1}^{k} v_{1}$ （当 $k$ 很大时），即收敛到主特征向量方向。

2.2 算法流程

选择一个非零初始向量 $x_{0}$ （通常随机选择或全为1）。
归一化 $x_{0}$ ，以避免数值过大或过小。
迭代：计算 $x_{k + 1} = A x_{k}$ 。
归一化 $x_{k + 1}$ ，得到单位向量。
检查收敛性：若 $∣∣ x_{k + 1} - x_{k} ∣∣ < ϵ$ （或达到最大迭代次数），则停止迭代。
计算特征值近似： $λ \approx \frac{x _{k}^{T} A x _{k}}{x _{k}^{T} x _{k}}$ （Rayleigh quotient，瑞利商）。

注意事项：

初始向量不能与主特征向量正交，否则无法收敛到最大特征值。
收敛速度取决于特征值之间的比值 $∣ λ_{2} / λ_{1} ∣$ ，比值越小，收敛越快。

2.3 例题

例题1：给定矩阵 $A = [2112]$ ，初始向量 $x_{0} = [10]$ ，用幂迭代法求最大特征值及其特征向量。

详细解答：

初始化： $x_{0} = [10]$ ，归一化后仍为 $[10]$ （因为 $∣∣ x_{0} ∣ ∣_{2} = 1$ ）。
第一次迭代：
- 计算 $x_{1} = A x_{0} = [2112] [10] = [21]$ 。
- 归一化： $∣∣ x_{1} ∣ ∣_{2} = 2^{2} + 1^{2} = 5 \approx 2.236$ ，所以 $x_{1} = [2/2.236 1/2.236] \approx [0.894 0.447]$ 。
第二次迭代：
- 计算 $x_{2} = A x_{1} = [2112] [0.894 0.447] = [2 * 0.894 + 1 * 0.447 1 * 0.894 + 2 * 0.447] = [2.235 1.788]$ 。
- 归一化： $∣∣ x_{2} ∣ ∣_{2} = 2.23 5^{2} + 1.78 8^{2} \approx 2.86$ ，所以 $x_{2} \approx [0.781 0.625]$ 。
第三次迭代：
- 计算 $x_{3} = A x_{2} \approx [2 * 0.781 + 1 * 0.625 1 * 0.781 + 2 * 0.625] = [2.187 2.031]$ 。
- 归一化： $∣∣ x_{3} ∣ ∣_{2} \approx 2.98$ ，所以 $x_{3} \approx [0.734 0.681]$ 。
第四次迭代：
- 计算 $x_{4} = A x_{3} \approx [2 * 0.734 + 1 * 0.681 1 * 0.734 + 2 * 0.681] = [2.149 2.096]$ 。
- 归一化： $∣∣ x_{4} ∣ ∣_{2} \approx 3.00$ ，所以 $x_{4} \approx [0.716 0.698]$ 。
第五次迭代：
- 计算 $x_{5} = A x_{4} \approx [2 * 0.716 + 1 * 0.698 1 * 0.716 + 2 * 0.698] = [2.130 2.112]$ 。
- 归一化： $∣∣ x_{5} ∣ ∣_{2} \approx 3.00$ ，所以 $x_{5} \approx [0.710 0.704]$ 。
收敛检查：继续迭代，向量逐渐接近 $[0.707 0.707]$ （即 $[11]$ 归一化后），说明收敛到主特征向量。
计算特征值：使用瑞利商， $λ \approx \frac{x _{5}^{T} A x _{5}}{x _{5}^{T} x _{5}}$ 。
- $A x_{5} \approx [2 * 0.710 + 1 * 0.704 1 * 0.710 + 2 * 0.704] = [2.124 2.118]$ 。
- $x_{5}^{T} A x_{5} \approx 0.710 * 2.124 + 0.704 * 2.118 \approx 3.000$ 。
- $x_{5}^{T} x_{5} = 0.71 0^{2} + 0.70 4^{2} \approx 1$ 。
- 因此 $λ \approx 3$ 。

答案：最大特征值约为 $λ = 3$ ，对应特征向量为 $[11]$ （未归一化形式）。

验证：直接计算特征值， $A$ 的特征方程为 $det (A - λ I) = (2 - λ)^{2} - 1 = 0$ ，解得 $λ = 3$ 或 $λ = 1$ ，与幂迭代结果一致。

3. QR算法（QR Algorithm）

3.1 原理

QR算法是一种求解矩阵所有特征值的迭代方法，特别适合对称矩阵。
基本思想：通过反复对矩阵进行QR分解（将矩阵分解为正交矩阵 $Q$ 和上三角矩阵 $R$ 的乘积），并重新组合为 $A_{k + 1} = R_{k} Q_{k}$ ，最终使矩阵收敛到对角形式（或近似对角形式），对角线元素即为特征值。
数学依据：QR算法本质上是幂法的扩展，同时对所有特征值进行迭代，收敛后矩阵变为上三角或对角矩阵。

3.2 算法流程

初始化：令 $A_{0} = A$ 。
对当前矩阵 $A_{k}$ 进行QR分解： $A_{k} = Q_{k} R_{k}$ （其中 $Q_{k}$ 是正交矩阵， $R_{k}$ 是上三角矩阵）。
计算新的矩阵： $A_{k + 1} = R_{k} Q_{k}$ 。
重复步骤2和3，直到 $A_{k}$ 近似为对角矩阵（或达到最大迭代次数），对角线上的元素即为特征值的近似值。

注意事项：

对于对称矩阵，QR算法会收敛到对角矩阵；对于非对称矩阵，收敛到上三角矩阵（Schur形式）。
实际应用中常结合Hessenberg化（将矩阵化为上Hessenberg形式）和位移策略（shift）来加速收敛。

3.3 例题

例题2：使用QR算法计算矩阵 $A = [5445]$ 的特征值。

详细解答：

初始化： $A_{0} = [5445]$ 。
第一次迭代：
- 对 $A_{0}$ 进行QR分解：
  - 使用Gram-Schmidt正交化或其他方法，得到 $Q_{0} = [0.707 0.707 - 0.707 0.707]$ ， $R_{0} = [7.071 0 6.364 1.414]$ （近似值）。
- 计算 $A_{1} = R_{0} Q_{0} = [7.071 0 6.364 1.414] [0.707 0.707 - 0.707 0.707] \approx [9.5 1.0 - 0.5 0.5]$ 。
第二次迭代：
- 对 $A_{1}$ 进行QR分解，得到新的 $Q_{1}$ 和 $R_{1}$ 。
- 计算 $A_{2} = R_{1} Q_{1}$ ，结果更接近对角矩阵。
继续迭代：经过多次迭代，矩阵逐渐收敛到 $[9001]$ ，即特征值为 $9$ 和 $1$ 。

答案：特征值为 $λ_{1} = 9$ ， $λ_{2} = 1$ 。

验证：直接计算特征方程 $det (A - λ I) = (5 - λ)^{2} - 16 = 0$ ，解得 $λ = 9$ 或 $λ = 1$ ，与QR算法结果一致。

4. PageRank 算法（Google 搜索排序）

4.1 背景

PageRank 是Google搜索引擎的核心算法之一，用于评估网页的重要性。
基本思想：网页的重要性取决于链接到该网页的其他网页数量和重要性，本质上是求网页链接矩阵的主特征向量。
数学模型：设 $P$ 为转移概率矩阵（网页之间的链接概率），PageRank向量 $r$ 满足 $P r = r$ ，即 $r$ 是矩阵 $P$ 对应特征值 $λ = 1$ 的特征向量。

4.2 算法流程

构造转移矩阵 $P$ ： $P_{ij}$ 表示从网页 $j$ 链接到网页 $i$ 的概率（若网页 $j$ 有 $k$ 个外链，则每个外链概率为 $1/ k$ ）。
选择初始向量 $r_{0}$ （通常为均匀分布，即每个网页初始重要性相等）。
迭代： $r_{k + 1} = P r_{k}$ 。
归一化 $r_{k + 1}$ ，确保向量元素之和为1。
收敛后， $r$ 的各个分量即为各网页的PageRank值（排名分数）。

阻尼因子（Damping Factor）：

实际中引入阻尼因子 $d$ （通常为0.85），以模拟用户随机跳转行为，修正公式为 $r = (1 - d) / n + d P r$ ，其中 $n$ 为网页总数。
这保证了矩阵的收敛性，避免某些网页没有外链导致的问题。

4.3 例题

例题3：假设有3个网页，链接关系如下：网页1链接到2和3，网页2链接到3，网页3链接到1。计算各网页的PageRank值（忽略阻尼因子）。

详细解答：

构造转移矩阵 $P$ ：
- 网页1有2个外链（到2和3），所以 $P_{21} = 0.5$ ， $P_{31} = 0.5$ ， $P_{11} = 0$ 。
- 网页2有1个外链（到3），所以 $P_{32} = 1$ ， $P_{12} = 0$ ， $P_{22} = 0$ 。
- 网页3有1个外链（到1），所以 $P_{13} = 1$ ， $P_{23} = 0$ ， $P_{33} = 0$ 。
- 转移矩阵 $P = 0 0.5 0.5 001100$ 。
初始化： $r_{0} = 1/3 1/3 1/3$ 。
第一次迭代：
- $r_{1} = P r_{0} = 0 0.5 0.5 001100 1/3 1/3 1/3 = 1/3 1/6 1/2$ 。
- 归一化（可选，此处不归一化以观察收敛）。
第二次迭代：
- $r_{2} = P r_{1} = 0 0.5 0.5 001100 1/3 1/6 1/2 = 1/2 1/6 1/3$ 。
继续迭代：经过多次迭代， $r$ 收敛到 $0.4 0.2 0.4$ （近似值）。

答案：网页1的PageRank值为 $0.4$ ，网页2的值为 $0.2$ ，网页3的值为 $0.4$ ，因此网页1和网页3最重要且同等重要。

5. 修正例题：幂迭代法

例题4（修正新增例题3）：计算矩阵 $A = [4113]$ 的最大特征值及其特征向量。

详细解答：

初始化： $x_{0} = [10]$ ，归一化后仍为 $[10]$ 。
第一次迭代：
- $x_{1} = A x_{0} = [4113] [10] = [41]$ 。
- 归一化： $∣∣ x_{1} ∣ ∣_{2} = 16 + 1 = 17 \approx 4.123$ ， $x_{1} \approx [0.970 0.243]$ 。
第二次迭代：
- $x_{2} = A x_{1} \approx [4 * 0.970 + 1 * 0.243 1 * 0.970 + 3 * 0.243] = [4.123 1.699]$ 。
- 归一化： $∣∣ x_{2} ∣ ∣_{2} \approx 4.456$ ， $x_{2} \approx [0.925 0.381]$ 。
第三次迭代：
- $x_{3} = A x_{2} \approx [4 * 0.925 + 1 * 0.381 1 * 0.925 + 3 * 0.381] = [4.081 2.068]$ 。
- 归一化： $∣∣ x_{3} ∣ ∣_{2} \approx 4.564$ ， $x_{3} \approx [0.894 0.453]$ 。
继续迭代：向量逐渐收敛到 $[0.850 0.527]$ ，即未归一化形式为 $[1.615 1]$ 或近似 $[1.618 1]$ 。
计算特征值： $λ \approx \frac{x _{k}^{T} A x _{k}}{x _{k}^{T} x _{k}}$ ，取 $x_{k} \approx [0.850 0.527]$ ：
- $A x_{k} \approx [4 * 0.850 + 1 * 0.527 1 * 0.850 + 3 * 0.527] = [3.927 2.431]$ 。
- $x_{k}^{T} A x_{k} \approx 0.850 * 3.927 + 0.527 * 2.431 \approx 4.618$ 。
- $x_{k}^{T} x_{k} = 0.85 0^{2} + 0.52 7^{2} \approx 1$ 。
- 因此 $λ \approx 4.618$ 。

答案：最大特征值约为 $λ \approx 4.618$ ，对应特征向量为 $[1.618 1]$ （近似值）。

验证：特征方程 $det (A - λ I) = (4 - λ) (3 - λ) - 1 = λ^{2} - 7 λ + 11 = 0$ ，解得 $λ = \frac{7 \pm 5}{2}$ ，即 $λ \approx 4.618$ 或 $λ \approx 2.382$ ，与幂迭代结果一致。

6. 常见考点与易错点

幂迭代法：初始向量不能与主特征向量正交，否则无法收敛到最大特征值；收敛速度受特征值比值影响。
QR算法：只适合小规模矩阵或对称矩阵，实际应用中需结合位移策略；理解QR分解的正交性和收敛原理。
特征值/向量定义与实际意义：特征值分解在矩阵分析和应用中的重要性。
PageRank：转移矩阵的构造方法，阻尼因子的作用，归一化的必要性。
英文术语拼写与公式记忆：确保考试中能准确写出专业术语和公式。

7. 英文关键词与表达

eigenvalue, eigenvector, power iteration, Rayleigh quotient, QR algorithm, diagonalization, convergence, PageRank, principal component analysis (PCA), dominant eigenvalue, damping factor, transition matrix

如需更详细例题推导或某一算法的代码实现，可随时补充！

CE7453 Numerical Algorithms Notes