CE7453 Numerical Algorithms 期末高分超详细攻略(第六章:Eigenanalysis)

本章内容:特征值与特征向量、幂迭代、QR算法、PageRank
适用对象:零基础/考前冲刺/快速查漏补缺
内容特色:详细原理、公式推导、算法流程、例题全解、英文关键词


1. 基本概念与背景

  • 特征值与特征向量(Eigenvalue & Eigenvector):对于 矩阵 ,如果存在非零向量 和标量 使 ,则 为特征值, 为对应特征向量。
  • 实际应用:PCA主成分分析、PageRank、振动分析、图像处理、机器学习等。
  • 数学意义:特征值表示矩阵在某些方向上的缩放因子,特征向量表示这些方向。特征分解可以帮助理解矩阵的性质和行为。

特征值分解(Eigenvalue Decomposition): 如果矩阵 可对角化,则可以表示为 ,其中 是特征向量组成的矩阵, 是特征值组成对角矩阵。这种分解在求矩阵幂、解微分方程等场景中非常有用。


2. 幂迭代法(Power Iteration)

2.1 原理

  • 用于求最大模特征值(dominant eigenvalue)及其对应的特征向量。
  • 基本思想是通过反复用矩阵 作用于初始向量,逐步放大主特征分量(与最大特征值对应的分量),最终收敛到主特征向量。
  • 数学依据:假设矩阵 有特征值 ,且 ,初始向量 可以表示为特征向量的线性组合 ,则 (当 很大时),即收敛到主特征向量方向。

2.2 算法流程

  1. 选择一个非零初始向量 (通常随机选择或全为1)。
  2. 归一化 ,以避免数值过大或过小。
  3. 迭代:计算
  4. 归一化 ,得到单位向量。
  5. 检查收敛性:若 (或达到最大迭代次数),则停止迭代。
  6. 计算特征值近似:(Rayleigh quotient,瑞利商)。

注意事项

  • 初始向量不能与主特征向量正交,否则无法收敛到最大特征值。
  • 收敛速度取决于特征值之间的比值 ,比值越小,收敛越快。

2.3 例题

例题1:给定矩阵 ,初始向量 ,用幂迭代法求最大特征值及其特征向量。

详细解答

  1. 初始化,归一化后仍为 (因为 )。
  2. 第一次迭代
    • 计算
    • 归一化:,所以
  3. 第二次迭代
    • 计算
    • 归一化:,所以
  4. 第三次迭代
    • 计算
    • 归一化:,所以
  5. 第四次迭代
    • 计算
    • 归一化:,所以
  6. 第五次迭代
    • 计算
    • 归一化:,所以
  7. 收敛检查:继续迭代,向量逐渐接近 (即 归一化后),说明收敛到主特征向量。
  8. 计算特征值:使用瑞利商,
    • 因此

答案:最大特征值约为 ,对应特征向量为 (未归一化形式)。

验证:直接计算特征值, 的特征方程为 ,解得 ,与幂迭代结果一致。


3. QR算法(QR Algorithm)

3.1 原理

  • QR算法是一种求解矩阵所有特征值的迭代方法,特别适合对称矩阵。
  • 基本思想:通过反复对矩阵进行QR分解(将矩阵分解为正交矩阵 和上三角矩阵 的乘积),并重新组合为 ,最终使矩阵收敛到对角形式(或近似对角形式),对角线元素即为特征值。
  • 数学依据:QR算法本质上是幂法的扩展,同时对所有特征值进行迭代,收敛后矩阵变为上三角或对角矩阵。

3.2 算法流程

  1. 初始化:令
  2. 对当前矩阵 进行QR分解:(其中 是正交矩阵, 是上三角矩阵)。
  3. 计算新的矩阵:
  4. 重复步骤2和3,直到 近似为对角矩阵(或达到最大迭代次数),对角线上的元素即为特征值的近似值。

注意事项

  • 对于对称矩阵,QR算法会收敛到对角矩阵;对于非对称矩阵,收敛到上三角矩阵(Schur形式)。
  • 实际应用中常结合Hessenberg化(将矩阵化为上Hessenberg形式)和位移策略(shift)来加速收敛。

3.3 例题

例题2:使用QR算法计算矩阵 的特征值。

详细解答

  1. 初始化
  2. 第一次迭代
    • 进行QR分解:
      • 使用Gram-Schmidt正交化或其他方法,得到 (近似值)。
    • 计算
  3. 第二次迭代
    • 进行QR分解,得到新的
    • 计算 ,结果更接近对角矩阵。
  4. 继续迭代:经过多次迭代,矩阵逐渐收敛到 ,即特征值为

答案:特征值为

验证:直接计算特征方程 ,解得 ,与QR算法结果一致。


4. PageRank 算法(Google 搜索排序)

4.1 背景

  • PageRank 是Google搜索引擎的核心算法之一,用于评估网页的重要性。
  • 基本思想:网页的重要性取决于链接到该网页的其他网页数量和重要性,本质上是求网页链接矩阵的主特征向量。
  • 数学模型:设 为转移概率矩阵(网页之间的链接概率),PageRank向量 满足 ,即 是矩阵 对应特征值 的特征向量。

4.2 算法流程

  1. 构造转移矩阵 表示从网页 链接到网页 的概率(若网页 个外链,则每个外链概率为 )。
  2. 选择初始向量 (通常为均匀分布,即每个网页初始重要性相等)。
  3. 迭代:
  4. 归一化 ,确保向量元素之和为1。
  5. 收敛后, 的各个分量即为各网页的PageRank值(排名分数)。

阻尼因子(Damping Factor)

  • 实际中引入阻尼因子 (通常为0.85),以模拟用户随机跳转行为,修正公式为 ,其中 为网页总数。
  • 这保证了矩阵的收敛性,避免某些网页没有外链导致的问题。

4.3 例题

例题3:假设有3个网页,链接关系如下:网页1链接到2和3,网页2链接到3,网页3链接到1。计算各网页的PageRank值(忽略阻尼因子)。

详细解答

  1. 构造转移矩阵
    • 网页1有2个外链(到2和3),所以
    • 网页2有1个外链(到3),所以
    • 网页3有1个外链(到1),所以
    • 转移矩阵
  2. 初始化
  3. 第一次迭代
    • 归一化(可选,此处不归一化以观察收敛)。
  4. 第二次迭代
  5. 继续迭代:经过多次迭代, 收敛到 (近似值)。

答案:网页1的PageRank值为 ,网页2的值为 ,网页3的值为 ,因此网页1和网页3最重要且同等重要。


5. 修正例题:幂迭代法

例题4(修正新增例题3):计算矩阵 的最大特征值及其特征向量。

详细解答

  1. 初始化,归一化后仍为
  2. 第一次迭代
    • 归一化:
  3. 第二次迭代
    • 归一化:
  4. 第三次迭代
    • 归一化:
  5. 继续迭代:向量逐渐收敛到 ,即未归一化形式为 或近似
  6. 计算特征值,取
    • 因此

答案:最大特征值约为 ,对应特征向量为 (近似值)。

验证:特征方程 ,解得 ,即 ,与幂迭代结果一致。


6. 常见考点与易错点

  • 幂迭代法:初始向量不能与主特征向量正交,否则无法收敛到最大特征值;收敛速度受特征值比值影响。
  • QR算法:只适合小规模矩阵或对称矩阵,实际应用中需结合位移策略;理解QR分解的正交性和收敛原理。
  • 特征值/向量定义与实际意义:特征值分解在矩阵分析和应用中的重要性。
  • PageRank:转移矩阵的构造方法,阻尼因子的作用,归一化的必要性。
  • 英文术语拼写与公式记忆:确保考试中能准确写出专业术语和公式。

7. 英文关键词与表达

  • eigenvalue, eigenvector, power iteration, Rayleigh quotient, QR algorithm, diagonalization, convergence, PageRank, principal component analysis (PCA), dominant eigenvalue, damping factor, transition matrix

如需更详细例题推导或某一算法的代码实现,可随时补充!