CE7453 Numerical Algorithms 期末高分超详细攻略(第六章:Eigenanalysis)
本章内容:特征值与特征向量、幂迭代、QR算法、PageRank
适用对象:零基础/考前冲刺/快速查漏补缺
内容特色:详细原理、公式推导、算法流程、例题全解、英文关键词
1. 基本概念与背景
- 特征值与特征向量(Eigenvalue & Eigenvector):对于 矩阵 ,如果存在非零向量 和标量 使 ,则 为特征值, 为对应特征向量。
- 实际应用:PCA主成分分析、PageRank、振动分析、图像处理、机器学习等。
- 数学意义:特征值表示矩阵在某些方向上的缩放因子,特征向量表示这些方向。特征分解可以帮助理解矩阵的性质和行为。
特征值分解(Eigenvalue Decomposition): 如果矩阵 可对角化,则可以表示为 ,其中 是特征向量组成的矩阵, 是特征值组成对角矩阵。这种分解在求矩阵幂、解微分方程等场景中非常有用。
2. 幂迭代法(Power Iteration)
2.1 原理
- 用于求最大模特征值(dominant eigenvalue)及其对应的特征向量。
- 基本思想是通过反复用矩阵 作用于初始向量,逐步放大主特征分量(与最大特征值对应的分量),最终收敛到主特征向量。
- 数学依据:假设矩阵 有特征值 ,且 ,初始向量 可以表示为特征向量的线性组合 ,则 (当 很大时),即收敛到主特征向量方向。
2.2 算法流程
- 选择一个非零初始向量 (通常随机选择或全为1)。
- 归一化 ,以避免数值过大或过小。
- 迭代:计算 。
- 归一化 ,得到单位向量。
- 检查收敛性:若 (或达到最大迭代次数),则停止迭代。
- 计算特征值近似:(Rayleigh quotient,瑞利商)。
注意事项:
- 初始向量不能与主特征向量正交,否则无法收敛到最大特征值。
- 收敛速度取决于特征值之间的比值 ,比值越小,收敛越快。
2.3 例题
例题1:给定矩阵 ,初始向量 ,用幂迭代法求最大特征值及其特征向量。
详细解答:
- 初始化:,归一化后仍为 (因为 )。
- 第一次迭代:
- 计算 。
- 归一化:,所以 。
- 第二次迭代:
- 计算 。
- 归一化:,所以 。
- 第三次迭代:
- 计算 。
- 归一化:,所以 。
- 第四次迭代:
- 计算 。
- 归一化:,所以 。
- 第五次迭代:
- 计算 。
- 归一化:,所以 。
- 收敛检查:继续迭代,向量逐渐接近 (即 归一化后),说明收敛到主特征向量。
- 计算特征值:使用瑞利商,。
- 。
- 。
- 。
- 因此 。
答案:最大特征值约为 ,对应特征向量为 (未归一化形式)。
验证:直接计算特征值, 的特征方程为 ,解得 或 ,与幂迭代结果一致。
3. QR算法(QR Algorithm)
3.1 原理
- QR算法是一种求解矩阵所有特征值的迭代方法,特别适合对称矩阵。
- 基本思想:通过反复对矩阵进行QR分解(将矩阵分解为正交矩阵 和上三角矩阵 的乘积),并重新组合为 ,最终使矩阵收敛到对角形式(或近似对角形式),对角线元素即为特征值。
- 数学依据:QR算法本质上是幂法的扩展,同时对所有特征值进行迭代,收敛后矩阵变为上三角或对角矩阵。
3.2 算法流程
- 初始化:令 。
- 对当前矩阵 进行QR分解:(其中 是正交矩阵, 是上三角矩阵)。
- 计算新的矩阵:。
- 重复步骤2和3,直到 近似为对角矩阵(或达到最大迭代次数),对角线上的元素即为特征值的近似值。
注意事项:
- 对于对称矩阵,QR算法会收敛到对角矩阵;对于非对称矩阵,收敛到上三角矩阵(Schur形式)。
- 实际应用中常结合Hessenberg化(将矩阵化为上Hessenberg形式)和位移策略(shift)来加速收敛。
3.3 例题
例题2:使用QR算法计算矩阵 的特征值。
详细解答:
- 初始化:。
- 第一次迭代:
- 对 进行QR分解:
- 使用Gram-Schmidt正交化或其他方法,得到 ,(近似值)。
- 计算 。
- 对 进行QR分解:
- 第二次迭代:
- 对 进行QR分解,得到新的 和 。
- 计算 ,结果更接近对角矩阵。
- 继续迭代:经过多次迭代,矩阵逐渐收敛到 ,即特征值为 和 。
答案:特征值为 ,。
验证:直接计算特征方程 ,解得 或 ,与QR算法结果一致。
4. PageRank 算法(Google 搜索排序)
4.1 背景
- PageRank 是Google搜索引擎的核心算法之一,用于评估网页的重要性。
- 基本思想:网页的重要性取决于链接到该网页的其他网页数量和重要性,本质上是求网页链接矩阵的主特征向量。
- 数学模型:设 为转移概率矩阵(网页之间的链接概率),PageRank向量 满足 ,即 是矩阵 对应特征值 的特征向量。
4.2 算法流程
- 构造转移矩阵 : 表示从网页 链接到网页 的概率(若网页 有 个外链,则每个外链概率为 )。
- 选择初始向量 (通常为均匀分布,即每个网页初始重要性相等)。
- 迭代:。
- 归一化 ,确保向量元素之和为1。
- 收敛后, 的各个分量即为各网页的PageRank值(排名分数)。
阻尼因子(Damping Factor):
- 实际中引入阻尼因子 (通常为0.85),以模拟用户随机跳转行为,修正公式为 ,其中 为网页总数。
- 这保证了矩阵的收敛性,避免某些网页没有外链导致的问题。
4.3 例题
例题3:假设有3个网页,链接关系如下:网页1链接到2和3,网页2链接到3,网页3链接到1。计算各网页的PageRank值(忽略阻尼因子)。
详细解答:
- 构造转移矩阵 :
- 网页1有2个外链(到2和3),所以 ,,。
- 网页2有1个外链(到3),所以 ,,。
- 网页3有1个外链(到1),所以 ,,。
- 转移矩阵 。
- 初始化:。
- 第一次迭代:
- 。
- 归一化(可选,此处不归一化以观察收敛)。
- 第二次迭代:
- 。
- 继续迭代:经过多次迭代, 收敛到 (近似值)。
答案:网页1的PageRank值为 ,网页2的值为 ,网页3的值为 ,因此网页1和网页3最重要且同等重要。
5. 修正例题:幂迭代法
例题4(修正新增例题3):计算矩阵 的最大特征值及其特征向量。
详细解答:
- 初始化:,归一化后仍为 。
- 第一次迭代:
- 。
- 归一化:,。
- 第二次迭代:
- 。
- 归一化:,。
- 第三次迭代:
- 。
- 归一化:,。
- 继续迭代:向量逐渐收敛到 ,即未归一化形式为 或近似 。
- 计算特征值:,取 :
- 。
- 。
- 。
- 因此 。
答案:最大特征值约为 ,对应特征向量为 (近似值)。
验证:特征方程 ,解得 ,即 或 ,与幂迭代结果一致。
6. 常见考点与易错点
- 幂迭代法:初始向量不能与主特征向量正交,否则无法收敛到最大特征值;收敛速度受特征值比值影响。
- QR算法:只适合小规模矩阵或对称矩阵,实际应用中需结合位移策略;理解QR分解的正交性和收敛原理。
- 特征值/向量定义与实际意义:特征值分解在矩阵分析和应用中的重要性。
- PageRank:转移矩阵的构造方法,阻尼因子的作用,归一化的必要性。
- 英文术语拼写与公式记忆:确保考试中能准确写出专业术语和公式。
7. 英文关键词与表达
- eigenvalue, eigenvector, power iteration, Rayleigh quotient, QR algorithm, diagonalization, convergence, PageRank, principal component analysis (PCA), dominant eigenvalue, damping factor, transition matrix
如需更详细例题推导或某一算法的代码实现,可随时补充!