上传者: sinat_21706867
|
上传时间: 2022-05-18 19:08:04
|
文件大小: 1.38MB
|
文件类型: PDF
中文翻译Introduction to Linear Algebra, 5th Edition 7.3节,仅用于交流学习!
本节阐述 SVD 在统计学与数据分析中的一个主要应用。我们的示例将来源于人类遗传、面部识别
及金融。问题在于理解一个大的数据矩阵(= 测量值)
。对 n 个样本的每一个,我们测量 m 个变量。数
据矩阵 A 0 具有 n 列和 m 行。
通过图像,A 0 的列是 R m 里的 n 个点。在我们减去各行的平均值后得到 A,其 n 个点通常沿着
一条直线或接近一个平面(或 R m 的其它低维子空间)聚集。这条直线或平面或子空间是什么?
允许我从一个图片而不是数字开始。对于如年龄和身高的 m = 2 个变量,其 n 个点位于 R 2 平面。
减去平均年龄和平均身高来中心化数据。假设 n 个中心化后的点沿某条直线聚集,那线性代数如何找
出那条直线呢?