# 本章精读 · 第 6 课（回归指标 · 聚类 · PCA）

## 本章定位与前情提要

本章是在 **`class-04-ml` / `class-05-ml`** 之上的「专题折叠」：**回归误差度量细节**、**聚类内外指标直觉**、以及再次夯实 **PCA 的定位**。题干里的公式恢复题常在考查你是否能把符号写回语义（预测误差／中心化／投影）。

### 最小术语表

- **MSE**：均方误差 \(\frac{1}{n}\sum_i (\hat{y}_i-y_i)^2\)。
- **MAE**：平均绝对误差，对离群点不如平方惩罚激进。
- **RMSE**：MSE 平方根，单位回到标签量级便于解释。
- **簇内紧致／簇间分离**：聚类评价的内部叙事轴。
- **PCA 主成分**：方差极大方向的线性组合投影叙述。

---

## 第一节 · 回归指标为什么不只「一个数」

平方惩罚对大误差更敏感——风控语境有时会改用稳健度量。**不要被单一指标绑架结论**：要结合分布与业务代价函数。

---

## 第二节 · 聚类评价：内外有别

内部指标（轮廓系数等）刻画几何紧致度；**不等价于下游监督任务优劣**。题干若在辨析这一点，答案是层级澄清而非数值迷信。

---

## 第三节 · PCA 三步心智

1. 中心化数据。
2. 构造协方差结构／奇异值叙事。
3. 取 top‑k 方向投影。

PCA **不提供类别判别边界本身的标签语义**——除非后续再接监督模型。

---

## 与本章测验怎么对齐

公式题：**先把维度对齐**（样本维 vs 特征维），再代入叙述选项对照符号陷阱。

---

## 延伸阅读

纲要 **`topic-3`**。
