{
  "slug": "class-04-ml",
  "title": "第四次课 · 机器学习",
  "subtitle": "第4课 · ML · 班级测验整理",
  "sourceFiles": [
    "docs/class_quiz/04-机器学习.md"
  ],
  "essenceTopicIds": [
    "topic-3"
  ],
  "topics": {
    "covered": [
      "监督/无监督/强化概览",
      "经典 ML 算法与评估"
    ],
    "followUp": [
      "集成学习与实践调参"
    ]
  },
  "totalQuestions": 31,
  "quiz": [
    {
      "id": "class-04-ml-q1",
      "number": 1,
      "kind": "single",
      "question": "机器学习区别于传统编程的核心特征是",
      "hint": "传统编程依赖人为编写规则，机器学习通过数据自动学习规律，这是核心区别。",
      "options": [
        {
          "id": "class-04-ml-q1-A",
          "text": "使用高级编程语言",
          "isCorrect": false,
          "rationale": "使用高级编程语言侧重的是另一个机制或层级：与材料中强调的「机器学习区别于传统编程的核心特征是」「传统编程依赖人为编写规则」不一致；解析核心是「传统编程依赖人为编写规则，机器学习通过数据自动学习规律，这是核心区别。」，因此更合适的是 B（通过数据学习规律而非显式编程规则）。"
        },
        {
          "id": "class-04-ml-q1-B",
          "text": "通过数据学习规律而非显式编程规则",
          "isCorrect": true,
          "rationale": "传统编程依赖人为编写规则，机器学习通过数据自动学习规律，这是核心区别。 请回到题干限定条件：把「外延更大的表述」或「跳跃的前提」逐项排除后再选。"
        },
        {
          "id": "class-04-ml-q1-C",
          "text": "运行速度更快",
          "isCorrect": false,
          "rationale": "易混点往往在概念边界：此处 运行速度更快会引入多余假设或跳过关键前提；请以「传统编程依赖人为编写规则，机器学习通过数据自动学习规律，这是核心区别。」为轴对照 B。"
        },
        {
          "id": "class-04-ml-q1-D",
          "text": "不需要数学基础",
          "isCorrect": false,
          "rationale": "不需要数学基础更像干扰项的常见套路（扩大/偷换适用范围）；与材料中强调的「机器学习区别于传统编程的核心特征是」「传统编程依赖人为编写规则」不一致。请以解析「传统编程依赖人为编写规则，机器学习通过数据自动学习规律，这是核心区别。」锁定 B。"
        }
      ],
      "sourceSnippet": "传统编程依赖人为编写规则，机器学习通过数据自动学习规律，这是核心区别。"
    },
    {
      "id": "class-04-ml-q2",
      "number": 2,
      "kind": "single",
      "question": "以下哪个属于监督学习的典型任务?",
      "hint": "A是聚类(无监督)，C是生成(无监督/自监督)，D是降维(无监督)。…（可先想：哪一选项与该句直接矛盾？）",
      "options": [
        {
          "id": "class-04-ml-q2-A",
          "text": "将客户分为不同群组",
          "isCorrect": false,
          "rationale": "将客户分为不同群组侧重的是另一个机制或层级：与材料中强调的「监督学习需要带标签的数据」「预测房价是回归任务」不一致；解析核心是「监督学习需要带标签的数据，预测房价是回归任务，属于监督学习。A是聚类(无监督)，C是生成(无监督/自监督)，D是降维(无监督)。」，因此更合适的是 B（预测房价）。"
        },
        {
          "id": "class-04-ml-q2-B",
          "text": "预测房价",
          "isCorrect": true,
          "rationale": "监督学习需要带标签的数据，预测房价是回归任务，属于监督学习。A是聚类(无监督)，C是生成(无监督/自监督)，D是降维(无监督)。"
        },
        {
          "id": "class-04-ml-q2-C",
          "text": "生成新图片",
          "isCorrect": false,
          "rationale": "易混点往往在概念边界：此处 生成新图片会引入多余假设或跳过关键前提；请以「监督学习需要带标签的数据，预测房价是回归任务，属于监督学习。A是聚类(无监督)，C是生成(无监督/自监督)，D是降维(无监督)。」为轴对照 B。"
        },
        {
          "id": "class-04-ml-q2-D",
          "text": "降维可视化",
          "isCorrect": false,
          "rationale": "降维可视化更像干扰项的常见套路（扩大/偷换适用范围）；与材料中强调的「监督学习需要带标签的数据」「预测房价是回归任务」不一致。请以解析「监督学习需要带标签的数据，预测房价是回归任务，属于监督学习。A是聚类(无监督)，C是生成(无监督/自监督)，D是降维(无监督)。」锁定 B。"
        }
      ],
      "sourceSnippet": "监督学习需要带标签的数据，预测房价是回归任务，属于监督学习。A是聚类(无监督)，C是生成(无监督/自监督)，D是降维(无监督)。"
    },
    {
      "id": "class-04-ml-q3",
      "number": 3,
      "kind": "single",
      "question": "在无监督学习中，常用的任务是",
      "hint": "分类和回归属于监督学习，强化学习是另一范式。…（可先想：哪一选项与该句直接矛盾？）",
      "options": [
        {
          "id": "class-04-ml-q3-A",
          "text": "分类",
          "isCorrect": false,
          "rationale": "分类侧重的是另一个机制或层级：与材料中强调的「在无监督学习中」「常用的任务是」不一致；解析核心是「聚类是无监督学习的典型任务，旨在发现数据的内在分组结构。分类和回归属于监督学习，强化学习是另一范式。」，因此更合适的是 C（聚类）。"
        },
        {
          "id": "class-04-ml-q3-B",
          "text": "回归",
          "isCorrect": false,
          "rationale": "从选项 B 的文面看不出与解析链条的一一对应：与材料中强调的「在无监督学习中」「常用的任务是」不一致；而 C 才覆盖「聚类是无监督学习的典型任务，旨在发现数据的内在分组结构。分类和回归属于监督学习，强化学习是另一范式。」这层判断。"
        },
        {
          "id": "class-04-ml-q3-C",
          "text": "聚类",
          "isCorrect": true,
          "rationale": "聚类是无监督学习的典型任务，旨在发现数据的内在分组结构。分类和回归属于监督学习，强化学习是另一范式。"
        },
        {
          "id": "class-04-ml-q3-D",
          "text": "强化学习",
          "isCorrect": false,
          "rationale": "强化学习更像干扰项的常见套路（扩大/偷换适用范围）；与材料中强调的「在无监督学习中」「常用的任务是」不一致。请以解析「聚类是无监督学习的典型任务，旨在发现数据的内在分组结构。分类和回归属于监督学习，强化学习是另一范式。」锁定 C。"
        }
      ],
      "sourceSnippet": "聚类是无监督学习的典型任务，旨在发现数据的内在分组结构。分类和回归属于监督学习，强化学习是另一范式。"
    },
    {
      "id": "class-04-ml-q4",
      "number": 4,
      "kind": "single",
      "question": "以下哪个场景最适合使用强化学习?",
      "hint": "A和D是监督学习，B是回归(监督学习)。…（可先想：哪一选项与该句直接矛盾？）",
      "options": [
        {
          "id": "class-04-ml-q4-A",
          "text": "识别图片中的猫",
          "isCorrect": false,
          "rationale": "识别图片中的猫侧重的是另一个机制或层级：与材料中强调的「强化学习通过与环境交互获取奖励来学习策略」「机器人控制是经典应用」不一致；解析核心是「强化学习通过与环境交互获取奖励来学习策略，机器人控制是经典应用。A和D是监督学习，B是回归(监督学习)。」，因此更合适的是 C（训练机器人学会走路）。"
        },
        {
          "id": "class-04-ml-q4-B",
          "text": "预测股票价格",
          "isCorrect": false,
          "rationale": "从选项 B 的文面看不出与解析链条的一一对应：与材料中强调的「强化学习通过与环境交互获取奖励来学习策略」「机器人控制是经典应用」不一致；而 C 才覆盖「强化学习通过与环境交互获取奖励来学习策略，机器人控制是经典应用。A和D是监督学习，B是回归(监督学习)。」这层判断。"
        },
        {
          "id": "class-04-ml-q4-C",
          "text": "训练机器人学会走路",
          "isCorrect": true,
          "rationale": "强化学习通过与环境交互获取奖励来学习策略，机器人控制是经典应用。A和D是监督学习，B是回归(监督学习)。"
        },
        {
          "id": "class-04-ml-q4-D",
          "text": "将新闻自动分类",
          "isCorrect": false,
          "rationale": "将新闻自动分类更像干扰项的常见套路（扩大/偷换适用范围）；与材料中强调的「强化学习通过与环境交互获取奖励来学习策略」「机器人控制是经典应用」不一致。请以解析「强化学习通过与环境交互获取奖励来学习策略，机器人控制是经典应用。A和D是监督学习，B是回归(监督学习)。」锁定 C。"
        }
      ],
      "sourceSnippet": "强化学习通过与环境交互获取奖励来学习策略，机器人控制是经典应用。A和D是监督学习，B是回归(监督学习)。"
    },
    {
      "id": "class-04-ml-q5",
      "number": 5,
      "kind": "single",
      "question": "机器学习三要素通常不包括",
      "hint": "硬件是支撑但非要素。…（可先想：哪一选项与该句直接矛盾？）",
      "options": [
        {
          "id": "class-04-ml-q5-A",
          "text": "模型",
          "isCorrect": false,
          "rationale": "模型侧重的是另一个机制或层级：与材料中强调的「机器学习三要素通常不包括」「机器学习三要素为模型」不一致；解析核心是「机器学习三要素为模型、策略和算法。硬件是支撑但非要素。」，因此更合适的是 D（硬件设备）。"
        },
        {
          "id": "class-04-ml-q5-B",
          "text": "策略(学习准则)",
          "isCorrect": false,
          "rationale": "从选项 B 的文面看不出与解析链条的一一对应：与材料中强调的「机器学习三要素通常不包括」「机器学习三要素为模型」不一致；而 D 才覆盖「机器学习三要素为模型、策略和算法。硬件是支撑但非要素。」这层判断。"
        },
        {
          "id": "class-04-ml-q5-C",
          "text": "算法",
          "isCorrect": false,
          "rationale": "易混点往往在概念边界：此处 算法会引入多余假设或跳过关键前提；请以「机器学习三要素为模型、策略和算法。硬件是支撑但非要素。」为轴对照 D。"
        },
        {
          "id": "class-04-ml-q5-D",
          "text": "硬件设备",
          "isCorrect": true,
          "rationale": "机器学习三要素为模型、策略和算法。硬件是支撑但非要素。 请回到题干限定条件：把「外延更大的表述」或「跳跃的前提」逐项排除后再选。"
        }
      ],
      "sourceSnippet": "机器学习三要素为模型、策略和算法。硬件是支撑但非要素。"
    },
    {
      "id": "class-04-ml-q6",
      "number": 6,
      "kind": "single",
      "question": "在机器学习项目流程中，划分训练集、验证集、测试集的目的是",
      "hint": "验证集用于调参，测试集用于最终泛化评估，避免模型对训练集过拟合。",
      "options": [
        {
          "id": "class-04-ml-q6-A",
          "text": "增加数据量",
          "isCorrect": false,
          "rationale": "增加数据量侧重的是另一个机制或层级：与材料中强调的「在机器学习项目流程中」「划分训练集」不一致；解析核心是「验证集用于调参，测试集用于最终泛化评估，避免模型对训练集过拟合。」，因此更合适的是 B（评估模型泛化能力，防止过拟合）。"
        },
        {
          "id": "class-04-ml-q6-B",
          "text": "评估模型泛化能力，防止过拟合",
          "isCorrect": true,
          "rationale": "验证集用于调参，测试集用于最终泛化评估，避免模型对训练集过拟合。 请回到题干限定条件：把「外延更大的表述」或「跳跃的前提」逐项排除后再选。"
        },
        {
          "id": "class-04-ml-q6-C",
          "text": "加快训练速度",
          "isCorrect": false,
          "rationale": "易混点往往在概念边界：此处 加快训练速度会引入多余假设或跳过关键前提；请以「验证集用于调参，测试集用于最终泛化评估，避免模型对训练集过拟合。」为轴对照 B。"
        },
        {
          "id": "class-04-ml-q6-D",
          "text": "自动选择特征",
          "isCorrect": false,
          "rationale": "自动选择特征更像干扰项的常见套路（扩大/偷换适用范围）；与材料中强调的「在机器学习项目流程中」「划分训练集」不一致。请以解析「验证集用于调参，测试集用于最终泛化评估，避免模型对训练集过拟合。」锁定 B。"
        }
      ],
      "sourceSnippet": "验证集用于调参，测试集用于最终泛化评估，避免模型对训练集过拟合。"
    },
    {
      "id": "class-04-ml-q7",
      "number": 7,
      "kind": "single",
      "question": "特征工程的主要作用不包括",
      "hint": "特征工程是数据预处理和特征构造，不负责自动选择算法。",
      "options": [
        {
          "id": "class-04-ml-q7-A",
          "text": "提高模型性能",
          "isCorrect": false,
          "rationale": "提高模型性能侧重的是另一个机制或层级：与材料中强调的「特征工程的主要作用不包括」「特征工程是数据预处理和特征构造」不一致；解析核心是「特征工程是数据预处理和特征构造，不负责自动选择算法。」，因此更合适的是 C（自动选择算法）。"
        },
        {
          "id": "class-04-ml-q7-B",
          "text": "降低数据维度",
          "isCorrect": false,
          "rationale": "从选项 B 的文面看不出与解析链条的一一对应：与材料中强调的「特征工程的主要作用不包括」「特征工程是数据预处理和特征构造」不一致；而 C 才覆盖「特征工程是数据预处理和特征构造，不负责自动选择算法。」这层判断。"
        },
        {
          "id": "class-04-ml-q7-C",
          "text": "自动选择算法",
          "isCorrect": true,
          "rationale": "特征工程是数据预处理和特征构造，不负责自动选择算法。 请回到题干限定条件：把「外延更大的表述」或「跳跃的前提」逐项排除后再选。"
        },
        {
          "id": "class-04-ml-q7-D",
          "text": "将原始数据转化为更适合模型的形式",
          "isCorrect": false,
          "rationale": "将原始数据转化为更适合模型的形式更像干扰项的常见套路（扩大/偷换适用范围）；与材料中强调的「特征工程的主要作用不包括」「特征工程是数据预处理和特征构造」不一致。请以解析「特征工程是数据预处理和特征构造，不负责自动选择算法。」锁定 C。"
        }
      ],
      "sourceSnippet": "特征工程是数据预处理和特征构造，不负责自动选择算法。"
    },
    {
      "id": "class-04-ml-q8",
      "number": 8,
      "kind": "single",
      "question": "以下哪个步骤通常发生在模型训练之前?",
      "hint": "其他是训练中的步骤。…（可先想：哪一选项与该句直接矛盾？）",
      "options": [
        {
          "id": "class-04-ml-q8-A",
          "text": "计算损失函数",
          "isCorrect": false,
          "rationale": "计算损失函数侧重的是另一个机制或层级：与材料中强调的「划分数据集是数据准备阶段」「早于训练」不一致；解析核心是「划分数据集是数据准备阶段，早于训练。其他是训练中的步骤。」，因此更合适的是 C（划分数据集）。"
        },
        {
          "id": "class-04-ml-q8-B",
          "text": "反向传播",
          "isCorrect": false,
          "rationale": "从选项 B 的文面看不出与解析链条的一一对应：与材料中强调的「划分数据集是数据准备阶段」「早于训练」不一致；而 C 才覆盖「划分数据集是数据准备阶段，早于训练。其他是训练中的步骤。」这层判断。"
        },
        {
          "id": "class-04-ml-q8-C",
          "text": "划分数据集",
          "isCorrect": true,
          "rationale": "划分数据集是数据准备阶段，早于训练。其他是训练中的步骤。 请回到题干限定条件：把「外延更大的表述」或「跳跃的前提」逐项排除后再选。"
        },
        {
          "id": "class-04-ml-q8-D",
          "text": "更新参数",
          "isCorrect": false,
          "rationale": "更新参数更像干扰项的常见套路（扩大/偷换适用范围）；与材料中强调的「划分数据集是数据准备阶段」「早于训练」不一致。请以解析「划分数据集是数据准备阶段，早于训练。其他是训练中的步骤。」锁定 C。"
        }
      ],
      "sourceSnippet": "划分数据集是数据准备阶段，早于训练。其他是训练中的步骤。"
    },
    {
      "id": "class-04-ml-q9",
      "number": 9,
      "kind": "single",
      "question": "在机器学习工作流中，模型评估与选择阶段使用的数据是",
      "hint": "测试集仅用于最终评估，训练集用于学习参数。…（可先想：哪一选项与该句直接矛盾？）",
      "options": [
        {
          "id": "class-04-ml-q9-A",
          "text": "训练集",
          "isCorrect": false,
          "rationale": "训练集侧重的是另一个机制或层级：与材料中强调的「在机器学习工作流中」「模型评估与选择阶段使用的数据是」不一致；解析核心是「验证集用于模型选择和超参数调优。测试集仅用于最终评估，训练集用于学习参数。」，因此更合适的是 B（验证集）。"
        },
        {
          "id": "class-04-ml-q9-B",
          "text": "验证集",
          "isCorrect": true,
          "rationale": "验证集用于模型选择和超参数调优。测试集仅用于最终评估，训练集用于学习参数。"
        },
        {
          "id": "class-04-ml-q9-C",
          "text": "测试集",
          "isCorrect": false,
          "rationale": "易混点往往在概念边界：此处 测试集会引入多余假设或跳过关键前提；请以「验证集用于模型选择和超参数调优。测试集仅用于最终评估，训练集用于学习参数。」为轴对照 B。"
        },
        {
          "id": "class-04-ml-q9-D",
          "text": "全部数据",
          "isCorrect": false,
          "rationale": "全部数据更像干扰项的常见套路（扩大/偷换适用范围）；与材料中强调的「在机器学习工作流中」「模型评估与选择阶段使用的数据是」不一致。请以解析「验证集用于模型选择和超参数调优。测试集仅用于最终评估，训练集用于学习参数。」锁定 B。"
        }
      ],
      "sourceSnippet": "验证集用于模型选择和超参数调优。测试集仅用于最终评估，训练集用于学习参数。"
    },
    {
      "id": "class-04-ml-q10",
      "number": 10,
      "kind": "single",
      "question": "如果模型在训练集上准确率接近100%，但在测试集上准确率很低，这种现象称为",
      "hint": "过拟合表现为模型过于适应训练数据，泛化能力差。",
      "options": [
        {
          "id": "class-04-ml-q10-A",
          "text": "欠拟合",
          "isCorrect": false,
          "rationale": "欠拟合侧重的是另一个机制或层级：与材料中强调的「如果模型在训练集上准确率接近」「但在测试集上准确率很低」不一致；解析核心是「过拟合表现为模型过于适应训练数据，泛化能力差。」，因此更合适的是 B（过拟合）。"
        },
        {
          "id": "class-04-ml-q10-B",
          "text": "过拟合",
          "isCorrect": true,
          "rationale": "过拟合表现为模型过于适应训练数据，泛化能力差。 请回到题干限定条件：把「外延更大的表述」或「跳跃的前提」逐项排除后再选。"
        },
        {
          "id": "class-04-ml-q10-C",
          "text": "梯度消失",
          "isCorrect": false,
          "rationale": "易混点往往在概念边界：此处 梯度消失会引入多余假设或跳过关键前提；请以「过拟合表现为模型过于适应训练数据，泛化能力差。」为轴对照 B。"
        },
        {
          "id": "class-04-ml-q10-D",
          "text": "收敛停滞",
          "isCorrect": false,
          "rationale": "收敛停滞更像干扰项的常见套路（扩大/偷换适用范围）；与材料中强调的「如果模型在训练集上准确率接近」「但在测试集上准确率很低」不一致。请以解析「过拟合表现为模型过于适应训练数据，泛化能力差。」锁定 B。"
        }
      ],
      "sourceSnippet": "过拟合表现为模型过于适应训练数据，泛化能力差。"
    },
    {
      "id": "class-04-ml-q11",
      "number": 11,
      "kind": "single",
      "question": "模型在训练集和测试集上都表现不佳，最可能的原因是",
      "hint": "欠拟合指模型未能捕捉数据规律，在训练集上表现就不好。",
      "options": [
        {
          "id": "class-04-ml-q11-A",
          "text": "过拟合",
          "isCorrect": false,
          "rationale": "过拟合侧重的是另一个机制或层级：与材料中强调的「模型在训练集和测试集上都表现不佳」「最可能的原因是」不一致；解析核心是「欠拟合指模型未能捕捉数据规律，在训练集上表现就不好。」，因此更合适的是 B（欠拟合）。"
        },
        {
          "id": "class-04-ml-q11-B",
          "text": "欠拟合",
          "isCorrect": true,
          "rationale": "欠拟合指模型未能捕捉数据规律，在训练集上表现就不好。 请回到题干限定条件：把「外延更大的表述」或「跳跃的前提」逐项排除后再选。"
        },
        {
          "id": "class-04-ml-q11-C",
          "text": "数据泄露",
          "isCorrect": false,
          "rationale": "易混点往往在概念边界：此处 数据泄露会引入多余假设或跳过关键前提；请以「欠拟合指模型未能捕捉数据规律，在训练集上表现就不好。」为轴对照 B。"
        },
        {
          "id": "class-04-ml-q11-D",
          "text": "学习率过大",
          "isCorrect": false,
          "rationale": "学习率过大更像干扰项的常见套路（扩大/偷换适用范围）；与材料中强调的「模型在训练集和测试集上都表现不佳」「最可能的原因是」不一致。请以解析「欠拟合指模型未能捕捉数据规律，在训练集上表现就不好。」锁定 B。"
        }
      ],
      "sourceSnippet": "欠拟合指模型未能捕捉数据规律，在训练集上表现就不好。"
    },
    {
      "id": "class-04-ml-q12",
      "number": 12,
      "kind": "single",
      "question": "以下哪个场景属于监督学习中的分类任务?",
      "hint": "A是回归任务，B是聚类(无监督)，D通常属于协同过滤或生成任务。…（可先想：哪一选项与该句直接矛盾？）",
      "options": [
        {
          "id": "class-04-ml-q12-A",
          "text": "根据房屋面积、卧室数量预测房价",
          "isCorrect": false,
          "rationale": "根据房屋面积、卧室数量预测房价侧重的是另一个机制或层级：与材料中强调的「垃圾邮件判断是典型的二分类任务」「有明确的类别标签」不一致；解析核心是「垃圾邮件判断是典型的二分类任务，有明确的类别标签。A是回归任务，B是聚类(无监督)，D通常属于协同过滤或生成任务。」，因此更合适的是 C（根据邮件内容判断是否为垃圾邮件）。"
        },
        {
          "id": "class-04-ml-q12-B",
          "text": "根据用户历史购买记录将用户分为不同群体",
          "isCorrect": false,
          "rationale": "从选项 B 的文面看不出与解析链条的一一对应：与材料中强调的「垃圾邮件判断是典型的二分类任务」「有明确的类别标签」不一致；而 C 才覆盖「垃圾邮件判断是典型的二分类任务，有明确的类别标签。A是回归任务，B是聚类(无监督)，D通常属于协同过滤或生成任务。」这层判断。"
        },
        {
          "id": "class-04-ml-q12-C",
          "text": "根据邮件内容判断是否为垃圾邮件",
          "isCorrect": true,
          "rationale": "垃圾邮件判断是典型的二分类任务，有明确的类别标签。A是回归任务，B是聚类(无监督)，D通常属于协同过滤或生成任务。"
        },
        {
          "id": "class-04-ml-q12-D",
          "text": "根据商品属性生成相似商品推荐",
          "isCorrect": false,
          "rationale": "根据商品属性生成相似商品推荐更像干扰项的常见套路（扩大/偷换适用范围）；与材料中强调的「垃圾邮件判断是典型的二分类任务」「有明确的类别标签」不一致。请以解析「垃圾邮件判断是典型的二分类任务，有明确的类别标签。A是回归任务，B是聚类(无监督)，D通常属于协同过滤或生成任务。」锁定 C。"
        }
      ],
      "sourceSnippet": "垃圾邮件判断是典型的二分类任务，有明确的类别标签。A是回归任务，B是聚类(无监督)，D通常属于协同过滤或生成任务。"
    },
    {
      "id": "class-04-ml-q13",
      "number": 13,
      "kind": "single",
      "question": "损失函数的作用是",
      "hint": "损失函数量化预测误差，是优化目标。",
      "options": [
        {
          "id": "class-04-ml-q13-A",
          "text": "衡量模型预测与真实值的差异",
          "isCorrect": true,
          "rationale": "损失函数量化预测误差，是优化目标。 请回到题干限定条件：把「外延更大的表述」或「跳跃的前提」逐项排除后再选。"
        },
        {
          "id": "class-04-ml-q13-B",
          "text": "决定模型结构",
          "isCorrect": false,
          "rationale": "从选项 B 的文面看不出与解析链条的一一对应：与材料中强调的「损失函数的作用是」「损失函数量化预测误差」不一致；而 A 才覆盖「损失函数量化预测误差，是优化目标。」这层判断。"
        },
        {
          "id": "class-04-ml-q13-C",
          "text": "控制学习率",
          "isCorrect": false,
          "rationale": "易混点往往在概念边界：此处 控制学习率会引入多余假设或跳过关键前提；请以「损失函数量化预测误差，是优化目标。」为轴对照 A。"
        },
        {
          "id": "class-04-ml-q13-D",
          "text": "初始化参数",
          "isCorrect": false,
          "rationale": "初始化参数更像干扰项的常见套路（扩大/偷换适用范围）；与材料中强调的「损失函数的作用是」「损失函数量化预测误差」不一致。请以解析「损失函数量化预测误差，是优化目标。」锁定 A。"
        }
      ],
      "sourceSnippet": "损失函数量化预测误差，是优化目标。"
    },
    {
      "id": "class-04-ml-q14",
      "number": 14,
      "kind": "single",
      "question": "以下哪个场景属于监督学习中的回归任务?",
      "hint": "A和C是分类，D是无监督的关联规则挖掘。…（可先想：哪一选项与该句直接矛盾？）",
      "options": [
        {
          "id": "class-04-ml-q14-A",
          "text": "识别图片中的动物是猫还是狗",
          "isCorrect": false,
          "rationale": "识别图片中的动物是猫还是狗侧重的是另一个机制或层级：与材料中强调的「股价预测输出是连续数值」「属于回归任务」不一致；解析核心是「股价预测输出是连续数值，属于回归任务。A和C是分类，D是无监督的关联规则挖掘。」，因此更合适的是 B（预测某股票明天的收盘价）。"
        },
        {
          "id": "class-04-ml-q14-B",
          "text": "预测某股票明天的收盘价",
          "isCorrect": true,
          "rationale": "股价预测输出是连续数值，属于回归任务。A和C是分类，D是无监督的关联规则挖掘。"
        },
        {
          "id": "class-04-ml-q14-C",
          "text": "将新闻文章自动归类为体育、财经、科技等",
          "isCorrect": false,
          "rationale": "易混点往往在概念边界：此处 将新闻文章自动归类为体育、财经、科技等会引入多余假设或跳过关键前提；请以「股价预测输出是连续数值，属于回归任务。A和C是分类，D是无监督的关联规则挖掘。」为轴对照 B。"
        },
        {
          "id": "class-04-ml-q14-D",
          "text": "根据用户行为发现购买模式",
          "isCorrect": false,
          "rationale": "根据用户行为发现购买模式更像干扰项的常见套路（扩大/偷换适用范围）；与材料中强调的「股价预测输出是连续数值」「属于回归任务」不一致。请以解析「股价预测输出是连续数值，属于回归任务。A和C是分类，D是无监督的关联规则挖掘。」锁定 B。"
        }
      ],
      "sourceSnippet": "股价预测输出是连续数值，属于回归任务。A和C是分类，D是无监督的关联规则挖掘。"
    },
    {
      "id": "class-04-ml-q15",
      "number": 15,
      "kind": "single",
      "question": "以下哪个场景最适合使用无监督学习?",
      "hint": "A、C、D都需要带标签的数据进行监督学习。…（可先想：哪一选项与该句直接矛盾？）",
      "options": [
        {
          "id": "class-04-ml-q15-A",
          "text": "手写数字识别",
          "isCorrect": false,
          "rationale": "手写数字识别侧重的是另一个机制或层级：与材料中强调的「用户分群是聚类任务」「不需要预先标注的类别标签」不一致；解析核心是「用户分群是聚类任务，不需要预先标注的类别标签。A、C、D都需要带标签的数据进行监督学习。」，因此更合适的是 B（电商平台根据用户购买记录将用户分群，以便个性化推荐）。"
        },
        {
          "id": "class-04-ml-q15-B",
          "text": "电商平台根据用户购买记录将用户分群，以便个性化推荐",
          "isCorrect": true,
          "rationale": "用户分群是聚类任务，不需要预先标注的类别标签。A、C、D都需要带标签的数据进行监督学习。"
        },
        {
          "id": "class-04-ml-q15-C",
          "text": "自动驾驶中的行人检测",
          "isCorrect": false,
          "rationale": "易混点往往在概念边界：此处 自动驾驶中的行人检测会引入多余假设或跳过关键前提；请以「用户分群是聚类任务，不需要预先标注的类别标签。A、C、D都需要带标签的数据进行监督学习。」为轴对照 B。"
        },
        {
          "id": "class-04-ml-q15-D",
          "text": "房价预测",
          "isCorrect": false,
          "rationale": "房价预测更像干扰项的常见套路（扩大/偷换适用范围）；与材料中强调的「用户分群是聚类任务」「不需要预先标注的类别标签」不一致。请以解析「用户分群是聚类任务，不需要预先标注的类别标签。A、C、D都需要带标签的数据进行监督学习。」锁定 B。"
        }
      ],
      "sourceSnippet": "用户分群是聚类任务，不需要预先标注的类别标签。A、C、D都需要带标签的数据进行监督学习。"
    },
    {
      "id": "class-04-ml-q16",
      "number": 16,
      "kind": "single",
      "question": "在分类任务中，如果希望模型对错误分类施加更大的惩罚，可以",
      "hint": "加权损失函数可以给不同类别或样本赋予不同权重，以强调某些错误。",
      "options": [
        {
          "id": "class-04-ml-q16-A",
          "text": "增大正则化系数",
          "isCorrect": false,
          "rationale": "增大正则化系数侧重的是另一个机制或层级：与材料中强调的「在分类任务中」「如果希望模型对错误分类施加更大的惩罚」不一致；解析核心是「加权损失函数可以给不同类别或样本赋予不同权重，以强调某些错误。」，因此更合适的是 B（使用加权损失函数）。"
        },
        {
          "id": "class-04-ml-q16-B",
          "text": "使用加权损失函数",
          "isCorrect": true,
          "rationale": "加权损失函数可以给不同类别或样本赋予不同权重，以强调某些错误。 请回到题干限定条件：把「外延更大的表述」或「跳跃的前提」逐项排除后再选。"
        },
        {
          "id": "class-04-ml-q16-C",
          "text": "增大学习率",
          "isCorrect": false,
          "rationale": "易混点往往在概念边界：此处 增大学习率会引入多余假设或跳过关键前提；请以「加权损失函数可以给不同类别或样本赋予不同权重，以强调某些错误。」为轴对照 B。"
        },
        {
          "id": "class-04-ml-q16-D",
          "text": "减少训练数据",
          "isCorrect": false,
          "rationale": "减少训练数据更像干扰项的常见套路（扩大/偷换适用范围）；与材料中强调的「在分类任务中」「如果希望模型对错误分类施加更大的惩罚」不一致。请以解析「加权损失函数可以给不同类别或样本赋予不同权重，以强调某些错误。」锁定 B。"
        }
      ],
      "sourceSnippet": "加权损失函数可以给不同类别或样本赋予不同权重，以强调某些错误。"
    },
    {
      "id": "class-04-ml-q17",
      "number": 17,
      "kind": "single",
      "question": "损失函数与目标函数的关系是",
      "hint": "目标函数通常包含损失函数和正则化项，优化目标是整体最小化。",
      "options": [
        {
          "id": "class-04-ml-q17-A",
          "text": "完全等同",
          "isCorrect": false,
          "rationale": "完全等同侧重的是另一个机制或层级：与材料中强调的「损失函数与目标函数的关系是」「目标函数通常包含损失函数和正则化项」不一致；解析核心是「目标函数通常包含损失函数和正则化项，优化目标是整体最小化。」，因此更合适的是 B（目标函数 = 损失函数 + 正则化项）。"
        },
        {
          "id": "class-04-ml-q17-B",
          "text": "目标函数 = 损失函数 + 正则化项",
          "isCorrect": true,
          "rationale": "目标函数通常包含损失函数和正则化项，优化目标是整体最小化。 请回到题干限定条件：把「外延更大的表述」或「跳跃的前提」逐项排除后再选。"
        },
        {
          "id": "class-04-ml-q17-C",
          "text": "损失函数 = 目标函数 + 正则化项",
          "isCorrect": false,
          "rationale": "易混点往往在概念边界：此处 损失函数 = 目标函数 + 正则化项会引入多余假设或跳过关键前提；请以「目标函数通常包含损失函数和正则化项，优化目标是整体最小化。」为轴对照 B。"
        },
        {
          "id": "class-04-ml-q17-D",
          "text": "两者无关",
          "isCorrect": false,
          "rationale": "两者无关更像干扰项的常见套路（扩大/偷换适用范围）；与材料中强调的「损失函数与目标函数的关系是」「目标函数通常包含损失函数和正则化项」不一致。请以解析「目标函数通常包含损失函数和正则化项，优化目标是整体最小化。」锁定 B。"
        }
      ],
      "sourceSnippet": "目标函数通常包含损失函数和正则化项，优化目标是整体最小化。"
    },
    {
      "id": "class-04-ml-q18",
      "number": 18,
      "kind": "single",
      "question": "在梯度下降算法中，学习率的作用是",
      "hint": "学习率控制沿负梯度方向移动的幅度，即步长大小。",
      "options": [
        {
          "id": "class-04-ml-q18-A",
          "text": "决定参数更新的方向",
          "isCorrect": false,
          "rationale": "决定参数更新的方向侧重的是另一个机制或层级：与材料中强调的「在梯度下降算法中」「学习率的作用是」不一致；解析核心是「学习率控制沿负梯度方向移动的幅度，即步长大小。」，因此更合适的是 B（决定参数更新的步长）。"
        },
        {
          "id": "class-04-ml-q18-B",
          "text": "决定参数更新的步长",
          "isCorrect": true,
          "rationale": "学习率控制沿负梯度方向移动的幅度，即步长大小。 请回到题干限定条件：把「外延更大的表述」或「跳跃的前提」逐项排除后再选。"
        },
        {
          "id": "class-04-ml-q18-C",
          "text": "决定损失函数的形状",
          "isCorrect": false,
          "rationale": "易混点往往在概念边界：此处 决定损失函数的形状会引入多余假设或跳过关键前提；请以「学习率控制沿负梯度方向移动的幅度，即步长大小。」为轴对照 B。"
        },
        {
          "id": "class-04-ml-q18-D",
          "text": "决定正则化强度",
          "isCorrect": false,
          "rationale": "决定正则化强度更像干扰项的常见套路（扩大/偷换适用范围）；与材料中强调的「在梯度下降算法中」「学习率的作用是」不一致。请以解析「学习率控制沿负梯度方向移动的幅度，即步长大小。」锁定 B。"
        }
      ],
      "sourceSnippet": "学习率控制沿负梯度方向移动的幅度，即步长大小。"
    },
    {
      "id": "class-04-ml-q19",
      "number": 19,
      "kind": "single",
      "question": "以下哪个场景最适合使用强化学习?",
      "hint": "A和D是监督学习，B是回归。…（可先想：哪一选项与该句直接矛盾？）",
      "options": [
        {
          "id": "class-04-ml-q19-A",
          "text": "识别图片中的交通标志",
          "isCorrect": false,
          "rationale": "识别图片中的交通标志侧重的是另一个机制或层级：与材料中强调的「通过与环境」「根据胜负获得奖励来学习策略」不一致；解析核心是「围棋AI通过与环境(棋盘)交互、根据胜负获得奖励来学习策略，是强化学习的经典应用。A和D是监督学习，B是回归。」，因此更合适的是 C（训练一个AI玩围棋游戏）。"
        },
        {
          "id": "class-04-ml-q19-B",
          "text": "根据历史数据预测销售额",
          "isCorrect": false,
          "rationale": "从选项 B 的文面看不出与解析链条的一一对应：与材料中强调的「通过与环境」「根据胜负获得奖励来学习策略」不一致；而 C 才覆盖「围棋AI通过与环境(棋盘)交互、根据胜负获得奖励来学习策略，是强化学习的经典应用。A和D是监督学习，B是回归。」这层判断。"
        },
        {
          "id": "class-04-ml-q19-C",
          "text": "训练一个AI玩围棋游戏",
          "isCorrect": true,
          "rationale": "围棋AI通过与环境(棋盘)交互、根据胜负获得奖励来学习策略，是强化学习的经典应用。A和D是监督学习，B是回归。"
        },
        {
          "id": "class-04-ml-q19-D",
          "text": "将文档自动分类",
          "isCorrect": false,
          "rationale": "将文档自动分类更像干扰项的常见套路（扩大/偷换适用范围）；与材料中强调的「通过与环境」「根据胜负获得奖励来学习策略」不一致。请以解析「围棋AI通过与环境(棋盘)交互、根据胜负获得奖励来学习策略，是强化学习的经典应用。A和D是监督学习，B是回归。」锁定 C。"
        }
      ],
      "sourceSnippet": "围棋AI通过与环境(棋盘)交互、根据胜负获得奖励来学习策略，是强化学习的经典应用。A和D是监督学习，B是回归。"
    },
    {
      "id": "class-04-ml-q20",
      "number": 20,
      "kind": "single",
      "question": "在梯度下降中，如果损失函数值震荡剧烈且不下降，最可能的原因是",
      "hint": "学习率过大导致参数更新越过最优点，引起震荡或发散。",
      "options": [
        {
          "id": "class-04-ml-q20-A",
          "text": "学习率过小",
          "isCorrect": false,
          "rationale": "学习率过小侧重的是另一个机制或层级：与材料中强调的「在梯度下降中」「如果损失函数值震荡剧烈且不下降」不一致；解析核心是「学习率过大导致参数更新越过最优点，引起震荡或发散。」，因此更合适的是 B（学习率过大）。"
        },
        {
          "id": "class-04-ml-q20-B",
          "text": "学习率过大",
          "isCorrect": true,
          "rationale": "学习率过大导致参数更新越过最优点，引起震荡或发散。 请回到题干限定条件：把「外延更大的表述」或「跳跃的前提」逐项排除后再选。"
        },
        {
          "id": "class-04-ml-q20-C",
          "text": "正则化过强",
          "isCorrect": false,
          "rationale": "易混点往往在概念边界：此处 正则化过强会引入多余假设或跳过关键前提；请以「学习率过大导致参数更新越过最优点，引起震荡或发散。」为轴对照 B。"
        },
        {
          "id": "class-04-ml-q20-D",
          "text": "数据未归一化",
          "isCorrect": false,
          "rationale": "数据未归一化更像干扰项的常见套路（扩大/偷换适用范围）；与材料中强调的「在梯度下降中」「如果损失函数值震荡剧烈且不下降」不一致。请以解析「学习率过大导致参数更新越过最优点，引起震荡或发散。」锁定 B。"
        }
      ],
      "sourceSnippet": "学习率过大导致参数更新越过最优点，引起震荡或发散。"
    },
    {
      "id": "class-04-ml-q21",
      "number": 21,
      "kind": "single",
      "question": "以下关于监督学习和无监督学习的描述，正确的是",
      "hint": "聚类是无监督学习的核心任务。…（可先想：题干最强调的判据是哪一条？）",
      "options": [
        {
          "id": "class-04-ml-q21-A",
          "text": "监督学习不需要标签数据",
          "isCorrect": false,
          "rationale": "监督学习不需要标签数据侧重的是另一个机制或层级：与材料中强调的「以下关于监督学习和无监督学习的描述」「正确的是」不一致；解析核心是「聚类是无监督学习的核心任务。A错误，监督学习需要标签;B错误，无监督学习不预测标签;D错误，回归属于监督学习。」，因此更合适的是 C（聚类是无监督学习的典型任务）。"
        },
        {
          "id": "class-04-ml-q21-B",
          "text": "无监督学习的目标是预测未知标签",
          "isCorrect": false,
          "rationale": "从选项 B 的文面看不出与解析链条的一一对应：与材料中强调的「以下关于监督学习和无监督学习的描述」「正确的是」不一致；而 C 才覆盖「聚类是无监督学习的核心任务。A错误，监督学习需要标签;B错误，无监督学习不预测标签;D错误，回归属于监督学习。」这层判断。"
        },
        {
          "id": "class-04-ml-q21-C",
          "text": "聚类是无监督学习的典型任务",
          "isCorrect": true,
          "rationale": "聚类是无监督学习的核心任务。A错误，监督学习需要标签;B错误，无监督学习不预测标签;D错误，回归属于监督学习。"
        },
        {
          "id": "class-04-ml-q21-D",
          "text": "回归是无监督学习的典型任务",
          "isCorrect": false,
          "rationale": "回归是无监督学习的典型任务更像干扰项的常见套路（扩大/偷换适用范围）；与材料中强调的「以下关于监督学习和无监督学习的描述」「正确的是」不一致。请以解析「聚类是无监督学习的核心任务。A错误，监督学习需要标签;B错误，无监督学习不预测标签;D错误，回归属于监督学习。」锁定 C。"
        }
      ],
      "sourceSnippet": "聚类是无监督学习的核心任务。A错误，监督学习需要标签;B错误，无监督学习不预测标签;D错误，回归属于监督学习。"
    },
    {
      "id": "class-04-ml-q22",
      "number": 22,
      "kind": "single",
      "question": "场景:你有一批客户数据，包含年龄、收入、消费频率等字段，但没有客户是否流失的标签。你想将客户分为高价值、中价值、低价值三组，以便制定不同营销策略。这属于",
      "hint": "分类需要有明确的目标标签，此处没有。…（可先想：哪一选项与该句直接矛盾？）",
      "options": [
        {
          "id": "class-04-ml-q22-A",
          "text": "分类任务(监督学习)",
          "isCorrect": false,
          "rationale": "分类任务(监督学习)侧重的是另一个机制或层级：与材料中强调的「你有一批客户数据」「包含年龄」不一致；解析核心是「在无标签的情况下将客户分组，属于聚类任务。分类需要有明确的目标标签，此处没有。」，因此更合适的是 C（聚类任务(无监督学习)）。"
        },
        {
          "id": "class-04-ml-q22-B",
          "text": "回归任务(监督学习)",
          "isCorrect": false,
          "rationale": "从选项 B 的文面看不出与解析链条的一一对应：与材料中强调的「你有一批客户数据」「包含年龄」不一致；而 C 才覆盖「在无标签的情况下将客户分组，属于聚类任务。分类需要有明确的目标标签，此处没有。」这层判断。"
        },
        {
          "id": "class-04-ml-q22-C",
          "text": "聚类任务(无监督学习)",
          "isCorrect": true,
          "rationale": "在无标签的情况下将客户分组，属于聚类任务。分类需要有明确的目标标签，此处没有。"
        },
        {
          "id": "class-04-ml-q22-D",
          "text": "降维任务(无监督学习)",
          "isCorrect": false,
          "rationale": "降维任务(无监督学习)更像干扰项的常见套路（扩大/偷换适用范围）；与材料中强调的「你有一批客户数据」「包含年龄」不一致。请以解析「在无标签的情况下将客户分组，属于聚类任务。分类需要有明确的目标标签，此处没有。」锁定 C。"
        }
      ],
      "sourceSnippet": "在无标签的情况下将客户分组，属于聚类任务。分类需要有明确的目标标签，此处没有。"
    },
    {
      "id": "class-04-ml-q23",
      "number": 23,
      "kind": "single",
      "question": "以下哪个是模型参数，而非超参数?",
      "hint": "学习率、正则化系数、网络结构都是超参数。…（可先想：哪一选项与该句直接矛盾？）",
      "options": [
        {
          "id": "class-04-ml-q23-A",
          "text": "学习率",
          "isCorrect": false,
          "rationale": "学习率侧重的是另一个机制或层级：与材料中强调的「而非超参数」「权重是训练过程中自动学习的模型参数」不一致；解析核心是「权重是训练过程中自动学习的模型参数。学习率、正则化系数、网络结构都是超参数。」，因此更合适的是 B（神经网络各层的权重）。"
        },
        {
          "id": "class-04-ml-q23-B",
          "text": "神经网络各层的权重",
          "isCorrect": true,
          "rationale": "权重是训练过程中自动学习的模型参数。学习率、正则化系数、网络结构都是超参数。"
        },
        {
          "id": "class-04-ml-q23-C",
          "text": "L2正则化系数",
          "isCorrect": false,
          "rationale": "易混点往往在概念边界：此处 L2正则化系数会引入多余假设或跳过关键前提；请以「权重是训练过程中自动学习的模型参数。学习率、正则化系数、网络结构都是超参数。」为轴对照 B。"
        },
        {
          "id": "class-04-ml-q23-D",
          "text": "隐藏层神经元数量",
          "isCorrect": false,
          "rationale": "隐藏层神经元数量更像干扰项的常见套路（扩大/偷换适用范围）；与材料中强调的「而非超参数」「权重是训练过程中自动学习的模型参数」不一致。请以解析「权重是训练过程中自动学习的模型参数。学习率、正则化系数、网络结构都是超参数。」锁定 B。"
        }
      ],
      "sourceSnippet": "权重是训练过程中自动学习的模型参数。学习率、正则化系数、网络结构都是超参数。"
    },
    {
      "id": "class-04-ml-q24",
      "number": 24,
      "kind": "single",
      "question": "超参数的确定通常通过",
      "hint": "超参数通过验证集性能进行选择，不能利用测试集，也不能从训练数据直接学习。",
      "options": [
        {
          "id": "class-04-ml-q24-A",
          "text": "梯度下降自动学习",
          "isCorrect": false,
          "rationale": "梯度下降自动学习侧重的是另一个机制或层级：与材料中强调的「超参数的确定通常通过」「超参数通过验证集性能进行选择」不一致；解析核心是「超参数通过验证集性能进行选择，不能利用测试集，也不能从训练数据直接学习。」，因此更合适的是 B（在验证集上评估并选择）。"
        },
        {
          "id": "class-04-ml-q24-B",
          "text": "在验证集上评估并选择",
          "isCorrect": true,
          "rationale": "超参数通过验证集性能进行选择，不能利用测试集，也不能从训练数据直接学习。"
        },
        {
          "id": "class-04-ml-q24-C",
          "text": "随机初始化后固定",
          "isCorrect": false,
          "rationale": "易混点往往在概念边界：此处 随机初始化后固定会引入多余假设或跳过关键前提；请以「超参数通过验证集性能进行选择，不能利用测试集，也不能从训练数据直接学习。」为轴对照 B。"
        },
        {
          "id": "class-04-ml-q24-D",
          "text": "在测试集上直接优化",
          "isCorrect": false,
          "rationale": "在测试集上直接优化更像干扰项的常见套路（扩大/偷换适用范围）；与材料中强调的「超参数的确定通常通过」「超参数通过验证集性能进行选择」不一致。请以解析「超参数通过验证集性能进行选择，不能利用测试集，也不能从训练数据直接学习。」锁定 B。"
        }
      ],
      "sourceSnippet": "超参数通过验证集性能进行选择，不能利用测试集，也不能从训练数据直接学习。"
    },
    {
      "id": "class-04-ml-q25",
      "number": 25,
      "kind": "single",
      "question": "以下关于模型参数的说法，正确的是",
      "hint": "模型参数在训练开始时初始化，然后通过优化算法迭代更新。",
      "options": [
        {
          "id": "class-04-ml-q25-A",
          "text": "训练前随机初始化，训练过程中不断更新",
          "isCorrect": true,
          "rationale": "模型参数在训练开始时初始化，然后通过优化算法迭代更新。 请回到题干限定条件：把「外延更大的表述」或「跳跃的前提」逐项排除后再选。"
        },
        {
          "id": "class-04-ml-q25-B",
          "text": "训练过程中保持不变",
          "isCorrect": false,
          "rationale": "从选项 B 的文面看不出与解析链条的一一对应：与材料中强调的「以下关于模型参数的说法」「正确的是」不一致；而 A 才覆盖「模型参数在训练开始时初始化，然后通过优化算法迭代更新。」这层判断。"
        },
        {
          "id": "class-04-ml-q25-C",
          "text": "由用户根据经验直接指定",
          "isCorrect": false,
          "rationale": "易混点往往在概念边界：此处 由用户根据经验直接指定会引入多余假设或跳过关键前提；请以「模型参数在训练开始时初始化，然后通过优化算法迭代更新。」为轴对照 A。"
        },
        {
          "id": "class-04-ml-q25-D",
          "text": "仅包含偏置项",
          "isCorrect": false,
          "rationale": "仅包含偏置项更像干扰项的常见套路（扩大/偷换适用范围）；与材料中强调的「以下关于模型参数的说法」「正确的是」不一致。请以解析「模型参数在训练开始时初始化，然后通过优化算法迭代更新。」锁定 A。"
        }
      ],
      "sourceSnippet": "模型参数在训练开始时初始化，然后通过优化算法迭代更新。"
    },
    {
      "id": "class-04-ml-q26",
      "number": 26,
      "kind": "single",
      "question": "当模型发生欠拟合时，以下哪种超参数调整可能有效?",
      "hint": "欠拟合是因为模型容量不足，增加容量可以提升拟合能力。",
      "options": [
        {
          "id": "class-04-ml-q26-A",
          "text": "增大正则化系数",
          "isCorrect": false,
          "rationale": "增大正则化系数侧重的是另一个机制或层级：与材料中强调的「当模型发生欠拟合时」「欠拟合是因为模型容量不足」不一致；解析核心是「欠拟合是因为模型容量不足，增加容量可以提升拟合能力。」，因此更合适的是 C（增加模型容量(如增加隐藏单元)）。"
        },
        {
          "id": "class-04-ml-q26-B",
          "text": "减小学习率",
          "isCorrect": false,
          "rationale": "从选项 B 的文面看不出与解析链条的一一对应：与材料中强调的「当模型发生欠拟合时」「欠拟合是因为模型容量不足」不一致；而 C 才覆盖「欠拟合是因为模型容量不足，增加容量可以提升拟合能力。」这层判断。"
        },
        {
          "id": "class-04-ml-q26-C",
          "text": "增加模型容量(如增加隐藏单元)",
          "isCorrect": true,
          "rationale": "欠拟合是因为模型容量不足，增加容量可以提升拟合能力。 请回到题干限定条件：把「外延更大的表述」或「跳跃的前提」逐项排除后再选。"
        },
        {
          "id": "class-04-ml-q26-D",
          "text": "减少训练轮数",
          "isCorrect": false,
          "rationale": "减少训练轮数更像干扰项的常见套路（扩大/偷换适用范围）；与材料中强调的「当模型发生欠拟合时」「欠拟合是因为模型容量不足」不一致。请以解析「欠拟合是因为模型容量不足，增加容量可以提升拟合能力。」锁定 C。"
        }
      ],
      "sourceSnippet": "欠拟合是因为模型容量不足，增加容量可以提升拟合能力。"
    },
    {
      "id": "class-04-ml-q27",
      "number": 27,
      "kind": "single",
      "question": "场景:你希望训练一个模型，根据肿瘤大小、厚度、细胞形态等特征判断肿瘤是良性还是恶性。你拥有大量已标注的病例数据。这属于",
      "hint": "有明确的标签(良性/恶性)，且输出为离散类别，是二分类任务，属于监督学习。",
      "options": [
        {
          "id": "class-04-ml-q27-A",
          "text": "无监督学习",
          "isCorrect": false,
          "rationale": "无监督学习侧重的是另一个机制或层级：与材料中强调的「你希望训练一个模型」「根据肿瘤大小」不一致；解析核心是「有明确的标签(良性/恶性)，且输出为离散类别，是二分类任务，属于监督学习。」，因此更合适的是 B（监督学习中的分类任务）。"
        },
        {
          "id": "class-04-ml-q27-B",
          "text": "监督学习中的分类任务",
          "isCorrect": true,
          "rationale": "有明确的标签(良性/恶性)，且输出为离散类别，是二分类任务，属于监督学习。"
        },
        {
          "id": "class-04-ml-q27-C",
          "text": "监督学习中的回归任务",
          "isCorrect": false,
          "rationale": "易混点往往在概念边界：此处 监督学习中的回归任务会引入多余假设或跳过关键前提；请以「有明确的标签(良性/恶性)，且输出为离散类别，是二分类任务，属于监督学习。」为轴对照 B。"
        },
        {
          "id": "class-04-ml-q27-D",
          "text": "强化学习",
          "isCorrect": false,
          "rationale": "强化学习更像干扰项的常见套路（扩大/偷换适用范围）；与材料中强调的「你希望训练一个模型」「根据肿瘤大小」不一致。请以解析「有明确的标签(良性/恶性)，且输出为离散类别，是二分类任务，属于监督学习。」锁定 B。"
        }
      ],
      "sourceSnippet": "有明确的标签(良性/恶性)，且输出为离散类别，是二分类任务，属于监督学习。"
    },
    {
      "id": "class-04-ml-q28",
      "number": 28,
      "kind": "single",
      "question": "场景:你正在开发一个房价预测模型，有1000条带标签的数据。你希望评估不同正则化强度对泛化能力的影响，你应该使用什么数据来比较?",
      "hint": "超参数选择应使用验证集，可从训练集中划分出验证集，避免对测试集过拟合。",
      "options": [
        {
          "id": "class-04-ml-q28-A",
          "text": "全部1000条数据",
          "isCorrect": false,
          "rationale": "全部1000条数据侧重的是另一个机制或层级：与材料中强调的「你正在开发一个房价预测模型」「条带标签的数据」不一致；解析核心是「超参数选择应使用验证集，可从训练集中划分出验证集，避免对测试集过拟合。」，因此更合适的是 B（训练集的一部分作为验证集）。"
        },
        {
          "id": "class-04-ml-q28-B",
          "text": "训练集的一部分作为验证集",
          "isCorrect": true,
          "rationale": "超参数选择应使用验证集，可从训练集中划分出验证集，避免对测试集过拟合。 请回到题干限定条件：把「外延更大的表述」或「跳跃的前提」逐项排除后再选。"
        },
        {
          "id": "class-04-ml-q28-C",
          "text": "测试集",
          "isCorrect": false,
          "rationale": "易混点往往在概念边界：此处 测试集会引入多余假设或跳过关键前提；请以「超参数选择应使用验证集，可从训练集中划分出验证集，避免对测试集过拟合。」为轴对照 B。"
        },
        {
          "id": "class-04-ml-q28-D",
          "text": "原始数据集的子集",
          "isCorrect": false,
          "rationale": "原始数据集的子集更像干扰项的常见套路（扩大/偷换适用范围）；与材料中强调的「你正在开发一个房价预测模型」「条带标签的数据」不一致。请以解析「超参数选择应使用验证集，可从训练集中划分出验证集，避免对测试集过拟合。」锁定 B。"
        }
      ],
      "sourceSnippet": "超参数选择应使用验证集，可从训练集中划分出验证集，避免对测试集过拟合。"
    },
    {
      "id": "class-04-ml-q29",
      "number": 29,
      "kind": "single",
      "question": "场景:训练图像分类模型时，损失曲线在训练初期下降很快，但随后开始波动且不再下降。你怀疑学习率设置不合理，最可能的问题是",
      "hint": "初期下降快说明梯度大，后期震荡不下降说明步长过大，导致在最优点附近反复跳过。",
      "options": [
        {
          "id": "class-04-ml-q29-A",
          "text": "学习率过大",
          "isCorrect": true,
          "rationale": "初期下降快说明梯度大，后期震荡不下降说明步长过大，导致在最优点附近反复跳过。"
        },
        {
          "id": "class-04-ml-q29-B",
          "text": "学习率过小",
          "isCorrect": false,
          "rationale": "从选项 B 的文面看不出与解析链条的一一对应：与材料中强调的「训练图像分类模型时」「损失曲线在训练初期下降很快」不一致；而 A 才覆盖「初期下降快说明梯度大，后期震荡不下降说明步长过大，导致在最优点附近反复跳过。」这层判断。"
        },
        {
          "id": "class-04-ml-q29-C",
          "text": "学习率衰减过快",
          "isCorrect": false,
          "rationale": "易混点往往在概念边界：此处 学习率衰减过快会引入多余假设或跳过关键前提；请以「初期下降快说明梯度大，后期震荡不下降说明步长过大，导致在最优点附近反复跳过。」为轴对照 A。"
        },
        {
          "id": "class-04-ml-q29-D",
          "text": "学习率不是超参数",
          "isCorrect": false,
          "rationale": "学习率不是超参数更像干扰项的常见套路（扩大/偷换适用范围）；与材料中强调的「训练图像分类模型时」「损失曲线在训练初期下降很快」不一致。请以解析「初期下降快说明梯度大，后期震荡不下降说明步长过大，导致在最优点附近反复跳过。」锁定 A。"
        }
      ],
      "sourceSnippet": "初期下降快说明梯度大，后期震荡不下降说明步长过大，导致在最优点附近反复跳过。"
    },
    {
      "id": "class-04-ml-q30",
      "number": 30,
      "kind": "single",
      "question": "场景:你使用逻辑回归进行垃圾邮件分类，发现模型在训练集上准确率95%，在测试集上只有80%。你尝试增加L2正则化系数后，训练准确率降至92%，测试准确率升至85%。这说明",
      "hint": "训练与测试准确率差距缩小，且测试性能提升，说明正则化有效抑制了过拟合。",
      "options": [
        {
          "id": "class-04-ml-q30-A",
          "text": "初始模型欠拟合",
          "isCorrect": false,
          "rationale": "初始模型欠拟合侧重的是另一个机制或层级：与材料中强调的「你使用逻辑回归进行垃圾邮件分类」「发现模型在训练集上准确率」不一致；解析核心是「训练与测试准确率差距缩小，且测试性能提升，说明正则化有效抑制了过拟合。」，因此更合适的是 B（初始模型过拟合，正则化有效缓解）。"
        },
        {
          "id": "class-04-ml-q30-B",
          "text": "初始模型过拟合，正则化有效缓解",
          "isCorrect": true,
          "rationale": "训练与测试准确率差距缩小，且测试性能提升，说明正则化有效抑制了过拟合。 请回到题干限定条件：把「外延更大的表述」或「跳跃的前提」逐项排除后再选。"
        },
        {
          "id": "class-04-ml-q30-C",
          "text": "数据泄露导致",
          "isCorrect": false,
          "rationale": "易混点往往在概念边界：此处 数据泄露导致会引入多余假设或跳过关键前提；请以「训练与测试准确率差距缩小，且测试性能提升，说明正则化有效抑制了过拟合。」为轴对照 B。"
        },
        {
          "id": "class-04-ml-q30-D",
          "text": "学习率需要调整",
          "isCorrect": false,
          "rationale": "学习率需要调整更像干扰项的常见套路（扩大/偷换适用范围）；与材料中强调的「你使用逻辑回归进行垃圾邮件分类」「发现模型在训练集上准确率」不一致。请以解析「训练与测试准确率差距缩小，且测试性能提升，说明正则化有效抑制了过拟合。」锁定 B。"
        }
      ],
      "sourceSnippet": "训练与测试准确率差距缩小，且测试性能提升，说明正则化有效抑制了过拟合。"
    },
    {
      "id": "class-04-ml-q31",
      "number": 31,
      "kind": "single",
      "question": "场景:在电商推荐系统中，你构建了用户点击率预测模型，特征包括用户历史行为、商品属性等。你希望比较不同优化器(SGD vs Adam)的效果，应使用什么数据来评估?",
      "hint": "优化器选择也属于超参数选择，应在验证集上比较。",
      "options": [
        {
          "id": "class-04-ml-q31-A",
          "text": "训练集",
          "isCorrect": false,
          "rationale": "训练集侧重的是另一个机制或层级：与材料中强调的「在电商推荐系统中」「你构建了用户点击率预测模型」不一致；解析核心是「优化器选择也属于超参数选择，应在验证集上比较。」，因此更合适的是 B（验证集）。"
        },
        {
          "id": "class-04-ml-q31-B",
          "text": "验证集",
          "isCorrect": true,
          "rationale": "优化器选择也属于超参数选择，应在验证集上比较。 请回到题干限定条件：把「外延更大的表述」或「跳跃的前提」逐项排除后再选。"
        },
        {
          "id": "class-04-ml-q31-C",
          "text": "测试集",
          "isCorrect": false,
          "rationale": "易混点往往在概念边界：此处 测试集会引入多余假设或跳过关键前提；请以「优化器选择也属于超参数选择，应在验证集上比较。」为轴对照 B。"
        },
        {
          "id": "class-04-ml-q31-D",
          "text": "全部数据",
          "isCorrect": false,
          "rationale": "全部数据更像干扰项的常见套路（扩大/偷换适用范围）；与材料中强调的「在电商推荐系统中」「你构建了用户点击率预测模型」不一致。请以解析「优化器选择也属于超参数选择，应在验证集上比较。」锁定 B。"
        }
      ],
      "sourceSnippet": "优化器选择也属于超参数选择，应在验证集上比较。"
    }
  ]
}