2 tuần trước cách đây · 0974a0b4c6
--- a/MEMORY.md
+++ b/MEMORY.md
@@ -50,21 +50,83 @@ topic_en_map = {
 
				 - Day6: 计算图
			
 
				 - Day7: 卷积神经网络
			
 
				 
			
 
				+## 三周学习计划
			
 
				+
			
 
				+### 第一周：统计学习方法（2026-03-03 开始）
			
 
				+**教材**: 《统计学习方法》(lihang-code)
			
 
				+
			
 
				+| 天数 | 主题 | 知识点 | 状态 |
			
 
				+|------|------|--------|------|
			
 
				+| Day1 | 感知机 | 决策边界、梯度下降 | ✅ 已修复 |
			
 
				+| Day2 | K 近邻 | 距离度量、投票规则 | ✅ 已修复 |
			
 
				+| Day3 | 朴素贝叶斯 | 条件概率、拉普拉斯平滑 | ✅ 已修复 |
			
 
				+| Day4 | 决策树 | 信息熵、基尼系数、ID3/C4.5/CART | ⏳ 待添加 |
			
 
				+| Day5 | 支持向量机 | 核函数、SMO 算法、软间隔 | ⏳ 待添加 |
			
 
				+| Day6 | 提升方法 | AdaBoost、GBDT | ⏳ 待添加 |
			
 
				+| Day7 | 无监督学习 | K-Means、层次聚类、密度聚类 | ⏳ 待添加 |
			
 
				+
			
 
				+### 第二周：动手学深度学习
			
 
				+**教材**: 《动手学深度学习》(d2l-zh)
			
 
				+
			
 
				+| 天数 | 主题 | 知识点 | 状态 |
			
 
				+|------|------|--------|------|
			
 
				+| Day8 | 计算图 | 自动求导、链式法则 | ✅ 已修复 |
			
 
				+| Day9 | 卷积神经网络 | 卷积运算、池化、CNN 架构 | ✅ 已修复 |
			
 
				+| Day10 | 注意力机制 | Seq2Seq、Transformer、自注意力 | ⏳ 待添加 |
			
 
				+| Day11 | 计算机视觉 | 目标检测、图像分割 | ⏳ 待添加 |
			
 
				+| Day12 | 训练与验证 | 过拟合、数据预处理 | ⏳ 待添加 |
			
 
				+| Day13 | 优化器 | SGD、Adam | ⏳ 待添加 |
			
 
				+| Day14 | 性能优化 | 分布式训练、模型部署 | ⏳ 待添加 |
			
 
				+
			
 
				+### 第三周：强化学习数学原理
			
 
				+**教材**: 《强化学习的数学原理》(Book-Mathematical-Foundation-of-Reinforcement-Learning)
			
 
				+
			
 
				+| 天数 | 主题 | 知识点 | 状态 |
			
 
				+|------|------|--------|------|
			
 
				+| Day15 | Bellman 方程 | MDP、状态值函数 | ⏳ 待添加 |
			
 
				+| Day16 | 价值迭代 | 最优值函数、Bellman 最优方程 | ⏳ 待添加 |
			
 
				+| Day17 | 策略迭代 | 值迭代 vs 策略迭代 | ⏳ 待添加 |
			
 
				+| Day18 | 蒙特卡洛方法 | MC 预测、MC 控制 | ⏳ 待添加 |
			
 
				+| Day19 | 时序差分 | TD(0)、TD(λ) | ⏳ 待添加 |
			
 
				+| Day20 | 策略梯度 | REINFORCE、Actor-Critic | ⏳ 待添加 |
			
 
				+| Day21 | 高级主题 | A3C、PPO、DPO | ⏳ 待添加 |
			
 
				+
			
 
				 ## 2026-03-02 修复记录
			
 
				 
			
 
				 ### 问题
			
 
				 `compile_day.py` 的 `generate_symbol_decoder()` 和 `generate_math_derivation()` 函数硬编码了感知机内容，导致 Day2~Day7 都生成相同的感知机内容。
			
 
				 
			
 
				 ### 解决方案
			
 
				-修改两个函数，根据传入的 `topic` 参数动态生成对应主题的内容：
			
 
				-1. `generate_symbol_decoder(topic)` - 根据主题生成符号解码字典
			
 
				-2. `generate_math_derivation(topic)` - 根据主题生成数学推导
			
 
				-3. `generate_html()` - 为不同主题设置不同的技术参数（technical_debt, visual_intuition, bilibili_keyword 等）
			
 
				+修改三个函数，根据传入的 `topic` 参数动态生成对应主题的内容：
			
 
				+1. `generate_symbol_decoder(topic)` - 根据主题生成符号解码字典（7 个主题）
			
 
				+2. `generate_math_derivation(topic)` - 根据主题生成数学推导（7 个主题）
			
 
				+3. `generate_html()` - 为不同主题设置不同的技术参数（technical_debt, visual_intuition, bilibili_keyword, optimization_bottleneck, oj_mission）
			
 
				 
			
 
				 ### 修改文件
			
 
				 - `skills/mathlab/scripts/compile_day.py` - 修复内容生成逻辑
			
 
				 
			
 
				-### 待执行
			
 
				-1. 重新编译 Day2~Day7
			
 
				-2. 推送到 Gogs
			
 
				-3. 测试验证内容正确性
			
 
				+### 已执行（2026-03-02 06:13）
			
 
				+✅ 修复 compile_day.py 三个函数
			
 
				+✅ 重新编译 Day2~Day7
			
 
				+✅ 提交 Git 仓库（commit e528ca7）
			
 
				+❌ 推送 Gogs 失败（服务器 500 错误，持续中）
			
 
				+
			
 
				+### 部署状态（2026-03-02 14:00）
			
 
				+✅ Day1（感知机）已部署（之前已完成）
			
 
				+⏳ Day2~Day7 待部署（需要先推送成功）
			
 
				+
			
 
				+### Gogs 服务器问题
			
 
				+- URL: https://code.indigofloyd.space/ClawLab/mathlab.git
			
 
				+- 错误：HTTP 500 Internal Server Error
			
 
				+- 状态：服务器可访问（302 重定向），但 Git 操作返回 500
			
 
				+- 建议：联系服务器管理员或稍后重试
			
 
				+
			
 
				+### 用户反馈（2026-03-02 14:00）
			
 
				+- **重要**: 以后有改动要主动存到 MEMORY.md，不要依赖临时记忆
			
 
				+- 需要记住项目路径、配置、之前的问答上下文
			
 
				+- 每次会话结束时更新 MEMORY.md，确保下次会话能找回上下文
			
 
				+
			
 
				+### 2026-03-03 新任务
			
 
				+- 修复第一周课件（Day4~Day7 待添加：决策树、SVM、提升方法、无监督学习）
			
 
				+- 编译第二周课件（Day8~Day14：深度学习主题）
			
 
				+- 统一推送到 Gogs
			
--- a/courseware/course_day2.html
+++ b/courseware/course_day2.html
@@ -0,0 +1,89 @@
 
				+<!DOCTYPE html>
			
 
				+<html lang="zh-CN">
			
 
				+<head>
			
 
				+    <meta charset="UTF-8">
			
 
				+    <meta name="viewport" content="width=device-width, initial-scale=1.0">
			
 
				+    <title>2 - K 近邻</title>
			
 
				+    <link rel="stylesheet" href="https://cdn.jsdelivr.net/npm/katex@0.16.9/dist/katex.min.css">
			
 
				+    <style>
			
 
				+        body { font-family: -apple-system, BlinkMacSystemFont, "Segoe UI", Roboto, sans-serif; line-height: 1.6; max-width: 800px; margin: 0 auto; padding: 20px; background: #1a1a2e; color: #eaeaea; }
			
 
				+        h1 { color: #e94560; border-bottom: 2px solid #e94560; padding-bottom: 10px; }
			
 
				+        h2 { color: #0f3460; background: #16213e; padding: 10px; border-left: 4px solid #e94560; margin-top: 30px; }
			
 
				+        .module { background: #0f3460; padding: 15px; margin: 20px 0; border-radius: 5px; }
			
 
				+        .module-title { color: #e94560; font-weight: bold; margin-bottom: 10px; }
			
 
				+        code { background: #1a1a2e; padding: 2px 6px; border-radius: 3px; color: #f0f6f6; }
			
 
				+        pre { background: #1a1a2e; padding: 15px; border-radius: 5px; overflow-x: auto; }
			
 
				+        .symbol-map { background: #16213e; padding: 10px; margin: 5px 0; border-left: 3px solid #0f3460; }
			
 
				+        .warning { background: #e94560; color: #fff; padding: 10px; border-radius: 5px; margin: 10px 0; }
			
 
				+        .youtube { background: #ff0000; color: #fff; padding: 10px; border-radius: 5px; display: inline-block; margin: 10px 0; }
			
 
				+    </style>
			
 
				+</head>
			
 
				+<body>
			
 
				+    <h1>👾 Day 2: K 近邻</h1>
			
 
				+    
			
 
				+    <div class="module">
			
 
				+        <div class="module-title">1️⃣【技术债与演进动机】The Technical Debt & Evolution</div>
			
 
				+        基于模型的算法需要训练过程，无法利用新样本。K 近邻是实例学习（惰性学习），直接存储训练数据用于预测。
			
 
				+    </div>
			
 
				+
			
 
				+    <div class="module">
			
 
				+        <div class="module-title">2️⃣【直觉建立】Visual Intuition</div>
			
 
				+        想象在一个平面上，新点周围的 k 个最近邻居多数是红色，那它也被预测为红色。距离越近影响越大。
			
 
				+        <div class="youtube">🎬 B 站搜索：<code>K 近邻算法 直观解释</code></div>
			
 
				+    </div>
			
 
				+
			
 
				+    <div class="module">
			
 
				+        <div class="module-title">3️⃣【符号解码字典】The Symbol Decoder</div>
			
 
				+        
			
 
				+        <div class="symbol-map"><strong>$x$</strong> → <code>input_tensor</code> (待预测样本，shape: [d])</div>
			
 
				+        <div class="symbol-map"><strong>$X$</strong> → <code>self.X_train</code> (训练集，shape: [N, d])</div>
			
 
				+        <div class="symbol-map"><strong>$y$</strong> → <code>label</code> (待预测标签)</div>
			
 
				+        <div class="symbol-map"><strong>$Y$</strong> → <code>self.y_train</code> (训练标签，shape: [N])</div>
			
 
				+        <div class="symbol-map"><strong>$k$</strong> → <code>self.k</code> (近邻数量)</div>
			
 
				+        <div class="symbol-map"><strong>$p$</strong> → <code>p</code> (Lp 范数，p=2 为欧氏距离)</div>
			
 
				+        
			
 
				+    </div>
			
 
				+
			
 
				+    <div class="module">
			
 
				+        <div class="module-title">4️⃣【核心推导】The Math</div>
			
 
				+        
			
 
				+### 距离计算（Lp 范数）
			
 
				+
			
 
				+$$d(x, x^{(i)}) = \left( \sum_{j=1}^{d} |x^{(j)} - x^{(i)(j)}|^p \right)^{1/p}$$
			
 
				+
			
 
				+当 $p=2$ 时为欧氏距离：
			
 
				+
			
 
				+$$d(x, x^{(i)}) = \sqrt{\sum_{j=1}^{d} (x^{(j)} - x^{(i)(j)})^2}$$
			
 
				+
			
 
				+### 投票规则
			
 
				+
			
 
				+$$\hat{y} = \text{argmode}_{c} \sum_{i=1}^{k} \mathbb{I}(y^{(i)} = c)$$
			
 
				+
			
 
				+其中 $\mathbb{I}(\cdot)$ 是指示函数，统计 k 个近邻中各类别出现次数。
			
 
				+
			
 
				+    </div>
			
 
				+
			
 
				+    <div class="module">
			
 
				+        <div class="module-title">5️⃣【工程优化点】The Optimization Bottleneck</div>
			
 
				+        预测时需要计算到所有训练样本的距离，复杂度 $O(N \cdot d)$。使用 KD 树或 Ball 树加速到 $O(\log N)$。
			
 
				+    </div>
			
 
				+
			
 
				+    <div class="module">
			
 
				+        <div class="module-title">6️⃣【今日靶机】The OJ Mission</div>
			
 
				+        <div class="warning">🎯 任务：<code>cd exercises/ && python3 day2_task.py</code></div>
			
 
				+        实现 K 近邻的 distance 和 predict 函数，在手写数字数据集上验证 k 值对准确率的影响。
			
 
				+    </div>
			
 
				+
			
 
				+    <script src="https://cdn.jsdelivr.net/npm/katex@0.16.9/dist/katex.min.js"></script>
			
 
				+    <script src="https://cdn.jsdelivr.net/npm/katex@0.16.9/dist/contrib/auto-render.min.js"></script>
			
 
				+    <script>
			
 
				+        renderMathInElement(document.body, {
			
 
				+            delimiters: [
			
 
				+                {left: '$$', right: '$$', display: true},
			
 
				+                {left: '$', right: '$', display: false}
			
 
				+            ],
			
 
				+            throwOnError: false
			
 
				+        });
			
 
				+    </script>
			
 
				+</body>
			
 
				+</html>
			
--- a/exercises/day2_task.py
+++ b/exercises/day2_task.py
@@ -0,0 +1,72 @@
 
				+"""
			
 
				+Day 2 - K 近邻 练习
			
 
				+
			
 
				+任务：实现 K 近邻 的核心算法
			
 
				+"""
			
 
				+
			
 
				+import numpy as np
			
 
				+import matplotlib.pyplot as plt
			
 
				+
			
 
				+
			
 
				+class KNearestNeighbor:
			
 
				+    """K 近邻 类"""
			
 
				+    
			
 
				+    def __init__(self, learning_rate: float = 0.01):
			
 
				+        self.learning_rate = learning_rate
			
 
				+        self.weights = None
			
 
				+        self.bias = None
			
 
				+    
			
 
				+    def forward(self, X: np.ndarray) -> np.ndarray:
			
 
				+        """前向传播
			
 
				+        
			
 
				+        Args:
			
 
				+            X: 输入数据，shape: [n_samples, n_features]
			
 
				+            
			
 
				+        Returns:
			
 
				+            预测结果，shape: [n_samples]
			
 
				+        """
			
 
				+        # TODO: 实现 f(x) = sign(w · x + b)
			
 
				+        raise NotImplementedError
			
 
				+    
			
 
				+    def compute_loss(self, X: np.ndarray, y: np.ndarray) -> float:
			
 
				+        """计算损失"""
			
 
				+        # TODO: 实现损失函数
			
 
				+        raise NotImplementedError
			
 
				+    
			
 
				+    def update(self, X_i: np.ndarray, y_i: int):
			
 
				+        """更新参数
			
 
				+        
			
 
				+        Args:
			
 
				+            X_i: 单个样本，shape: [n_features]
			
 
				+            y_i: 标签，值域 (-1, 1)
			
 
				+        """
			
 
				+        # TODO: 实现梯度下降更新
			
 
				+        raise NotImplementedError
			
 
				+    
			
 
				+    def fit(self, X: np.ndarray, y: np.ndarray, max_iter: int = 100):
			
 
				+        """训练模型"""
			
 
				+        # TODO: 实现训练循环
			
 
				+        raise NotImplementedError
			
 
				+
			
 
				+
			
 
				+def plot_concept():
			
 
				+    """可视化概念"""
			
 
				+    # 生成二维数据
			
 
				+    np.random.seed(42)
			
 
				+    X = np.random.randn(100, 2)
			
 
				+    y = np.sign(X[:, 0] + X[:, 1] - 0.5) * 1
			
 
				+    
			
 
				+    # 绘制散点图
			
 
				+    plt.figure(figsize=(8, 6))
			
 
				+    scatter = plt.scatter(X[:, 0], X[:, 1], c=y, cmap="bwr", s=100, edgecolors="black")
			
 
				+    plt.xlabel("x1")
			
 
				+    plt.ylabel("x2")
			
 
				+    plt.title("Day 2 - K 近邻 可视化")
			
 
				+    plt.colorbar(scatter)
			
 
				+    plt.grid(True, alpha=0.3)
			
 
				+    plt.savefig("./plots/day2_concept.png", dpi=150)
			
 
				+    print(f"✅ 可视化已保存：plots/day2_concept.png")
			
 
				+
			
 
				+
			
 
				+if __name__ == "__main__":
			
 
				+    plot_concept()
			
--- a/tests/test_day2.py
+++ b/tests/test_day2.py
@@ -0,0 +1,34 @@
 
				+"""
			
 
				+Day 2 - K 近邻 测试用例
			
 
				+"""
			
 
				+
			
 
				+import numpy as np
			
 
				+import sys
			
 
				+sys.path.append("../exercises")
			
 
				+
			
 
				+# TODO: 导入对应的类
			
 
				+# from day2_task import *
			
 
				+
			
 
				+
			
 
				+def test_forward_shape():
			
 
				+    """测试前向传播输出形状"""
			
 
				+    # TODO: 实现测试
			
 
				+    assert True
			
 
				+
			
 
				+
			
 
				+def test_loss_computation():
			
 
				+    """测试损失计算"""
			
 
				+    # TODO: 实现测试
			
 
				+    assert True
			
 
				+
			
 
				+
			
 
				+def test_update_rule():
			
 
				+    """测试参数更新规则"""
			
 
				+    # TODO: 实现测试
			
 
				+    assert True
			
 
				+
			
 
				+
			
 
				+def test_convergence():
			
 
				+    """测试收敛性"""
			
 
				+    # TODO: 实现测试
			
 
				+    assert True