破解"知其然不知其所以然"——决策树 → 线性回归 → 推荐算法 → 神经网络,素养导向的算法筑基路径
高中 AI 教育正从"工具体验"走向"原理理解"。2025 年版课程标准新增"人工智能初步"选择性必修模块[3],全国各省密集出台 AI 教育行动方案[5][6],但一线教学面临"黑箱化""悬浮化""碎片化"三大困境。
本报告提出四级递进的算法筑基路径(决策树 → 线性回归 → 推荐算法 → 神经网络),并以全国特等奖公开课为核心案例[14],构建算法教学与核心素养的三维映射框架,为一线教师提供可操作的教学设计参考。
2025 年 5 月,教育部发布《中小学人工智能通识教育指南(2025 年版)》[1],明确将 AI 教育从"了解"推向"理解"层次。同年 11 月,《教师生成式人工智能应用指引(第一版)》进一步要求教师具备引导学生理解 AI 原理的能力[2]。然而,政策的快速推进与一线教学的准备不足之间,存在显著张力。
北京师范大学 2025 年发布的《人工智能赋能基础教育应用蓝皮书》指出,当前中小学 AI 教育普遍停留在"工具体验"层面[4]。学生能使用 ChatGPT 写作文、用 Midjourney 生成图片,却无法回答"推荐系统为什么知道我喜欢什么""图像识别是如何区分猫和狗的"等基本原理问题。
部分教师在讲解机器学习时直接展示数学公式(如梯度下降、损失函数),学生听不懂,学完即忘。另一些教师则完全回避算法原理,仅让学生调用封装好的 API,导致教学"两极分化"。中国教育学会的课标解读指出,需要找到"数学严谨性"与"教学可及性"之间的平衡点[10]。
现行教材中,决策树、聚类、神经网络等内容往往以独立章节呈现,缺乏逻辑递进关系。学生学完分类、回归、推荐等概念后,无法建立"从简单到复杂"的认知框架,也难以理解不同算法之间的演化脉络[11]。
三大困境的共同根源在于:当前 AI 教育缺少一条从"可感知"到"可理解"再到"可迁移"的教学路径。算法教学不是要把高中生培养成机器学习工程师,而是要让他们理解 AI 决策的基本逻辑,形成对技术的批判性思维。
基于 AI4K12 的"Five Big Ideas"框架[7]、UNESCO 的全球 K-12 AI 课程映射[8]以及 2025 版课程标准的能力要求[3],本报告提出一条四级递进的算法教学路径。每一级在复杂度、数学要求和素养培养目标上均有进阶,形成"螺旋上升"的学习闭环。
通过"如果-那么"规则对数据进行递归分割,实现分类决策。决策树的可视化特性使其成为最适合入门的算法:学生可以直观看到每个分支节点的判断依据。
2 课时(1 课时活动体验 + 1 课时代码实现)
"20 个问题猜动物"——学生扮演决策树,通过是/否提问逐步缩小范围,最终构建出一棵分类树。对比不同学生的提问顺序,讨论为什么有的策略更高效(引出信息增益概念)。
用一条直线(或超平面)拟合数据点之间的关系,实现连续值预测。线性回归引入了"损失函数"和"最优化"这两个贯穿机器学习的核心概念。
2 课时(1 课时 Excel 散点图 + 趋势线体验,1 课时 Python sklearn 实现)
收集班级同学身高与鞋码数据,在 Excel 中绘制散点图并添加趋势线,观察线性关系。然后用 Python 的 sklearn.linear_model 进行拟合,计算预测误差,讨论"什么情况下线性模型不够用"。
基于用户行为数据或物品特征,计算相似度并推荐内容。推荐算法天然连接学生日常体验(短视频推荐、购物推荐),是将算法原理与生活实际结合的最佳教学切入点。
2-3 课时(1 课时电子表格手动计算,1 课时 Python 实现,1 课时讨论伦理问题)
详见第三章——全国特等奖公开课的完整教学设计拆解[14]。
模拟神经元连接,通过多层网络和反向传播实现自动特征学习。神经网络是理解深度学习的基础,也是学生从"使用 AI"到"理解 AI 如何学习"的关键跨越。
3 课时(1 课时 Teachable Machine 体验[15],1 课时手动感知器计算,1 课时 TensorFlow Playground 可视化)
先用 Google Teachable Machine 训练图像分类器(10 分钟上手),再手动计算单层感知器的 AND/OR 运算,发现 XOR 无法用单层实现("aha moment"),最后在 TensorFlow Playground 中观察多层网络如何学习复杂边界。
| 维度 | L1 决策树 | L2 线性回归 | L3 推荐算法 | L4 神经网络 |
|---|---|---|---|---|
| 数学要求 | 集合、概率 | 函数、最值 | 向量、余弦 | 矩阵、导数 |
| 编程要求 | 条件分支 | sklearn 调用 | numpy 计算 | TF/PyTorch |
| 适合年级 | 高一 | 高一下~高二 | 高二 | 高二~高三 |
| 核心产出 | 分类树可视化 | 回归预测模型 | 推荐系统原型 | 图像分类器 |
本章以全国高中信息科技新课标优质公开课特等奖课例——周紫婷老师的"探秘人工智能——机器学习之个性化推荐算法"为核心案例[14],详细分析其教学设计的内在逻辑和素养落地路径。
从学生最熟悉的场景切入——购物推荐、短视频推荐、电影推荐。周老师的开场问题是:"各大软件平台是如何给我们实现精准推荐的呢?"
学生自发讨论出"获取数据 → 知道爱好 → 实现推荐"的朴素猜想。一位同学提到"窃取你的信息了"——这个回答恰好为后续的数据隐私讨论埋下伏笔。
全班分为内容组和协同组,分别体验两种不同的推荐策略:
两组展示完成后,教师引导学生发现:两种算法的大体思路是一致的。
随后讨论两种方法的优缺点:
关键的"脚手架"策略——从电子表格的简单匹配计数,过渡到 Python 中更精确的余弦相似度计算。
numpy.dot()(向量点积)和 numpy.linalg.norm()(向量模长)两个函数的使用方法余弦相似度公式 = 数学中向量夹角的余弦值公式。教师在课堂上明确建立这一联系:"这个公式其实和数学里面计算向量夹角的余弦值 cosθ 是一样的。在数学里它是纯几何概念,在机器学习里它是相似度计算的工具。"
在整节课的讨论中,周老师持续引导学生思考数据伦理问题:
这节课的核心价值不在于学生是否掌握了余弦相似度的数学证明,而在于:(1) 通过分组对比,学生自主发现了两种算法的异同;(2) 从电子表格到 Python 的梯度过渡,让"代码实现"不再令人恐惧;(3) 数据隐私的讨论自然嵌入而非生硬说教。这正是"素养导向"教学的范本——算法知识为载体,核心素养为目标。
除推荐算法外,四级递进路径中的决策树、线性回归和神经网络也需要相应的教学设计。以下方案遵循相同的设计原则:生活情境导入、可操作的体验活动、从表格/可视化到代码的梯度过渡。
用 sklearn 的 DecisionTreeClassifier 训练鸢尾花分类器,导出决策树图形,与手动构建的"动物决策树"对比结构。讨论"树的深度"与"过拟合"的关系。
用 LinearRegression 拟合同一组数据,输出斜率、截距和 R² 值。然后刻意引入非线性数据(如年龄与反应速度),让学生发现线性模型的局限,为后续"需要更复杂模型"的认知做铺垫。
用 Google Teachable Machine[15] 训练一个手势识别分类器。学生用摄像头采集"石头""剪刀""布"三类图像各 50 张,点击训练,30 秒后即可实时测试。重点讨论:训练数据量、多样性对识别准确率的影响。
在 TensorFlow Playground 中观察不同层数、不同神经元数量下,分类边界如何变化。感受"深度"的力量——层数越多,能学习的模式越复杂。
2025 版课程标准将信息技术学科核心素养归纳为信息意识、计算思维、数字化学习与创新、信息社会责任四个维度[3]。本报告将前两者与"社会责任"维度结合,构建算法教学的三维素养映射框架,展示每个算法层级如何对应具体的素养培养目标。
| 素养维度 | L1 决策树 | L2 线性回归 | L3 推荐算法 | L4 神经网络 |
|---|---|---|---|---|
| 数据意识 | 特征选择:识别哪些属性对分类有意义 | 数据清洗:异常值对拟合结果的影响 | 用户行为数据采集:观看、点赞、评分等 | 训练集/测试集划分:数据量与模型表现的关系 |
| 计算思维 | 递归分割:将大问题分解为子问题 | 损失函数优化:定义"好"的标准并最小化偏差 | 相似度度量:将"相似"从直觉转化为可计算的数值 | 梯度下降:通过迭代逐步逼近最优解 |
| 社会责任 | 决策偏见:训练数据不均衡导致歧视性分类 | 模型偏差:数据偏倚如何导致不公平预测 | 信息茧房与隐私:推荐系统对认知的塑造 | AI 伦理:深度伪造、自动化决策的边界 |
从 L1 的"选择什么特征"到 L4 的"需要多少数据才够",学生逐步建立起数据驱动决策的思维方式。核心认知跃迁:数据不是天然存在的,而是需要被收集、清洗和结构化的。在推荐算法课中,学生意识到"我的每一次点赞都是在提供数据"——这一发现往往比任何隐私讲座都更有冲击力。
从 L1 的"分治"到 L4 的"迭代优化",学生经历了计算思维的四个关键模式。核心认知跃迁:机器"学习"不是魔法,而是通过定义目标函数、不断调整参数来逼近最优解的过程。理解这一点后,学生才能对 AI 的能力和局限做出理性判断。
与数据意识和计算思维不同,社会责任维度不需要额外的教学时间——它可以(也应该)自然嵌入每个算法的教学中。周紫婷老师课中学生提到"窃取你的信息了",就是社会责任意识的自发萌芽[14]。教师需要做的不是"增加一节伦理课",而是在算法教学中留出讨论空间,让伦理思考成为理解算法的一部分。