神经网络与深度学习新手指南¶
从感知机到 Transformer,用直觉理解 AI 的核心引擎
欢迎来到神经网络与深度学习的世界!本教程专为 零基础学习者 设计,用生活化的比喻和严谨的逻辑,带你从神经元的基本概念一路走到大语言模型(LLM)的核心原理。
为什么学这个?¶
2026 年,AI 已经渗透到我们生活的方方面面——从 ChatGPT 到自动驾驶,从医疗诊断到金融预测。理解神经网络不再是研究者的专利,而是每个技术从业者的 必备素养 。
但传统的神经网络教程往往陷入两个极端:要么过于数学化让人望而却步,要么过于简化让人知其然不知其所以然。本教程走 第三条路 :
- 直觉先行 :每个概念先用生活化比喻建立直觉,再引入数学公式
- 代码验证 :用 Python + NumPy 从零实现核心算法,让抽象概念变得可触摸
- 层层递进 :从单个神经元到 Transformer,每一步都建立在上一章的基础上
学习路径¶
本教程采用 概念驱动 + 代码实践 的方式,8 个章节形成一条完整的认知链:
| 章节 | 核心问题 | 核心比喻 | 预计时长 |
|---|---|---|---|
| 第 1 章:什么是神经网络 | 神经网络到底是什么? | 神经元 = 投票器 | 1.5h |
| 第 2 章:梯度下降算法 | 网络如何"学习"? | 盲人下山找最低点 | 2h |
| 第 3 章:反向传播直觉 | 误差如何传递回每一层? | 接力传话 + 责任追溯 | 2h |
| 第 4 章:反向传播数学 | 链式法则如何驱动学习? | 多米诺骨牌连锁反应 | 2h |
| 第 5 章:大语言模型介绍 | LLM 的本质是什么? | 超级预测机 | 1.5h |
| 第 6 章:Transformer 架构 | LLM 的引擎如何运转? | 流水线工厂 | 2h |
| 第 7 章:注意力机制 | 模型如何"关注"关键信息? | 聚光灯 | 2h |
| 第 8 章:LLM 如何记忆 | 模型如何存储和检索知识? | 图书馆索引 | 2h |
前置要求¶
| 知识点 | 要求程度 | 说明 |
|---|---|---|
| Python 基础 | 基本会用 | 能看懂 for 循环、函数定义即可 |
| 高中数学 | 了解即可 | 导数、矩阵乘法的概念会在教程中回顾 |
| NumPy | 不需要 | 教程中会逐步引入,边学边用 |
完全零基础?
如果你连 Python 都不会,建议先花 2 小时看一遍 Python 官方教程的前 5 章,然后回来。本教程的代码示例都非常简单,重点是理解概念。
学习建议¶
- 不要跳章 —— 每一章都建立在前面章节的基础上,跳章会导致理解断层
- 动手敲代码 —— 每个代码示例都自己运行一遍,观察输出结果
- 先直觉后公式 —— 如果数学部分让你头疼,先读比喻和文字解释,再回来看公式
- 善用比喻 —— 每个核心比喻都是精心设计的"思维锚点",用它来回忆概念
参考资源¶
本教程的讲解风格深受以下资源的启发:
- 3Blue1Brown —— Neural Networks 系列视频,提供了神经网络最优雅的几何直觉
- Andrej Karpathy —— micrograd 和 nanoGPT,从零实现神经网络的典范
- 《Deep Learning》by Goodfellow, Bengio & Courville —— 深度学习的"圣经",提供了严谨的数学基础
准备好了吗? 开始第 1 章:什么是神经网络 →