跳转至

神经网络与深度学习新手指南

从感知机到 Transformer,用直觉理解 AI 的核心引擎

欢迎来到神经网络与深度学习的世界!本教程专为 零基础学习者 设计,用生活化的比喻和严谨的逻辑,带你从神经元的基本概念一路走到大语言模型(LLM)的核心原理。


为什么学这个?

2026 年,AI 已经渗透到我们生活的方方面面——从 ChatGPT 到自动驾驶,从医疗诊断到金融预测。理解神经网络不再是研究者的专利,而是每个技术从业者的 必备素养

但传统的神经网络教程往往陷入两个极端:要么过于数学化让人望而却步,要么过于简化让人知其然不知其所以然。本教程走 第三条路

  • 直觉先行 :每个概念先用生活化比喻建立直觉,再引入数学公式
  • 代码验证 :用 Python + NumPy 从零实现核心算法,让抽象概念变得可触摸
  • 层层递进 :从单个神经元到 Transformer,每一步都建立在上一章的基础上

学习路径

本教程采用 概念驱动 + 代码实践 的方式,8 个章节形成一条完整的认知链:

章节 核心问题 核心比喻 预计时长
第 1 章:什么是神经网络 神经网络到底是什么? 神经元 = 投票器 1.5h
第 2 章:梯度下降算法 网络如何"学习"? 盲人下山找最低点 2h
第 3 章:反向传播直觉 误差如何传递回每一层? 接力传话 + 责任追溯 2h
第 4 章:反向传播数学 链式法则如何驱动学习? 多米诺骨牌连锁反应 2h
第 5 章:大语言模型介绍 LLM 的本质是什么? 超级预测机 1.5h
第 6 章:Transformer 架构 LLM 的引擎如何运转? 流水线工厂 2h
第 7 章:注意力机制 模型如何"关注"关键信息? 聚光灯 2h
第 8 章:LLM 如何记忆 模型如何存储和检索知识? 图书馆索引 2h

前置要求

知识点 要求程度 说明
Python 基础 基本会用 能看懂 for 循环、函数定义即可
高中数学 了解即可 导数、矩阵乘法的概念会在教程中回顾
NumPy 不需要 教程中会逐步引入,边学边用

完全零基础?

如果你连 Python 都不会,建议先花 2 小时看一遍 Python 官方教程的前 5 章,然后回来。本教程的代码示例都非常简单,重点是理解概念。


学习建议

  1. 不要跳章 —— 每一章都建立在前面章节的基础上,跳章会导致理解断层
  2. 动手敲代码 —— 每个代码示例都自己运行一遍,观察输出结果
  3. 先直觉后公式 —— 如果数学部分让你头疼,先读比喻和文字解释,再回来看公式
  4. 善用比喻 —— 每个核心比喻都是精心设计的"思维锚点",用它来回忆概念

参考资源

本教程的讲解风格深受以下资源的启发:

  • 3Blue1Brown —— Neural Networks 系列视频,提供了神经网络最优雅的几何直觉
  • Andrej Karpathy —— microgradnanoGPT,从零实现神经网络的典范
  • 《Deep Learning》by Goodfellow, Bengio & Courville —— 深度学习的"圣经",提供了严谨的数学基础

准备好了吗? 开始第 1 章:什么是神经网络 →