适用人群:有完整深度学习项目经验、有 Python 编程基础、有可用 GPU(至少 6GB 显存)的开发者 新手提示:如果是从零开始,建议将计划延长至 60 天,每天减少任务量,切勿强行追赶进度——理解比完成更重要。
学习前自检清单
| 自检项目 | 达标标准 |
|---|---|
| Python 面向对象 | 能写一个带 init 和方法的类 |
| NumPy | 理解数组形状、广播、矩阵乘法 |
| Pandas | 能读 CSV、做 groupby、merge |
| PyTorch 基础 | 能用 nn.Module 写一个网络并训练 |
| 反向传播 | 能推导单层网络的梯度 |
| 过拟合/正则化 | 理解 L1/L2、Dropout、Early Stopping |
如果超过 3 项不达标:建议先花 1-2 周补充基础,不要强行开始 Day 1。
必读论文(按重要性排序)
| 优先级 | 论文 | 何时读 |
|---|---|---|
| ⭐⭐⭐ | Attention Is All You Need | Day 8-9 |
| ⭐⭐⭐ | BERT: Pre-training of Deep Bidirectional | Day 12 |
| ⭐⭐ | GPT-3: Language Models are Few-Shot Learners | Day 13 |
| ⭐⭐ | LoRA: Low-Rank Adaptation of Large Language Models | Day 17 |
| ⭐⭐ | RLHF (InstructGPT) | Day 25 |
推荐课程
| 课程 | 时长 | 适用阶段 |
|---|---|---|
| Stanford CS224N | ~20小时 | Day 8-14 |
| 李宏毅机器学习 | ~30小时 | Day 1-6 辅助 |
| Hugging Face Course | ~10小时 | Day 11-21 |
| 3Blue1Brown 神经网络 | ~4小时 | Day 3 |
第 1 周:基础夯实(Day 1-7)
本周重点:不要赶进度。PyTorch 不熟练会在后面付出代价。
- Day 1 - 环境搭建与工具链:CUDA/PyTorch 安装、Jupyter Lab、HF 账号
- Day 2 - PyTorch 核心操作:张量操作、自动求导、GPU 迁移
- Day 3 - nn.Module 与训练循环:标准化写法、MNIST 训练、模型保存加载
- Day 4 - 经典 CNN 与迁移学习:ResNet Skip Connection、猫狗分类
- Day 5 - RNN / LSTM:门机制、IMDB 情感分析
- Day 6 - 周中实战:CIFAR-10 完整项目、数据增强、Early Stopping
- Day 7 - 第 1 周复习:整理代码、博客复盘、自我评分
第 2 周:Transformer 与大模型基础(Day 8-14)
本周是最关键的一周。Transformer 的理解深度决定了后面所有内容的学习效率。
- Day 8 - Attention 机制直觉与实现:从零手写 Scaled Dot-Product Attention
- Day 9 - Transformer Encoder 完整实现:Positional Encoding、Add & Norm
- Day 10 - Transformer Decoder 与生成:Masked Attention、贪婪解码、Top-p 采样
- Day 11 - Tokenizer 与文本预处理:BPE / WordPiece 原理、HuggingFace 分词器
- Day 12 - BERT 与预训练范式:MLM / NSP、微调实战
- Day 13 - GPT 与自回归生成:零样本 / 少样本、Prompt Engineering 基础
- Day 14 - 第 2 周综合:机器翻译或问答系统
第 2 周完成标准:
- ✅ 能从零实现 Multi-Head Attention
- ✅ 能从零实现 Positional Encoding
- ✅ 能解释 BERT 和 GPT 的区别
- ✅ 能用 Hugging Face 微调模型
第 3 周:大模型核心技术(Day 15-21)
Day 15-18 建议用小模型(GPT-2、LLaMA-2-7B)做实验,不要尝试从头预训练。
- Day 15 - 大模型训练基础:语料来源、数据清洗、Cosine Annealing、Warmup
- Day 16 - ⭐ 参数高效微调(LoRA):低秩分解、QLoRA、4-bit 量化实战
- Day 17 - 模型量化:INT8/INT4、GGUF、GPTQ/AWQ
- Day 18 - RAG 检索增强生成:ChromaDB、Embedding、重排序、RAGAS 评估
- Day 19 - Agent 基础:ReAct 范式、Tool Calling、LangChain Agent
- Day 20 - Prompt Engineering 进阶:CoT、Few-shot、Structured Output
- Day 21 - 第 3 周综合项目:领域知识助手 / LLaMA 微调 / 多模态应用
第 4 周:进阶与综合(Day 22-30)
- Day 22 - 多模态大模型:CLIP、LLaVA、GPT-4V
- Day 23 - 模型评估:Perplexity、BLEU、MMLU、HumanEval
- Day 24 - ⭐ 大模型安全与对齐(RLHF / DPO)
- Day 25 - 大模型部署:vLLM、TGI、FastAPI、SSE 流式输出
- Day 26 - 前沿技术调研:MoE、长上下文、Agent 系统、推理优化
- Day 27 - 开源项目实践:源码阅读、good first issue、提交 PR
- Day 28 - 综合项目收尾:完善 Day 21 项目、README、部署上线
- Day 29 - 30 天总结与反思:整理代码笔记、回顾完成度
- Day 30 - 后续学习路线:Agent / 多模态 / 推理优化 / RLHF / 学术研究
每日学习模板
\\markdown
Day X - [主题]
⏱️ 实际用时:___ 小时(计划 ___ 小时)
✅ 今日完成
- 任务 1
- 任务 2
📝 关键概念(3 句话总结今天学到的最重要的东西) 1. 2. 3.
🐛 遇到的问题与解决
- 问题:___ 解决:___
💡 明日计划
- 继续 Day X 剩余任务 / 开始 Day X+1 \\
30 天成就清单
从零实现 Transformer:
- ✅ Scaled Dot-Product Attention
- ✅ Positional Encoding
- ✅ Encoder Layer + Decoder Layer
使用 Hugging Face:
- ✅ BERT 微调(文本分类)
- ✅ GPT-2 文本生成
- ✅ LoRA 微调大模型
- ✅ RAG 知识库问答
- ✅ Agent 工具调用
工程能力:
- ✅ 模型部署(vLLM / FastAPI)
- ✅ 模型量化(QLoRA / llama.cpp)
- ✅ 模型评估(lm-evaluation-harness)
环境安装一条命令
\\ash conda create -n llm python=3.10 -y conda activate llm pip install torch torchvision torchaudio —index-url https://download.pytorch.org/whl/cu118 pip install transformers datasets peft accelerate bitsandbytes langchain sentence-transformers faiss-cpu vllm lm-eval \\
常见问题 Q&A
Q:没有 GPU 能完成吗? A:Day 1-14 大部分任务可在 Colab T4 上完成。Day 15-21 训练任务需要 A100,可考虑 RunPod 按需付费(约 .5/小时)。
Q:进度落后了怎么办? A:不要跳着赶进度。第 2 周(Transformer)是整个计划的基础,没理解后面全是白学。
Q:Day 16 LoRA 跑不起来? A:用 GPT-2 代替 LLaMA-2-7B,代码完全兼容,只是参数更少。如果 Colab T4 也不够,用 QLoRA 4-bit 模式。
最后更新:2026 年 5 月 21 日 改进版 by QClaw AI 助手 基于杨戬 AI 助手原版计划优化