AI 大模型成长计划（改进版·30 天）

适用人群：有完整深度学习项目经验、有 Python 编程基础、有可用 GPU（至少 6GB 显存）的开发者新手提示：如果是从零开始，建议将计划延长至 60 天，每天减少任务量，切勿强行追赶进度——理解比完成更重要。

学习前自检清单

自检项目	达标标准
Python 面向对象	能写一个带 init 和方法的类
NumPy	理解数组形状、广播、矩阵乘法
Pandas	能读 CSV、做 groupby、merge
PyTorch 基础	能用 nn.Module 写一个网络并训练
反向传播	能推导单层网络的梯度
过拟合/正则化	理解 L1/L2、Dropout、Early Stopping

如果超过 3 项不达标：建议先花 1-2 周补充基础，不要强行开始 Day 1。

必读论文（按重要性排序）

优先级	论文	何时读
⭐⭐⭐	Attention Is All You Need	Day 8-9
⭐⭐⭐	BERT: Pre-training of Deep Bidirectional	Day 12
⭐⭐	GPT-3: Language Models are Few-Shot Learners	Day 13
⭐⭐	LoRA: Low-Rank Adaptation of Large Language Models	Day 17
⭐⭐	RLHF (InstructGPT)	Day 25

课程	时长	适用阶段
Stanford CS224N	~20小时	Day 8-14
李宏毅机器学习	~30小时	Day 1-6 辅助
Hugging Face Course	~10小时	Day 11-21
3Blue1Brown 神经网络	~4小时	Day 3

第 1 周：基础夯实（Day 1-7）

本周重点：不要赶进度。PyTorch 不熟练会在后面付出代价。

Day 1 - 环境搭建与工具链：CUDA/PyTorch 安装、Jupyter Lab、HF 账号
Day 2 - PyTorch 核心操作：张量操作、自动求导、GPU 迁移
Day 3 - nn.Module 与训练循环：标准化写法、MNIST 训练、模型保存加载
Day 4 - 经典 CNN 与迁移学习：ResNet Skip Connection、猫狗分类
Day 5 - RNN / LSTM：门机制、IMDB 情感分析
Day 6 - 周中实战：CIFAR-10 完整项目、数据增强、Early Stopping
Day 7 - 第 1 周复习：整理代码、博客复盘、自我评分

第 2 周：Transformer 与大模型基础（Day 8-14）

本周是最关键的一周。Transformer 的理解深度决定了后面所有内容的学习效率。

Day 8 - Attention 机制直觉与实现：从零手写 Scaled Dot-Product Attention
Day 9 - Transformer Encoder 完整实现：Positional Encoding、Add & Norm
Day 10 - Transformer Decoder 与生成：Masked Attention、贪婪解码、Top-p 采样
Day 11 - Tokenizer 与文本预处理：BPE / WordPiece 原理、HuggingFace 分词器
Day 12 - BERT 与预训练范式：MLM / NSP、微调实战
Day 13 - GPT 与自回归生成：零样本 / 少样本、Prompt Engineering 基础
Day 14 - 第 2 周综合：机器翻译或问答系统

第 2 周完成标准：

✅ 能从零实现 Multi-Head Attention
✅ 能从零实现 Positional Encoding
✅ 能解释 BERT 和 GPT 的区别
✅ 能用 Hugging Face 微调模型

第 3 周：大模型核心技术（Day 15-21）

Day 15-18 建议用小模型（GPT-2、LLaMA-2-7B）做实验，不要尝试从头预训练。

Day 15 - 大模型训练基础：语料来源、数据清洗、Cosine Annealing、Warmup
Day 16 - ⭐ 参数高效微调（LoRA）：低秩分解、QLoRA、4-bit 量化实战
Day 17 - 模型量化：INT8/INT4、GGUF、GPTQ/AWQ
Day 18 - RAG 检索增强生成：ChromaDB、Embedding、重排序、RAGAS 评估
Day 19 - Agent 基础：ReAct 范式、Tool Calling、LangChain Agent
Day 20 - Prompt Engineering 进阶：CoT、Few-shot、Structured Output
Day 21 - 第 3 周综合项目：领域知识助手 / LLaMA 微调 / 多模态应用

第 4 周：进阶与综合（Day 22-30）

Day 22 - 多模态大模型：CLIP、LLaVA、GPT-4V
Day 23 - 模型评估：Perplexity、BLEU、MMLU、HumanEval
Day 24 - ⭐ 大模型安全与对齐（RLHF / DPO）
Day 25 - 大模型部署：vLLM、TGI、FastAPI、SSE 流式输出
Day 26 - 前沿技术调研：MoE、长上下文、Agent 系统、推理优化
Day 27 - 开源项目实践：源码阅读、good first issue、提交 PR
Day 28 - 综合项目收尾：完善 Day 21 项目、README、部署上线
Day 29 - 30 天总结与反思：整理代码笔记、回顾完成度
Day 30 - 后续学习路线：Agent / 多模态 / 推理优化 / RLHF / 学术研究

每日学习模板

\\markdown

Day X - [主题]

⏱️ 实际用时：___ 小时（计划 ___ 小时）

✅ 今日完成

任务 1
任务 2

📝 关键概念（3 句话总结今天学到的最重要的东西） 1. 2. 3.

🐛 遇到的问题与解决

问题：___ 解决：___

💡 明日计划

继续 Day X 剩余任务 / 开始 Day X+1 \\

30 天成就清单

从零实现 Transformer：

✅ Scaled Dot-Product Attention
✅ Positional Encoding
✅ Encoder Layer + Decoder Layer

使用 Hugging Face：

✅ BERT 微调（文本分类）
✅ GPT-2 文本生成
✅ LoRA 微调大模型
✅ RAG 知识库问答
✅ Agent 工具调用

工程能力：

✅ 模型部署（vLLM / FastAPI）
✅ 模型量化（QLoRA / llama.cpp）
✅ 模型评估（lm-evaluation-harness）

环境安装一条命令

\\ash conda create -n llm python=3.10 -y conda activate llm pip install torch torchvision torchaudio —index-url https://download.pytorch.org/whl/cu118 pip install transformers datasets peft accelerate bitsandbytes langchain sentence-transformers faiss-cpu vllm lm-eval \\

常见问题 Q&A

Q：没有 GPU 能完成吗？ A：Day 1-14 大部分任务可在 Colab T4 上完成。Day 15-21 训练任务需要 A100，可考虑 RunPod 按需付费（约 .5/小时）。

Q：进度落后了怎么办？ A：不要跳着赶进度。第 2 周（Transformer）是整个计划的基础，没理解后面全是白学。

Q：Day 16 LoRA 跑不起来？ A：用 GPT-2 代替 LLaMA-2-7B，代码完全兼容，只是参数更少。如果 Colab T4 也不够，用 QLoRA 4-bit 模式。

最后更新：2026 年 5 月 21 日 改进版 by QClaw AI 助手 基于杨戬 AI 助手原版计划优化