skip to content
文章 · 2026年5月

AI 大模型成长计划(改进版·30 天)


适用人群:有完整深度学习项目经验、有 Python 编程基础、有可用 GPU(至少 6GB 显存)的开发者 新手提示:如果是从零开始,建议将计划延长至 60 天,每天减少任务量,切勿强行追赶进度——理解比完成更重要。


学习前自检清单

自检项目达标标准
Python 面向对象能写一个带 init 和方法的类
NumPy理解数组形状、广播、矩阵乘法
Pandas能读 CSV、做 groupby、merge
PyTorch 基础能用 nn.Module 写一个网络并训练
反向传播能推导单层网络的梯度
过拟合/正则化理解 L1/L2、Dropout、Early Stopping

如果超过 3 项不达标:建议先花 1-2 周补充基础,不要强行开始 Day 1。


必读论文(按重要性排序)

优先级论文何时读
⭐⭐⭐Attention Is All You NeedDay 8-9
⭐⭐⭐BERT: Pre-training of Deep BidirectionalDay 12
⭐⭐GPT-3: Language Models are Few-Shot LearnersDay 13
⭐⭐LoRA: Low-Rank Adaptation of Large Language ModelsDay 17
⭐⭐RLHF (InstructGPT)Day 25

推荐课程

课程时长适用阶段
Stanford CS224N~20小时Day 8-14
李宏毅机器学习~30小时Day 1-6 辅助
Hugging Face Course~10小时Day 11-21
3Blue1Brown 神经网络~4小时Day 3

第 1 周:基础夯实(Day 1-7)

本周重点:不要赶进度。PyTorch 不熟练会在后面付出代价。

  • Day 1 - 环境搭建与工具链:CUDA/PyTorch 安装、Jupyter Lab、HF 账号
  • Day 2 - PyTorch 核心操作:张量操作、自动求导、GPU 迁移
  • Day 3 - nn.Module 与训练循环:标准化写法、MNIST 训练、模型保存加载
  • Day 4 - 经典 CNN 与迁移学习:ResNet Skip Connection、猫狗分类
  • Day 5 - RNN / LSTM:门机制、IMDB 情感分析
  • Day 6 - 周中实战:CIFAR-10 完整项目、数据增强、Early Stopping
  • Day 7 - 第 1 周复习:整理代码、博客复盘、自我评分

第 2 周:Transformer 与大模型基础(Day 8-14)

本周是最关键的一周。Transformer 的理解深度决定了后面所有内容的学习效率。

  • Day 8 - Attention 机制直觉与实现:从零手写 Scaled Dot-Product Attention
  • Day 9 - Transformer Encoder 完整实现:Positional Encoding、Add & Norm
  • Day 10 - Transformer Decoder 与生成:Masked Attention、贪婪解码、Top-p 采样
  • Day 11 - Tokenizer 与文本预处理:BPE / WordPiece 原理、HuggingFace 分词器
  • Day 12 - BERT 与预训练范式:MLM / NSP、微调实战
  • Day 13 - GPT 与自回归生成:零样本 / 少样本、Prompt Engineering 基础
  • Day 14 - 第 2 周综合:机器翻译或问答系统

第 2 周完成标准

  • ✅ 能从零实现 Multi-Head Attention
  • ✅ 能从零实现 Positional Encoding
  • ✅ 能解释 BERT 和 GPT 的区别
  • ✅ 能用 Hugging Face 微调模型

第 3 周:大模型核心技术(Day 15-21)

Day 15-18 建议用小模型(GPT-2、LLaMA-2-7B)做实验,不要尝试从头预训练。

  • Day 15 - 大模型训练基础:语料来源、数据清洗、Cosine Annealing、Warmup
  • Day 16 - ⭐ 参数高效微调(LoRA):低秩分解、QLoRA、4-bit 量化实战
  • Day 17 - 模型量化:INT8/INT4、GGUF、GPTQ/AWQ
  • Day 18 - RAG 检索增强生成:ChromaDB、Embedding、重排序、RAGAS 评估
  • Day 19 - Agent 基础:ReAct 范式、Tool Calling、LangChain Agent
  • Day 20 - Prompt Engineering 进阶:CoT、Few-shot、Structured Output
  • Day 21 - 第 3 周综合项目:领域知识助手 / LLaMA 微调 / 多模态应用

第 4 周:进阶与综合(Day 22-30)

  • Day 22 - 多模态大模型:CLIP、LLaVA、GPT-4V
  • Day 23 - 模型评估:Perplexity、BLEU、MMLU、HumanEval
  • Day 24 - ⭐ 大模型安全与对齐(RLHF / DPO)
  • Day 25 - 大模型部署:vLLM、TGI、FastAPI、SSE 流式输出
  • Day 26 - 前沿技术调研:MoE、长上下文、Agent 系统、推理优化
  • Day 27 - 开源项目实践:源码阅读、good first issue、提交 PR
  • Day 28 - 综合项目收尾:完善 Day 21 项目、README、部署上线
  • Day 29 - 30 天总结与反思:整理代码笔记、回顾完成度
  • Day 30 - 后续学习路线:Agent / 多模态 / 推理优化 / RLHF / 学术研究

每日学习模板

\\markdown

Day X - [主题]

⏱️ 实际用时:___ 小时(计划 ___ 小时)

✅ 今日完成

  • 任务 1
  • 任务 2

📝 关键概念(3 句话总结今天学到的最重要的东西) 1. 2. 3.

🐛 遇到的问题与解决

  • 问题:___ 解决:___

💡 明日计划

  • 继续 Day X 剩余任务 / 开始 Day X+1 \\

30 天成就清单

从零实现 Transformer

  • ✅ Scaled Dot-Product Attention
  • ✅ Positional Encoding
  • ✅ Encoder Layer + Decoder Layer

使用 Hugging Face

  • ✅ BERT 微调(文本分类)
  • ✅ GPT-2 文本生成
  • ✅ LoRA 微调大模型
  • ✅ RAG 知识库问答
  • ✅ Agent 工具调用

工程能力

  • ✅ 模型部署(vLLM / FastAPI)
  • ✅ 模型量化(QLoRA / llama.cpp)
  • ✅ 模型评估(lm-evaluation-harness)

环境安装一条命令

\\ash conda create -n llm python=3.10 -y conda activate llm pip install torch torchvision torchaudio —index-url https://download.pytorch.org/whl/cu118 pip install transformers datasets peft accelerate bitsandbytes langchain sentence-transformers faiss-cpu vllm lm-eval \\


常见问题 Q&A

Q:没有 GPU 能完成吗? A:Day 1-14 大部分任务可在 Colab T4 上完成。Day 15-21 训练任务需要 A100,可考虑 RunPod 按需付费(约 .5/小时)。

Q:进度落后了怎么办? A:不要跳着赶进度。第 2 周(Transformer)是整个计划的基础,没理解后面全是白学。

Q:Day 16 LoRA 跑不起来? A:用 GPT-2 代替 LLaMA-2-7B,代码完全兼容,只是参数更少。如果 Colab T4 也不够,用 QLoRA 4-bit 模式。


最后更新:2026 年 5 月 21 日 改进版 by QClaw AI 助手 基于杨戬 AI 助手原版计划优化