高考结束才是真正开始学习：给AI时代新人的一份真实学习路线图-编程实验室

“高考结束才是真正开始学习”：给AI时代新人的一份真实学习路线图

0. 一句话背后的信号

2026年6月7日，北京人大附中考点，一位考生提前半小时走出考场。记者问高考后的打算，他说：

“高考只是这个阶段的结束，自己未来想学的专业也偏向AI，高考结束后才是真正该开始学习的时候。”

这句话火了。不是因为说得漂亮，是因为它说对了一件事：高考不是学习的终点，是真正学习的起点。

更关键的信号是：一个刚考完的高中生，第一反应是"要学AI"。这说明AI已经从"技术圈的话题"变成了"普通人的选择"。

这篇文章的目的不是励志，是给你一份从零到能干活的AI学习路线图。不谈概念，谈具体怎么学、用什么学、踩了什么坑。

1. 先说清楚：学AI不是学"怎么用ChatGPT"

很多人说"我想学AI"，但脑子里想的是"学会用AI工具提升效率"。这没错，但这不是"学AI"，这是"学使用工具"。

学AI指的是：理解模型怎么工作、能训练或微调模型、能搭建基于AI的应用、能解决模型解决不了的问题。

这两条路区别很大：

目标	适合人群	时间投入	产出
用AI提升效率	所有人	1-2周入门	工作效率提升
学AI技术	想转行/深造的人	6-12个月系统学	能搭建AI应用、做相关研究

这篇文章面向的是后者：想系统学AI技术的人。如果你只是想用AI工具，去用就行了，不需要路线图。

2. 路线图：四个阶段，从零到能干活

阶段一：数学+编程基础（4-8周）

为什么需要：AI的底层是数学（线性代数、概率统计、微积分），工具是编程（Python）。没有这两样，后面全是黑箱，出了问题不知道怎么调。

数学部分（不需要学完，够用就行）：

线性代数：矩阵运算、向量空间、特征值——深度学习的基础
- 推荐：3Blue1Brown 的线性代数可视化系列（YouTube/B站），直观不枯燥
- 书：《线性代数应该这样学》（Axler）——比国内教材直观
概率统计：贝叶斯、分布、期望方差——机器学习的核心
- 推荐：可汗学院概率统计课程（免费，讲得清楚）
- 实战：用 Python numpy 随机模拟抛硬币、蒙特卡洛方法
微积分：梯度、偏导数、链式法则——神经网络反向传播的基础
- 推荐：3Blue1Brown 微积分系列，重点看"梯度下降"那几集

编程部分（Python 是绝对主流）：

# 第一周就能写出来的"AI感觉"代码importnumpyasnp# 手动实现一个最简单的线性回归（不用任何AI框架）deflinear_regression(X,y,learning_rate=0.01,epochs=1000):# 初始化参数w=np.zeros(X.shape[1])b=0for_inrange(epochs):# 前向传播y_pred=np.dot(X,w)+b# 计算损失（均方误差）loss=np.mean((y_pred-y)**2)# 反向传播（梯度下降）dw=np.dot(X.T,(y_pred-y))/len(y)db=np.mean(y_pred-y)w-=learning_rate*dw b-=learning_rate*dbreturnw,b,loss

这个阶段的坑：

数学书买一堆，看完前三章就放弃了——别买书，先看视频，有感觉了再翻书
Python学了两个月还在学语法——语法一周够用，剩下的在项目中练
同时学C++/Java——AI领域Python够用，别分心

阶段目标：能用手写代码实现线性回归、逻辑回归、KNN，不依赖任何框架。

阶段二：机器学习入门（6-10周）

为什么需要：深度学习是机器学习的一个子集。不理解机器学习的通用思想（过拟合、交叉验证、特征工程），直接上深度学习会一脸懵。

核心概念必须搞懂：

监督学习 vs 无监督学习 vs 强化学习
训练集/验证集/测试集的划分原则
过拟合的表现和解决方法（正则化、早停、数据增强）
特征工程：什么特征有用、怎么处理缺失值、怎么处理类别变量

推荐学习路径：

吴恩达《Machine Learning》课程（Coursera/网易云课堂）
- 经典中的经典，讲得清楚，作业用MATLAB/Octave（没关系，思想是通用的）
- 时间：6-8周，每周6-8小时
李宏毅《机器学习》课程（YouTube/B站）
- 中文，更贴近当前研究，讲深度学习和生成模型讲得好
- 适合作为吴恩达课程的补充
实战：《Hands-On Machine Learning》（Aurélien Géron）
- 这本书值100个视频课，用scikit-learn和TensorFlow实现
- 重点做：房价预测（回归）、手写数字识别（分类）、异常检测

# 阶段二结束时的"能干活"代码：用scikit-learn训练一个分类器fromsklearn.datasetsimportload_digitsfromsklearn.model_selectionimporttrain_test_splitfromsklearn.ensembleimportRandomForestClassifierfromsklearn.metricsimportaccuracy_score# 加载数据（手写数字识别）digits=load_digits()X_train,X_test,y_train,y_test=train_test_split(digits.data,digits.target,test_size=0.2)# 训练随机森林（不需要调参就能得到不错的结果）clf=RandomForestClassifier(n_estimators=100,random_state=42)clf.fit(X_train,y_train)# 评估y_pred=clf.predict(X_test)print(f"准确率:{accuracy_score(y_test,y_pred):.3f}")

这个阶段的坑：

课程看完就完了，不动手——吴恩达的课后作业必须做，不做等于没学
一开始就上深度学习框架——先用手写代码理解原理，再上PyTorch/TensorFlow
数据集只用MNIST——MNIST是"AI的Hello World"，做完就换真实数据集

阶段目标：能说清楚监督/无监督学习的区别，能用手写代码实现逻辑回归，能用scikit-learn解决分类/回归问题。

阶段三：深度学习+LLM（8-12周）

为什么需要：当前AI的热点在深度学习，尤其是大语言模型（LLM）。这个阶段学完，你能理解ChatGPT为什么能聊天，能微调一个模型，能搭建一个基于LLM的应用。

深度学习基础：

吴恩达《Deep Learning Specialization》（Coursera）
- 神经网络、CNN、RNN、Seq2Seq全覆盖
- 作业用TensorFlow，但思想通用
PyTorch官方教程（pytorch.org/tutorials）
- 当前主流框架是PyTorch，不是TensorFlow
- 从张量操作到训练一个CNN，官方教程是最好的起点

# 用PyTorch实现一个简单的神经网络importtorchimporttorch.nnasnnimporttorch.optimasoptimclassSimpleNet(nn.Module):def__init__(self):super().__init__()self.fc1=nn.Linear(784,128)self.fc2=nn.Linear(128,64)self.fc3=nn.Linear(64,10)self.relu=nn.ReLU()self.dropout=nn.Dropout(0.2)defforward(self,x):x=self.relu(self.fc1(x))x=self.dropout(x)x=self.relu(self.fc2(x))x=self.fc3(x)returnx# 训练循环（简化版）model=SimpleNet()criterion=nn.CrossEntropyLoss()optimizer=optim.Adam(model.parameters(),lr=0.001)forepochinrange(10):forbatch_x,batch_yindataloader:optimizer.zero_grad()outputs=model(batch_x)loss=criterion(outputs,batch_y)loss.backward()optimizer.step()

LLM专项学习：

理解Transformer架构（这是LLM的基础）
- 必读论文：《Attention Is All You Need》（2017）
- 推荐解读：The Illustrated Transformer（jalammar.github.io）
- 关键概念：Self-Attention、Multi-Head Attention、位置编码
动手微调一个LLM
- 工具：Hugging Face Transformers库
- 入门项目：用LoRA微调一个开源模型（如Qwen、Llama）
- 数据集：从Hugging Face Datasets找一个简单的分类/生成数据集

# 用Hugging Face微调一个文本分类模型（简化版）fromtransformersimportAutoModelForSequenceClassification,Trainer,TrainingArgumentsfromdatasetsimportload_dataset# 加载预训练模型和数据集model=AutoModelForSequenceClassification.from_pretrained("bert-base-chinese",num_labels=2)dataset=load_dataset("csv",data_files="my_data.csv")# 训练参数training_args=TrainingArguments(output_dir="./results",num_train_epochs=3,per_device_train_batch_size=16,learning_rate=2e-5,# 微调通常用很小的学习率)# 开始训练trainer=Trainer(model=model,args=training_args,train_dataset=dataset["train"])trainer.train()

这个阶段的坑：

Transformer架构没搞懂就上LLM——Attention机制不理解，后面全是背代码
只看论文不写代码——LLM是工程，不是理论，必须动手调
一开始就用最大的模型——从BERT-base开始，别上来就Llama-405B

阶段目标：能说清楚Transformer的每个组件，能用PyTorch训练一个CNN，能微调一个开源LLM完成特定任务。

阶段四：项目实战+持续学习（持续进行）

为什么需要：学完前三个阶段，你有理论有工具，但没做过完整项目，等于没学。AI是工程学科，不动手永远停留在"知道"层面。

入门项目推荐（难度递增）：

Kaggle入门竞赛（如Titanic、House Prices）
- 目的：熟悉完整流程（数据清洗→特征工程→建模→提交）
- 时间：1-2周
克隆一个经典论文的实现
- 比如：用PyTorch从零实现Transformer（Aurélien Géron的书里有）
- 目的：验证你真的理解了架构
- 时间：2-4周
做一个端到端的AI应用
- 比如：本地文档问答系统（RAG）、AI写作助手、图像分类API
- 目的：打通从模型到产品的全链路
- 技术栈：LangChain/LLM + Vector DB + FastAPI + 前端
- 时间：4-8周

# 阶段四的"能干活"代码：一个简单的RAG系统fromlangchain_community.vectorstoresimportChromafromlangchain_community.embeddingsimportHuggingFaceEmbeddingsfromlangchain.chainsimportRetrievalQAfromlangchain_community.llmsimportOllama# 1. 构建向量库（假设已有文档切分结果）embeddings=HuggingFaceEmbeddings(model_name="BGE-small-zh")vectorstore=Chroma.from_documents(documents,embeddings)# 2. 搭建检索问答链llm=Ollama(model="qwen2:7b")# 用本地模型，不需要API Keyqa_chain=RetrievalQA.from_chain_type(llm,retriever=vectorstore.as_retriever())# 3. 问答answer=qa_chain.run("我们公司的年假政策是什么？")print(answer)

持续学习的资源：

论文：arXiv.org，关注cs.AI/cs.LG/cs.CL类别
社区：Hugging Face、GitHub Trending、Reddit r/MachineLearning
博客：Andrej Karpathy的博客（karpathy.github.io），必读

这个阶段的坑：

项目做了一半就放弃——第一个项目不求完美，求完整
只看中文资料——AI的前沿论文都是英文，必须过英语关
追新技术追得迷失——先把基础打牢，新模型是旧组合的新排列

阶段目标：有一个能展示的完整项目，能读懂ACL/NeurIPS的论文，能跟上AI领域的最新进展。

3. 避坑指南：前人踩过的坑，你不必再踩

坑一：买一堆书，然后开始吃灰

AI领域的好书很多，但书是最慢的学习方式。正确的顺序是：视频→动手→书→论文。

书单推荐（但别一开始就买）：

《深度学习》（Goodfellow et al.）—— 又名"花书"，理论权威，但不适合入门
《动手学深度学习》（李沐）—— 有中文版，代码+理论结合，适合有一定基础后读
《自然语言处理入门》（何晗）—— 中文NLP入门首选

坑二：一开始就用最牛的模型

“我用Llama-405B做我的第一个项目”——这是作死。

正确的模型选择策略：

学习原理：用最小的模型（BERT-base、GPT-2 small）
做项目：用中等模型（Qwen-7B、Llama-3-8B），能跑得动
生产环境：才考虑大模型，而且要考虑成本和延迟

坑三：数学基础不够就硬上

有人问：“我数学不好，能学AI吗？”

能，但有两个前提：

至少掌握线性代数和概率统计的基础（不需要精通，够用就行）
愿意在学的过程中补数学（遇到不懂的数学再回头学，比系统学完数学再学AI效率高）

推荐的补数学方式：3Blue1Brown的视频系列，直观不枯燥，看完再翻书深化。

坑四：只学不用，永远停留在"知道"

AI是工程，不动手等于白学。每个阶段学完，必须做一个能跑的项目。

最低要求：

阶段一：手写线性回归
阶段二：用scikit-learn解决一个Kaggle入门赛
阶段三：微调一个开源模型
阶段四：做一个端到端的AI应用

坑五：英语不好，只看中文资料

坦白说：AI的前沿进展都是用英文发布的。论文、技术博客、开源项目文档，英文是绝对主流。

英语不好不是借口，是两个解决方案：

边学AI边补英语（推荐，因为AI资料太多，翻译永远滞后）
用翻译工具辅助读英文资料（可行，但效率低）

4. 资源汇总：收藏这篇就够了

课程

课程	平台	适合阶段	费用
吴恩达《Machine Learning》	Coursera/网易云课堂	阶段二	免费/付费
吴恩达《Deep Learning Specialization》	Coursera	阶段三	付费（可申请资助）
李宏毅《机器学习》	YouTube/B站	阶段二、三	免费
Fast.ai《Practical Deep Learning》	fast.ai	阶段三	免费
Hugging Face课程	huggingface.co/course	阶段三、四	免费

书籍

书名	适合阶段	特点
《动手学深度学习》（李沐）	阶段二、三	中文，代码+理论结合
《深度学习》（Goodfellow）	阶段三、四	理论权威，不适合入门
《Hands-On Machine Learning》	阶段二、三	实战导向，scikit-learn+TensorFlow
《自然语言处理入门》（何晗）	阶段三	中文NLP首选

工具/框架

工具	用途	入门难度
Python + NumPy	基础编程	⭐
scikit-learn	传统机器学习	⭐⭐
PyTorch	深度学习	⭐⭐⭐
Hugging Face Transformers	LLM微调/推理	⭐⭐⭐
LangChain	LLM应用开发	⭐⭐
Ollama	本地运行LLM	⭐

数据集/竞赛

Kaggle（kaggle.com）：入门竞赛、数据集
Hugging Face Datasets（huggingface.co/datasets）：LLM训练数据集
Papers With Code（paperswithcode.com）：论文+代码+数据集

5. 最后：学习的本质是持续，不是冲刺

回到开头那句话：“高考结束后才是真正该开始学习的时候。”

这句话的真正含义不是"我要拼命学"，而是：学习是一辈子的事，高考只是其中一个节点。

AI这个领域，变化太快了。你今天学的框架，明天可能就过时了。你今天追的新模型，下个月可能就有更好的。

所以，与其追每一个新技术，不如把基础打牢。数学基础、编程能力、学习能力——这三样东西，任何技术浪潮都淘汰不了。

那个说"要学AI"的人大附中考生，如果他真的走上了这条路，他会发现：AI不难，难的是持续学习。高考结束只是起点，后面还有很长的路。

祝他，也祝所有想学AI的人，走得快，更走得远。

数据来源：腾讯新闻《谈及未来打算，北京一考生称高考结束后才是真正该开始学习的时候》（2026-06-07）、吴恩达Coursera课程、Hugging Face官方文档、3Blue1Brown可视化课程系列、李沐《动手学深度学习》

高考结束才是真正开始学习：给AI时代新人的一份真实学习路线图