news 2026/6/15 15:02:24

【Fine-tuning】详解：Feature Extraction、Linear Probing 与 End-to-End 的区别

张小明

前端开发工程师

1.2k 24

文章封面图 — 【Fine-tuning】详解：Feature Extraction、Linear Probing 与 End-to-End 的区别

在深度学习实践中，我们很少从零开始训练一个模型。更常见的做法是：基于预训练模型，通过迁移学习解决新任务。

而在迁移学习中，Fine-tuning（微调）是最核心、也最容易混淆的概念之一。

本文将系统梳理 Fine-tuning 的几种常见策略，并重点解释以下几个高频术语之间的关系：

Feature Extraction
Linear Probing
Full Fine-tuning
End-to-End

一、什么是 Fine-tuning？

Fine-tuning（微调）是指：将在大规模数据集上预训练好的模型，迁移到新任务上，并对模型参数进行一定程度的调整。

根据是否更新预训练模型的特征提取层参数，Fine-tuning 通常分为两大类策略：

策略	英文别名	参数更新范围
冻结特征微调	Feature Extraction / Linear Probing	仅分类头
不冻结特征微调	Full Fine-tuning / End-to-End	全部参数

二、Feature Extraction（特征提取）

整体流程可以抽象为：

2.1 概念说明

Feature Extraction的核心思想是：把预训练模型当作一个固定的特征提取器来使用。

模型的主体结构（Backbone）不再学习，只负责将输入映射为高维特征。

2.2 具体做法

加载预训练模型
冻结所有特征提取层参数（requires_grad=False）
在其后新增一个分类器
只训练新增的分类器

2.3 直观类比

可以把预训练模型理解为一台已经调好参数的相机：

相机本身不再改动
你只训练一个人，学会如何根据照片内容做判断

2.4 适用场景

数据量较小
训练资源有限
快速验证模型可行性

三、Linear Probing（线性探测）

3.1 什么是 Linear Probing？

Linear Probing是 Feature Extraction 的一种特殊形式。

其特点是：
- 冻结整个预训练模型
- 分类器只使用一个线性层（Linear Layer）
- 仅训练这一层

# Linear Probing 的本质frozen_features=pretrained_model(image)# 冻结，不训练output=nn.Linear(768,num_classes)(frozen_features)# 只训练这一层

3.2 为什么叫“探测”？

“Probing” 并不是为了追求最优性能，而是为了评估预训练特征的质量：

如果只用一个线性层，就能在下游任务上取得不错的效果
说明预训练模型已经学到了高度可迁移的通用特征
因此，Linear Probing 常用于：
- 对比不同预训练模型
- 验证自监督学习或预训练策略的效果

3.3 与 Feature Extraction 的关系

Linear Probing ⊂ Feature Extraction

区别仅在于分类器的复杂度：
- Feature Extraction：分类器可以是 MLP
- Linear Probing：分类器严格为线性层

四、 Full Fine-tuning（全量微调）

4.1 概念说明

Full Fine-tuning指的是：使用预训练权重作为初始化，但在训练过程中更新模型的所有参数。

也就是说，预训练模型不再是“固定特征提取器”，而是会根据新任务进行整体调整。

图像 → [预训练模型的所有层] → 预测结果 (全部学习)

4.2 直观类比

如果说 Feature Extraction 是“只训练识别的人”，那么 Full Fine-tuning 则是：人和相机一起训练，镜头、焦距、曝光参数都可以被重新调整。

4.3 适用场景

数据量充足
新任务与预训练任务差异较大
追求最佳下游任务性能

5. End-to-End（端到端训练）

5.1 概念说明

End-to-End强调的是训练方式，而不是模型结构：梯度从输出端一直反向传播到输入端，整个模型链路全部参与训练。

输入端 输出端 │ │ ▼ ▼ 图像 → [层1] → [层2] → ... → [层N] → [分类头] → 预测 ↑ ↑ ↑ ↑ └───────┴──────────────┴────────┘ 全部参与训练（端到端）

5.2 与 Full Fine-tuning 的关系

在迁移学习语境下：End-to-End ≈ Full Fine-tuning
二者的区别主要在于侧重点：
- Full Fine-tuning：强调“所有参数都被微调”
- End-to-End：强调“从输入到输出整体优化”

六、术语对照与总结

英文术语	中文含义	训练范围	常见用途
Feature Extraction	特征提取	仅分类器	小数据集、快速实验
Linear Probing	线性探测	仅线性层	评估预训练特征质量
Full Fine-tuning	全量微调	全部参数	大数据集、追求最优效果
End-to-End	端到端训练	全部参数	与 Full Fine-tuning 等价
Frozen Backbone	冻结骨干网络	仅分类头	Feature Extraction 的别称
Transfer Learning	迁移学习	视策略而定	上述方法的统称

版权声明: 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系邮箱：809451989@qq.com进行投诉反馈，一经查实，立即删除！

网站建设 2026/6/15 13:33:21

MyEMS开源能源管理系统：赋能化学药品原料药制造业绿色低碳转型

各位读者，大家好！我今天向大家介绍的是MyEMS开源能源管理系统。在双碳目标的大背景下，化学药品原料药制造业作为高耗能领域，面临着巨大的减排压力和能源管理挑战。 MyEMS开源能源管理系统具有零授权成本、高度定制化、社区协同迭代…

作者头像

李华

网站建设 2026/6/15 12:58:40

智能服装在不同领域技术下的发展现状及趋势研究

智能服装在不同领域技术下的发展现状及趋势研究摘要智能服装作为纺织工业、柔性电子、物联网、人工智能与新材料技术深度融合的产物，突破了传统服装仅具备遮蔽、保暖与装饰的基础功能，实现了生理感知、环境交互、运动监测、健康管理、安全防护、数字…

作者头像

李华

网站建设 2026/6/15 12:58:28

ptuning微调实战

后续会更新相关内容~

作者头像

李华

网站建设 2026/6/15 12:59:11

照着用就行：更贴合专科生的AI论文网站，千笔 VS PaperRed

随着人工智能技术的迅猛迭代与普及，AI辅助写作工具已逐步渗透到高校学术写作场景中，成为专科生完成毕业论文不可或缺的辅助手段。越来越多面临毕业论文压力的学生，开始依赖各类AI工具简化写作流程、提升创作效率。但与此同时，市场…

作者头像

李华

网站建设 2026/6/15 14:19:04

计算机毕业设计springboot有机蔬菜销售系统与设计基于SpringBoot的绿色生鲜电商系统设计与实现面向社区的家庭有机食材订购平台开发

计算机毕业设计springboot有机蔬菜销售系统与设计p0p31 （配套有源码程序 mysql数据库论文） 本套源码可以在文本联xi,先看具体系统功能演示视频领取，可分享源码参考。当“买菜”从街头巷尾转移到指尖屏幕，有机蔬菜如何在一堆“次…

作者头像

李华

网站建设 2026/6/15 12:14:56

大模型本地化部署了大模型？看完这篇轻松构建LLaMA大模型本地部署

先看一下效果介绍 LLaMA（large language Model AI）：开源高效的大语言模型。以 GPT-3 为代表的大语言模型 (Large language models, LLMs) 在海量文本集合上训练，展示出了惊人的涌现能力以及零样本迁移和少样本学习能力。注意&…

作者头像

李华