基于东南大学齿轮箱数据集的迁移学习实战：用预训练模型搞定小样本故障诊断-编程实验室

基于东南大学齿轮箱数据集的迁移学习实战：用预训练模型搞定小样本故障诊断

工业设备故障诊断一直是智能制造领域的核心挑战之一。当工程师面对新产线或新型设备时，往往陷入"数据饥渴"的困境——既需要足够样本训练可靠模型，又难以在短时间内积累大量故障数据。这种矛盾在齿轮箱等关键传动部件上尤为突出，因为重大故障往往意味着生产线停机和巨额损失。东南大学发布的齿轮箱数据集恰好为解决这一难题提供了理想跳板。

这个包含5种齿轮故障和5种轴承故障的标注数据集，以其清晰的工况划分（20Hz/0V和30Hz/2V）和多通道振动信号（8个传感器通道），成为验证迁移学习算法的绝佳试验场。本文将手把手带您实现从公开数据集到实际工业场景的知识迁移，即使您手头只有几十组自家设备数据，也能构建出可靠的诊断系统。

1. 迁移学习在故障诊断中的独特价值

传统深度学习模型往往需要数万组标注样本才能达到理想效果，而工业现场可能只有几十组故障数据。2019年发表在《Mechanical Systems and Signal Processing》的研究表明，当目标域样本量少于200组时，直接训练的CNN模型准确率会骤降至60%以下。这正是迁移学习大显身手的场景。

东南大学数据集的价值在于：

工况覆盖全面：包含两种典型负载/转速组合，模拟了真实工业场景的参数波动
故障类型系统：从单点缺陷到复合故障，形成了渐进式损伤谱系
信号维度丰富：8个通道同时捕获电机、齿轮箱多维振动特征

实际操作中，我们可以将完整数据集作为源域（source domain），把有限的现场数据作为目标域（target domain）。通过预训练+微调（Fine-tuning）策略，模型先在源域学习通用特征表示，再针对目标域进行适配调整。

关键洞见：迁移学习的本质是让模型先"见多识广"，再"因地制宜"。东南大学数据集的价值不在于直接匹配您的设备，而在于提供丰富的故障模式"词典"。

2. 数据预处理与特征工程实战

原始振动信号往往包含大量噪声和无关信息。我们采用以下处理流程（以Python为例）：

import numpy as np from scipy import signal def preprocess_vibration(data, fs=5120): # 带通滤波 (20Hz-2000Hz) b, a = signal.butter(4, [20, 2000], btype='bandpass', fs=fs) filtered = signal.filtfilt(b, a, data) # 时域特征提取 features = { 'rms': np.sqrt(np.mean(filtered**2)), 'kurtosis': signal.kurtosis(filtered), 'crest_factor': np.max(np.abs(filtered))/np.sqrt(np.mean(filtered**2)) } # 频域特征提取 f, Pxx = signal.welch(filtered, fs, nperseg=1024) features.update({ 'peak_freq': f[np.argmax(Pxx)], 'band_energy': np.sum(Pxx[(f>500)&(f<1500)]) }) return features

对于8通道数据，建议构建以下特征矩阵：

特征类型	通道1 (电机)	通道2-4 (行星齿轮)	通道5 (扭矩)	通道6-8 (减速器)
时域特征	√	√	√	√
频域特征	√	√	×	√
时频域特征	√	√	×	√
多通道耦合特征	×	√	√	√

3. 模型架构设计与迁移策略

基于PyTorch的迁移学习框架可采用以下结构：

import torch import torch.nn as nn from torchvision.models import resnet18 class FaultDiagnosisModel(nn.Module): def __init__(self, num_classes=5): super().__init__() # 使用预训练ResNet作为特征提取器 self.feature_extractor = resnet18(pretrained=True) # 替换第一层卷积适配振动信号输入 self.feature_extractor.conv1 = nn.Conv2d(1, 64, kernel_size=7, stride=2, padding=3, bias=False) # 冻结前几层权重 for param in list(self.feature_extractor.parameters())[:-4]: param.requires_grad = False # 自定义分类头 self.classifier = nn.Sequential( nn.Linear(512, 256), nn.ReLU(), nn.Dropout(0.5), nn.Linear(256, num_classes) ) def forward(self, x): features = self.feature_extractor(x) return self.classifier(features)

迁移策略对比表：

策略	适用场景	所需目标域样本	预期准确率
特征提取器冻结	目标域数据极少 (<50)	10-50	65-75%
部分层微调	中等规模数据 (50-200)	50-200	75-85%
端到端微调	数据较充足 (200+)	200+	85-95%
领域自适应	存在显著分布差异	100+	70-90%

4. 小样本场景下的实战技巧

当目标域样本极其有限时，这些技巧能显著提升效果：

数据增强策略：

时域随机裁剪（保持至少1个完整周期）
添加高斯噪声（SNR>20dB）
随机通道掩蔽（最多掩蔽2个通道）

模型优化技巧：

# 使用Focal Loss应对类别不平衡 criterion = FocalLoss(alpha=[0.1, 0.15, 0.15, 0.3, 0.3], gamma=2) # 分层学习率设置 optimizer = torch.optim.Adam([ {'params': model.feature_extractor.parameters(), 'lr': 1e-4}, {'params': model.classifier.parameters(), 'lr': 1e-3} ])

知识蒸馏方案：