从零到一：基于CNN的遥感地物分类实战指南-编程实验室

1. 遥感地物分类与CNN基础

第一次接触遥感图像分类的朋友可能会觉得这是个高大上的领域，但其实原理非常简单。想象一下你站在高处俯瞰地面，需要把看到的森林、河流、建筑等不同地物区分开来——这就是遥感地物分类要解决的问题。传统方法依赖人工设计特征，而**卷积神经网络(CNN)**让计算机能自动学习这些特征。

我刚开始做遥感分类时踩过不少坑，最大的误区就是混淆了"图像分类"和"图像分割"。普通图像分类是把整张图归为某一类（比如判断是猫还是狗），而遥感分类需要识别图中不同区域的地物类型，技术上更接近语义分割。不过别担心，我们可以用滑动窗口+CNN的巧妙组合来解决这个问题。

为什么选择CNN？三个关键优势：

局部感知：3x3或5x5的卷积核能捕捉地物的纹理特征
参数共享：大幅减少参数量，避免过拟合
层次化特征：浅层网络识别边缘，深层网络识别复杂地物

2. 数据准备实战

2.1 获取Landsat 8数据

推荐使用USGS EarthExplorer平台下载数据，记得勾选以下波段：

波段2-7（可见光到短波红外）
空间分辨率选择30米
云量低于10%的清晰影像

我常用这个Python脚本批量下载：

import landsatxplore.api api = landsatxplore.api.API('你的账号', '你的密码') scenes = api.search(dataset='landsat_8', latitude=50.9, longitude=-1.4, start_date='2020-01-01', end_date='2020-12-31', max_cloud_cover=10) api.download(scenes[0]['entityId'], output_dir='./data')

2.2 样本标注技巧

用QGIS标注样本时，这几个技巧能提升效率：

创建多边形图层，字段名设为"class"
按表1的类别系统标注
每个类别至少采集50个样本区域
保存为GeoJSON格式

表1：典型地物分类系统

类别值	地物类型	示例颜色
0	森林	深绿
1	水体	蓝色
2	草地	浅绿
3	裸地	棕色
4	建筑	红色
5	道路	灰色

3. 数据预处理全流程

3.1 数据切片与增强

遥感影像通常很大，直接输入网络会爆显存。我的解决方案是：

from skimage.util import view_as_windows def generate_patches(image, patch_size=64): patches = view_as_windows(image, (patch_size, patch_size, 7), step=patch_size) return patches.reshape(-1, patch_size, patch_size, 7) # 示例用法 image = np.load('landsat.npy') # 形状为(H,W,7) patches = generate_patches(image)

3.2 样本均衡化

林地样本往往远多于其他类别，这个重采样方法很管用：

from sklearn.utils import resample minority_class = labels[labels == 4] # 以建筑类为例 majority_class = labels[labels == 0] # 下采样多数类 forest_downsampled = resample(majority_class, replace=False, n_samples=len(minority_class), random_state=42)

4. 改进版AlexNet模型构建

4.1 网络架构详解

基于经典AlexNet做了三点改进：

减少全连接层参数
增加Dropout防止过拟合
使用LeakyReLU替代ReLU

完整模型代码：

from tensorflow.keras import layers, models def build_model(input_shape=(64,64,7), num_classes=6): model = models.Sequential([ layers.Conv2D(96, (11,11), strides=4, activation='leaky_relu', input_shape=input_shape), layers.MaxPooling2D((3,3), strides=2), layers.Conv2D(256, (5,5), padding='same', activation='leaky_relu'), layers.MaxPooling2D((3,3), strides=2), layers.Conv2D(384, (3,3), padding='same', activation='leaky_relu'), layers.Conv2D(384, (3,3), padding='same', activation='leaky_relu'), layers.Conv2D(256, (3,3), padding='same', activation='leaky_relu'), layers.MaxPooling2D((3,3), strides=2), layers.Flatten(), layers.Dense(4096, activation='leaky_relu'), layers.Dropout(0.5), layers.Dense(4096, activation='leaky_relu'), layers.Dropout(0.5), layers.Dense(num_classes, activation='softmax') ]) return model

4.2 训练技巧分享

经过多次实验，这些参数组合效果最佳：

优化器：AdamW(lr=0.0001)
批次大小：32
早停策略：验证损失3轮不下降就停止
数据增强：随机旋转+水平翻转

训练监控代码：

from tensorflow.keras.callbacks import EarlyStopping early_stop = EarlyStopping(monitor='val_loss', patience=3) history = model.fit(train_generator, validation_data=val_generator, epochs=100, callbacks=[early_stop])

5. 模型评估与调优

5.1 混淆矩阵分析

别只看准确率！我习惯用这个分类报告：

from sklearn.metrics import classification_report y_pred = model.predict(test_x) print(classification_report(test_y, y_pred.argmax(axis=1)))

常见问题解决方案：

建筑类识别率低 → 增加高空俯视图样本
水体误判为阴影 → 加入NDWI指数作为额外通道
草地与森林混淆 → 调整样本边界清晰度

5.2 模型轻量化

部署到边缘设备时，可以用这些技巧压缩模型：

# 模型量化 converter = tf.lite.TFLiteConverter.from_keras_model(model) converter.optimizations = [tf.lite.Optimize.DEFAULT] tflite_model = converter.convert() # 模型剪枝 pruning_params = { 'pruning_schedule': tfmot.sparsity.ConstantSparsity(0.5, begin_step=1000), 'block_size': (1,1), 'block_pooling_type': 'AVG' } model_for_pruning = tfmot.sparsity.prune_low_magnitude(model, **pruning_params)

6. 实际应用与可视化

6.1 整图预测技巧

大图预测时内存不足？试试这个分块预测方法：

def predict_large_image(model, image_path, patch_size=64): ds = gdal.Open(image_path) image = ds.ReadAsArray().transpose(1,2,0) h, w = image.shape[:2] # 填充边缘使能被patch_size整除 pad_h = (patch_size - h % patch_size) % patch_size pad_w = (patch_size - w % patch_size) % patch_size image = np.pad(image, ((0,pad_h),(0,pad_w),(0,0))) # 分块预测 patches = generate_patches(image, patch_size) preds = model.predict(patches) # 重组结果 pred_map = preds.argmax(axis=1) pred_map = pred_map.reshape(h//patch_size, w//patch_size) return pred_map

6.2 结果可视化

用matplotlib制作专业分类图：

import matplotlib.pyplot as plt from matplotlib.colors import ListedColormap colors = ['#006400','#0000FF','#7CFC00','#8B4513','#FF0000','#A9A9A9'] cmap = ListedColormap(colors) plt.figure(figsize=(12,8)) plt.imshow(pred_map, cmap=cmap) plt.colorbar(ticks=range(6), label='Land Cover Type') plt.title('Classification Results') plt.savefig('result.png', dpi=300, bbox_inches='tight')

7. 常见问题解决方案

在带实习生做项目时，发现这几个问题出现频率最高：

波段顺序错误
- 症状：模型训练震荡不收敛
- 检查：print(image[:,:,0].mean())查看各波段统计值
- 解决：确保使用BGR顺序或统一归一化
样本泄露
- 症状：验证准确率虚高
- 检查：确认训练/验证集空间位置不重叠
- 解决：按经纬度划分数据集
边缘效应
- 症状：预测图出现网格状伪影
- 解决：预测时使用重叠分块，加权融合边缘
类别不平衡
- 症状：少数类别全被预测为多数类
- 解决：除了重采样，还可以尝试：
  - 类别加权损失函数
  - Focal Loss
  - 数据增强时对少数类过采样