CNN-SVM回归,基于卷积神经网络-支持向量机(CNN-SVM)回归预测,多输入单输出模型 1、运行环境要求MATLAB版本为2019及其以上 2、评价指标包括:R2、MAE、MSE、RMSE等,图很多,符合您的需要 3、代码中文注释清晰,质量极高 4、测试数据集,可以直接运行源程序。 替换你的数据即可用 适合新手小白 保证源程序运行,
这个CNN-SVM混合模型有点意思,咱们先拆开看看它的结构。模型前半截用卷积层自动提取特征,后半截用SVM回归做预测,相当于把深度学习和传统机器学习揉在一起用了。下面这段数据读取的代码写得挺利索:
% 从Excel读取数据 data = xlsread('数据集.xlsx'); input = data(:,1:end-1)'; % 转置成列向量 output = data(:,end)'; rand_order = randperm(size(input,2)); % 打乱数据顺序注意这里输入输出都做了转置,因为MATLAB的神经网络工具箱默认接收列向量样本。随机打乱顺序这个操作对防止模型过拟合很重要,特别是当原始数据存在时间顺序时。数据划分比例建议新手保持7:3的比例,等熟悉了再尝试交叉验证。
模型搭建的核心在这里:
%% 网络结构搭建 layers = [ sequenceInputLayer(input_size) % 输入节点数 convolution1dLayer(3,16,'Padding','same') % 一维卷积核 batchNormalizationLayer reluLayer maxPooling1dLayer(2,'Stride',2) % 池化压缩 fullyConnectedLayer(64) % 全连接特征抽取 dropoutLayer(0.2) % 随机失活防止过拟合 fullyConnectedLayer(1) % 输出层对接SVM regressionLayer];这个1D卷积的设计挺讲究——处理时序数据或特征序列时,用3个点的滑动窗口捕捉局部模式。BatchNorm层能加速训练,Dropout层像给模型加了"防沉迷",防止它死记硬背训练数据。有意思的是最后接了个全连接层输出单个值,这里其实在给SVM准备特征输入。
训练参数设置见功力:
options = trainingOptions('adam',... 'MaxEpochs',150,... 'InitialLearnRate',0.001,... 'LearnRateSchedule','piecewise',... 'LearnRateDropPeriod',50,... 'ExecutionEnvironment','auto');学习率策略采用了分段下降,前50轮用0.001,后面自动下调。用GPU加速记得在'ExecutionEnvironment'里改成'gpu'。不过新手注意,训练时别开太多后台程序,小心显存爆炸。
预测结果的可视化部分做得挺全:
%% 预测效果图 plot(output_test,'-*','LineWidth',1.5) hold on plot(YPred,'-s','LineWidth',1.5) legend('真实值','预测值') title('测试集预测对比') xlabel('样本编号') ylabel('目标值') %% 误差分布直方图 error = output_test - YPred; figure histogram(error,20) title('预测误差分布') xlabel('误差值') ylabel('出现次数')第一张对比图能直观看出预测趋势是否吻合,误差直方图则反映模型的稳定性。如果直方图出现双峰,说明模型在某些情况下表现不稳定,可能需要检查数据分布或调整损失函数。
指标计算部分都是干货:
%% 性能评估 R2 = 1 - sum((output_test - YPred).^2)/sum((output_test - mean(output_test)).^2); MAE = mean(abs(output_test - YPred)); MSE = mean((output_test - YPred).^2); RMSE = sqrt(MSE); disp(['R2:',num2str(R2),' MAE:',num2str(MAE),' RMSE:',num2str(RMSE)])R²指标超过0.8说明模型解释力不错,MAE和RMSE要看具体业务场景的误差容忍度。建议把测试集结果和训练集结果对比着看,如果差异太大可能是过拟合了。
整套代码跑下来大概十几分钟(视数据量而定),建议第一次运行时先把Epochs调小试试水。遇到报错优先检查数据维度是否匹配,常见的问题是输入层节点数没改对。想替换自己的数据的话,把Excel文件整理成每列一个特征,最后一列是输出值就行。
模型调优可以从这几个方向入手:调整卷积核尺寸、增加L2正则化、尝试不同核函数的SVM。不过对于刚入门的朋友,建议先把默认参数跑通,再慢慢调参找感觉。毕竟先让模型转起来,比死磕那几个点的指标提升更重要。