DAY37 早停策略和模型权重的保存-编程实验室

@浙大疏锦行

importtorchimporttorch.nnasnnimporttorch.optimasoptimfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitimportnumpyasnp iris=load_iris()X=iris.data y=iris.target X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.2,random_state=42)print(X_train.shape)print(y_train.shape)print(X_test.shape)print(y_test.shape)fromsklearn.preprocessingimportMinMaxScaler scaler=MinMaxScaler()X_train=scaler.fit_transform(X_train)X_test=scaler.transform(X_test)X_train=torch.FloatTensor(X_train)y_train=torch.LongTensor(y_train)X_test=torch.FloatTensor(X_test)y_test=torch.LongTensor(y_test)importtorchimporttorch.nnasnnimporttorch.optimclassMLP(nn.Module):def__init__(self,*args,**kwargs):super().__init__(*args,**kwargs)self.fc1=nn.Linear(4,10)self.relu=nn.ReLU()self.fc2=nn.Linear(10,3)defforward(self,x):out=self.fc1(x)out=self.relu(out)out=self.fc2(out)returnout model=MLP()criterion=nn.CrossEntropyLoss()optimizer=torch.optim.SGD(model.parameters(),lr=0.01)num_epochs=20000losses=[]forepochinrange(num_epochs):outputs=model.forward(X_train)loss=criterion(outputs,y_train)# 预测损失# 反向传播和优化optimizer.zero_grad()loss.backward()# 反向传播计算梯度optimizer.step()losses.append(loss.item())if(epoch+1)%100==0:print(f'Epoch[{epoch+1}/{num_epochs}],Loss:{loss.item():.4f}')importmatplotlib.pyplotasplt plt.plot(range(num_epochs),losses)plt.xlabel('Epoch')plt.ylabel('Loss')plt.title('Training Loss over Epochs')plt.show()

fromtqdmimporttqdm# 注意：这里导入的是 tqdm 函数，不是模块train_losses=[]test_losses=[]epochs=[]# ===== 新增早停相关参数 =====best_test_loss=float('inf')# 记录最佳测试集损失best_epoch=0# 记录最佳epochpatience=50# 早停耐心值（连续多少轮测试集损失未改善时停止训练）counter=0# 早停计数器early_stopped=False# 是否早停标志# ==========================withtqdm(total=num_epochs,desc="训练进度",unit="epoch")aspbar:forepochinrange(num_epochs):outputs=model(X_train)train_loss=criterion(outputs,y_train)optimizer.zero_grad()train_loss.backward()optimizer.step()if(epoch+1)%200==0:model.eval()withtorch.no_grad():test_outputs=model(X_test)test_loss=criterion(test_outputs,y_test)model.train()train_losses.append(train_loss.item())test_losses.append(test_loss.item())epochs.append(epoch+1)pbar.set_postfix({'Train Loss':f'{train_loss.item():.4f}','Test Loss':f'{test_loss.item():.4f}'})# ===== 新增早停逻辑 =====iftest_loss.item()<best_test_loss:# 如果当前测试集损失小于最佳损失best_test_loss=test_loss.item()# 更新最佳损失best_epoch=epoch+1# 更新最佳epochcounter=0# 重置计数器# 保存最佳模型torch.save(model.state_dict(),'best_model.pth')else:counter+=1ifcounter>=patience:print(f"早停触发！在第{epoch+1}轮，测试集损失已有{patience}轮未改善。")print(f"最佳测试集损失出现在第{best_epoch}轮，损失值为{best_test_loss:.4f}")early_stopped=Truebreak# 终止训练循环# ======================# 每1000个epoch更新一次进度条if(epoch+1)%1000==0:pbar.update(1000)# 更新进度条ifpbar.n<num_epochs:pbar.update(num_epochs-pbar.n)# 可视化损失曲线plt.figure(figsize=(10,6))plt.plot(epochs,train_losses,label='Train Loss')# 原始代码已有plt.plot(epochs,test_losses,label='Test Loss')# 新增：测试集损失曲线plt.xlabel('Epoch')plt.ylabel('Loss')plt.title('Training and Test Loss over Epochs')plt.legend()# 新增：显示图例plt.grid(True)plt.show()# 在测试集上评估模型，此时model内部已经是训练好的参数了# 评估模型model.eval()# 设置模型为评估模式withtorch.no_grad():# torch.no_grad()的作用是禁用梯度计算，可以提高模型推理速度outputs=model(X_test)# 对测试数据进行前向传播，获得预测结果_,predicted=torch.max(outputs,1)# torch.max(outputs, 1)返回每行的最大值和对应的索引correct=(predicted==y_test).sum().item()# 计算预测正确的样本数accuracy=correct/y_test.size(0)print(f'测试集准确率:{accuracy*100:.2f}%')

torch.save(model.state_dict(),"model_weights.pth")model=MLP()model.load_state_dict(torch.load("model_weights.pth"))

torch.save(model,"full_model.pth")model=torch.load("full_model.pth",weights_only=False)model.eval()

（7-3-05）基于MCP实现的金融投资Agent(5)市场情绪分析测试+ 个股数据测试

7.3.8 市场情绪分析测试文件test_sentiment.py实现了对市场情绪分析工具的测试，涵盖了CNN恐惧与贪婪指数、加密货币恐惧与贪婪指数以及谷歌趋势数据的获取功能。通过模拟数据请求和返回结果，测试了各类情绪指标在不同参数设置（如获取当前数据…

李华

【开题答辩全过程】以高校篮球社团管理系统为例，包含答辩的问题和答案

个人简介一名14年经验的资深毕设内行人，语言擅长Java、php、微信小程序、Python、Golang、安卓Android等开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。感谢大家的…

李华

告别机房管理噩梦，首码磁控U位系统来“救场”

机房管理痛点大揭秘在机房管理的日常中，想必不少朋友都被这些问题折磨得苦不堪言。盘点时，面对密密麻麻的设备，人工核对不仅效率低下，还常常因为人为疏忽，导致账实不符。一旦出现错误，后续的核对与纠错工作…

李华

【大前端】【Android】一文详解为什么ViewModel的observe能监听到数据的变化

分 3 层来讲： 👉 现象 → 底层机制 → 为什么一定要这样设计一、先给一句“最短答案”observe() 能感知数据变化， 是因为 LiveData 内部实现了「观察者模式」： 当 setValue() 被调用时，它会主动通知所有观察者。但这句…

李华

软件工程期末考试-数据流图、状态图、用例图、类图等怎么画？

分类概念问答数据流图软件结构图状态图流程图，盒图，pad图白盒测试/黑盒测试用例图类图事件跟踪图项目管理概念问答 1)概念问答什么是软件工程把系统的、规范的途径应用于软件开发和维护过程，也就是把工程应用于软件研究上面提到的途径什么是…

李华

【conda】解决每次打开powershell报错无法加载文件（自启动conda脚本）的问题

（7-3-05）基于MCP实现的金融投资Agent(5)市场情绪分析测试+ 个股数据测试

【开题答辩全过程】以 高校篮球社团管理系统 为例，包含答辩的问题和答案

告别机房管理噩梦，首码磁控U位系统来“救场”

【大前端】【Android】一文详解为什么ViewModel的observe能监听到数据的变化

软件工程期末考试-数据流图、状态图、用例图、类图等怎么画？

【开题答辩全过程】以高校篮球社团管理系统为例，包含答辩的问题和答案