news 2026/5/1 5:44:45

HuggingFace项目实战之使用Trainer执行训练

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
HuggingFace项目实战之使用Trainer执行训练

目录:

    • 一、加载tokenizer
    • 二、加载数据集和编码
    • 三、加载模型
    • 四、执行训练
    • 五、执行测试

一、加载tokenizer

importtorchfromtransformersimportAutoTokenizer#加载tokenizertokenizer=AutoTokenizer.from_pretrained('google-bert/bert-base-chinese')tokenizer

二、加载数据集和编码

fromdatasetsimportload_dataset#加载数据集dataset=load_dataset(path='lansinuote/ChnSentiCorp')#编码f=lambdax:tokenizer(x['text'],truncation=True,max_length=500)dataset=dataset.map(f,remove_columns=['text'])#设置数据类型dataset.set_format('pt')dataset,dataset['train'][0]

三、加载模型

#定义模型fromtransformersimportBertConfig,BertForSequenceClassification#在线加载一个语句分类模型model=BertForSequenceClassification.from_pretrained('google-bert/bert-base-chinese',num_labels=2)model.config

四、执行训练

fromtransformersimportTrainingArguments,Trainer,DataCollatorWithPadding#配置训练参数args=TrainingArguments(output_dir='output_dir',use_cpu=True,num_train_epochs=1,max_steps=300,eval_strategy='no',per_device_train_batch_size=8)#创建trainertrainer=Trainer(model=model,args=args,train_dataset=dataset['train'],data_collator=DataCollatorWithPadding(tokenizer))#执行训练trainer.train()

五、执行测试

#执行测试deftest():loader_test=torch.utils.data.DataLoader(dataset['test'],batch_size=8,shuffle=True,drop_last=True,collate_fn=DataCollatorWithPadding(tokenizer))correct=0total=0fori,datainenumerate(loader_test):withtorch.no_grad():out=model(**data).logits out=out.argmax(dim=1)correct+=(out==data.labels).sum().item()total+=len(data.labels)print(i,len(loader_test),correct/total)ifi==5:breakreturncorrect/total test()

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 3:46:39

ADC 原理拆解 | 一图理清 ADC 五大架构特点

ADC 是什么?我们为什么需要 ADC?ADC 有哪些架构?他们的工作原理和特点是什么,分别适用于哪些场景?今天,就让我们来逐一解密。文末汇总了 ADC 五大架构的速度、精度和应用场景对比一、ADC 是什么&#xff1f…

作者头像 李华
网站建设 2026/5/1 3:49:09

百考通AI:告别熬夜赶稿,一键生成专业实践报告——您的智能写作助手

对于每一位在校大学生而言,实习报告、社会实践报告、毕业设计报告……这些文档是学业生涯中无法回避的“必修课”。它们不仅是对一段宝贵经历的总结与沉淀,更是衡量个人能力、获得学分乃至求职敲门砖的关键材料。然而,面对空白的文档和繁杂的…

作者头像 李华
网站建设 2026/5/1 3:45:18

基于Python 医院信息管理系统(源码+数据库+文档)

医院信息管理 目录 基于PythonDjango医院信息管理系统 一、前言 二、系统功能演示 三、技术选型 四、其他项目参考 五、代码参考 六、测试参考 七、最新计算机毕设选题推荐 八、源码获取: 基于PythonDjango医院信息管理系统 一、前言 博主介绍&#xff1a…

作者头像 李华
网站建设 2026/5/1 3:45:33

基于Python停车场管理系统(源码+数据库+文档)

停车场管理 目录 基于PythonDjango停车场管理系统 一、前言 二、系统功能演示 三、技术选型 四、其他项目参考 五、代码参考 六、测试参考 七、最新计算机毕设选题推荐 八、源码获取: 基于PythonDjango停车场管理系统 一、前言 博主介绍:✌️大…

作者头像 李华
网站建设 2026/5/1 5:44:01

【Vue】11 Vue技术——Vue 中的事件处理详解

文章目录前言一、事件绑定的基本语法二、事件回调函数的定义位置三、禁止在 methods 中使用箭头函数四、methods 中函数的 this 指向五、事件传参:如何传递额外参数1. 不传参(仅接收事件对象)2. 传参 保留事件对象3. 等效写法说明六、完整示…

作者头像 李华
网站建设 2026/5/1 4:48:02

VirtualLab Fusion应用:用于光束切趾的圆锯齿光阑

摘要各个工业部门对能量分布均匀的激光束(平顶光束)的需求越来越大。众所周知,具有陡峭边缘轮廓的光束更容易产生衍射波纹。这些波纹在某些光学系统中可能会增强,例如自聚焦情况下的放大。在这个用例中,我们试图通过引…

作者头像 李华