news 2026/5/1 6:53:17

NEFTune:加入噪声的嵌入提升指令微调效果

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
NEFTune:加入噪声的嵌入提升指令微调效果

摘要

我们发现,通过一种简单的数据增强方法,可以显著提升语言模型的微调效果。NEFTune 在训练过程中向嵌入向量添加噪声。在使用 Alpaca 对 LLaMA-2-7B 进行标准微调时,其在 AlpacaEval 上的表现为 29.79%,而使用带噪嵌入后则上升至 64.69%。NEFTune 在多个现代指令数据集上也优于强基线:使用 Evol-Instruct 微调的模型提升了 10%,使用 ShareGPT 提升了 8%,使用 OpenPlatypus 同样提升了 8%。即使是如 LLaMA-2-Chat 这类经过 RLHF 进一步优化的强大模型,也能从 NEFTune 的进一步训练中受益。

1 引言

大型语言模型(LLM)遵循详细指令的能力,是其实用性的核心。生成式语言模型通常在原始网页数据上预训练,随后在一小部分经过精心筛选的指令数据上进行微调。指令微调是驯服 LLM 能力的关键,而模型的实用性在很大程度上取决于我们如何最大化地利用这些有限的指令数据集。

本文提出,在微调的前向传播过程中,向训练数据的嵌入向量添加随机噪声。我们展示了这一简单技巧能够显著提升指令微调的效果,且无需额外计算或数据成本。Noisy Embedding Instruction Fine Tuning(NEFTune)虽然方法简单,但对下游对话质量有着显著影响。当一个原始 LLM(如 LLaMA-2-7B)在带噪嵌入下进行微调,其在 AlpacaEval 上的表现从 29.8% 提升至 64.7%(见图 1)——实现了约 35 个百分点的惊人提升(Touvron et al., 2023b;Dubois et al.,

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/30 19:16:09

仅限高级用户:解锁VSCode自定义Agent极致性能的3个私密配置

第一章:VSCode自定义智能体性能优化概述在现代开发环境中,VSCode 作为主流代码编辑器,广泛支持通过扩展机制构建自定义智能体(Custom Agent),用于自动化代码分析、智能补全与实时性能监控。然而&#xff0c…

作者头像 李华
网站建设 2026/4/27 18:31:00

lvgl之gif源码(支持同步显示)

头文件: /*** @file lv_gif.h**/#ifndef LV_GIF_H #define LV_GIF_H#ifdef __cplusplus extern "C" {#endif/********************** INCLUDES*********************/ #if LV_LVGL_H_INCLUDE_SIMPLE #include <lvgl.h> #else #include <lvgl/lvgl.h&g…

作者头像 李华
网站建设 2026/5/1 9:47:33

企业文化传播材料创作

ms-swift&#xff1a;打通大模型工程化落地的全链路引擎 在企业AI转型的浪潮中&#xff0c;一个现实问题反复浮现&#xff1a;为什么拥有顶尖大模型和丰富数据的企业&#xff0c;依然难以快速推出稳定可用的智能服务&#xff1f;答案往往不在算法本身&#xff0c;而在于“从模型…

作者头像 李华
网站建设 2026/4/25 0:51:40

低成本体验AI:用云端GPU运行万物识别模型的完整指南

低成本体验AI&#xff1a;用云端GPU运行万物识别模型的完整指南 作为一名AI技术爱好者&#xff0c;我最近被万物识别&#xff08;Object Detection&#xff09;这项能力深深吸引——它能自动识别图片中的物体并标注位置&#xff0c;从宠物照片分析到智能安防都有广泛应用。但当…

作者头像 李华
网站建设 2026/5/1 7:19:47

年入50w的项目瞬间不香了?

熟悉独孤的都知道。独孤拿到第一桶金的项目是图书电商。而且在做图书电商的时候&#xff0c;结识了不少圈内好友。昨晚有个做图书电商的圈内好友。突然和独孤电话&#xff0c;聊起了独孤的新项目——AI供稿。兴趣很大。独孤问他&#xff0c;你现在图书电商做的怎么样了&#xf…

作者头像 李华
网站建设 2026/4/20 16:26:09

HR招聘机器人安全设置:Qwen3Guard-Gen-8B规避歧视性语言

HR招聘机器人安全设置&#xff1a;Qwen3Guard-Gen-8B规避歧视性语言 在一家跨国科技公司的人力资源部门&#xff0c;AI招聘机器人正自动向候选人发送面试反馈。一条看似普通的回复写道&#xff1a;“考虑到您这个年龄段已有家庭负担&#xff0c;可能难以适应高强度的工作节奏……

作者头像 李华