news 2026/5/1 8:46:41

Forget-Me-Not: 建议采用一种简单的提示技术,防止在长时间的提示中遗忘信息

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Forget-Me-Not: 建议采用一种简单的提示技术,防止在长时间的提示中遗忘信息

概述

虽然 LLM 在复杂推理和问题解答中表现出了卓越的性能,但一种被称为 "上下文遗忘 "的现象却是一个挑战。这是指模型在长时间的语境中会逐渐遗忘提示中给出的信息,这会对准确生成回答产生负面影响。本研究重点研究了这种语境遗忘现象,并详细探讨了当前 LLM 在什么条件下会 "遗忘 "信息。

此外,作者还提出了一种简单的提示设计工具,称为 “忘我”(FMN)。该工具是一种通过插入上下文的单句指示来提醒模型注意重要信息的机制。值得注意的是,它并不改变 LLM 的结构,也不涉及任何训练,却能显著提高模型的上下文记忆能力。实验结果表明,即使是最先进的模型(如 GPT-4),插入 FMN 也能将准确率提高 40 分或更多。

建议的方法

本研究的核心建议是一种基于提示的辅助句插入方法,称为 “勿忘我”(FMN)。

FMN 是简短的自然语言句子,用于再次 "提醒 "模型注意通常被埋没在较长上下文中的重要信息。例如,可以在原始指令后立即添加一句话,如 “这条指令非常重要:您对问题的回答应完全基于这句话”,以达到预期效果。

FMN 旨在强调模型中的特定信息,同时尽量减少词块数量的增加。其特点是,它不会对模型的内部结构或参数做任何改动,而只是调整提示中的措辞以提高成绩。FMN 还能弥补模型对上下文理解的模糊性,因为它能用自然语言明确指出 “哪些信息是重要的”。

此外,FMN 还可与其他上下文记忆支持方法结合使用,如少点学习(few-shot learning),是一种多功能方法。因此,与传统方法相比,它能更简单、更有效地缓解语境遗忘。

实验

作者在几种 LLM(如 GPT-3.5、GPT-4、Claude 2、Gemini Pro)上设计并执行了共 10 项语境遗忘任务,以评估语境遗忘并测试 FMN 的有效性。每项任务都详细测量了模型是否能在上下文中保留特定信息,以及插入 FMN 对准确性的提高程度。

实验结果表明,GPT-4 的成绩提高了 43 分,Claude 2 的成绩提高了 37 分。此外,还观察到与模型记忆特征一致的趋势,如 FMN "信息位置越靠后越有效 "和 “离问题越远越有效”。

此外,为了评估 FMN 对整个提示信息的影响,我们还测试了 FMN 对提示信息中其他信息的干扰和误导风险,但在大多数情况下都没有发现负面影响,反而报告了成绩的稳定提高。特别是在 GPT-4 中,明确指出调频网络几乎总是有积极作用。

从这些结果中可以得出结论:FMN 是一种实用的方法,可以轻松有效地缓解情境遗忘。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/24 23:15:44

12、Neutron网络与子网管理全解析

Neutron网络与子网管理全解析 1. 网络创建与删除相关参数及操作 在网络创建和管理过程中,有一些关键参数需要了解。 - --external 和 --internal 参数:用于指定网络是否为外部提供商网络,外部提供商网络可作为网关网络和浮动IP池,默认网络的 router:external 属性…

作者头像 李华
网站建设 2026/4/23 15:20:10

吃透 JavaScript 循环语句:从基础到进阶的全维度解析

循环是编程的核心逻辑之一,它让我们能够重复执行一段代码,处理批量数据、实现自动化操作,是JavaScript开发中不可或缺的基础能力。JavaScript提供了多种循环语句,每种都有其适用场景和特性。本文将从基础到进阶,全面拆…

作者头像 李华
网站建设 2026/5/1 7:17:07

21、分布式虚拟路由器与负载均衡服务详解

分布式虚拟路由器与负载均衡服务详解 1. 分布式虚拟路由器实例间流量演示 在不同网络的虚拟机位于不同计算节点的场景中,流量传输有着特定的流程。以从计算节点 A 上的蓝色虚拟机实例向计算节点 B 上的红色虚拟机实例发送流量为例: 1. 初始转发 :流量从蓝色虚拟机实例通…

作者头像 李华
网站建设 2026/5/1 7:21:45

22、实例负载均衡流量指南

实例负载均衡流量指南 在当今的网络环境中,负载均衡对于确保服务的高可用性和性能至关重要。本文将详细介绍负载均衡的相关概念、算法、配置以及管理方法。 1. 负载均衡算法 在LBaaS API v2版本中,有三种负载均衡算法可应用于池: - 轮询(Round Robin) :负载均衡器将…

作者头像 李华
网站建设 2026/4/26 17:01:19

医院急诊|基于springboot + vue医院急诊管理系统(源码+数据库+文档)

医院急诊 目录 基于springboot vue医院急诊系统 一、前言 二、系统功能演示 三、技术选型 四、其他项目参考 五、代码参考 六、测试参考 七、最新计算机毕设选题推荐 八、源码获取: 基于springboot vue医院急诊系统 一、前言 博主介绍:✌️大…

作者头像 李华
网站建设 2026/5/1 8:39:47

SymPy特殊函数库:为什么工程师和科学家都爱不释手?

你是否曾经在解决复杂的物理问题时,被那些看似简单却难以计算的数学函数困扰?😅 别担心,SymPy特殊函数库就是你的救星!这个强大的Python符号计算库,让贝塞尔函数、超几何函数这些"数学明星"变得触…

作者头像 李华