news 2026/6/15 19:02:22

对话优化标记器的潜力:一种将 LLM 推理效率提高 10% 的方法

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
对话优化标记器的潜力:一种将 LLM 推理效率提高 10% 的方法

概述

LLM 的计算资源和能耗与模型中的标记数成正比增长。为了减少标记符的数量,设计高效的标记符生成器非常重要。目前许多标记化器都是针对静态、结构化语料库(如书籍和网络文本)进行优化的。然而,聊天机器人是 LLM 在实践中的主要应用,主要是具有不同输入和输出格式的对话文本。

针对这一空白,本研究重新设计了 “对话优化标记符号化器”。具体地说,我们使用真实世界的聊天数据 LMSYS Chat 1M 重新训练了几种 LLM 的标记化器。

结果表明,标记符号的减少量最高可达 10%,甚至更多,这表明了提高能效的潜力。另一方面,对训练语料的影响有限,预计对模型性能的负面影响也很小。

建议采用的方法

本研究探讨了能否针对会话数据优化现有的标记符号生成器,以减少标记符号数量和推理过程中的能耗成本。

作为该方法的第一步,LMSYS Chat 1M 语料库的 80% 用于训练,20% 用于评估。然后建立三种类型的标记化器,仅使用用户输入、仅使用模型响应或同时使用用户输入和模型响应进行重新标记化。为确保公平比较,重新训练使用的算法和设置与每个模型的原始标记化器相同。

生育率"(每个词的标记数)和 "标记减少率 "用于评估。作为文本压缩效率的一项指标,"生字率 "尤其有用。与原始标记器相比,重新标记的模型在减少标记总数方面表现出一致的趋势。在回复方面的优化尤其有效,这也与聊天回复占大部分文本的情况相符。

结论是,这些设计可以在不影响模型通用性的情况下对标记符进行实际改进。

实验

本研究通过三项实验测试了对话优化标记符的有效性。

在第一个实验中,对八个 LLM 模型(GPT-4、GPT-4o、DeepSeek-R1、LLaMA-3.1、Gemma-2、Mistral-7B、BLOOM 和 Phi-4)中现有标记符的性能进行了评估。结果表明,所有模型在对话数据上的标记效率(生育率)都有所下降,这表明有必要进行优化。

接下来的实验证实,重新训练的标记符号生成器可以比原始标记符号生成器减少 5-10% 或更多的标记符号。其中,Gemma-2、Mistral-7B 和 BLOOM 的改进幅度超过了 10%,而针对具体语言的分析也表明,在英语和西班牙语等数据量大的语言中,减少幅度更为明显。

最后一项实验研究了重新训练的标记符对传统训练数据(C4 语料库)的影响。在大多数模型中,标记数只增加了 1-2%,而在某些模型中,标记数在某些情况下反而减少了。这表明,引入会话优化并不会明显降低模型的通用性。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/14 18:49:14

12、Neutron网络与子网管理全解析

Neutron网络与子网管理全解析 1. 网络创建与删除相关参数及操作 在网络创建和管理过程中,有一些关键参数需要了解。 - --external 和 --internal 参数:用于指定网络是否为外部提供商网络,外部提供商网络可作为网关网络和浮动IP池,默认网络的 router:external 属性…

作者头像 李华
网站建设 2026/6/15 14:40:34

吃透 JavaScript 循环语句:从基础到进阶的全维度解析

循环是编程的核心逻辑之一,它让我们能够重复执行一段代码,处理批量数据、实现自动化操作,是JavaScript开发中不可或缺的基础能力。JavaScript提供了多种循环语句,每种都有其适用场景和特性。本文将从基础到进阶,全面拆…

作者头像 李华
网站建设 2026/6/15 8:31:41

21、分布式虚拟路由器与负载均衡服务详解

分布式虚拟路由器与负载均衡服务详解 1. 分布式虚拟路由器实例间流量演示 在不同网络的虚拟机位于不同计算节点的场景中,流量传输有着特定的流程。以从计算节点 A 上的蓝色虚拟机实例向计算节点 B 上的红色虚拟机实例发送流量为例: 1. 初始转发 :流量从蓝色虚拟机实例通…

作者头像 李华
网站建设 2026/6/15 14:49:27

22、实例负载均衡流量指南

实例负载均衡流量指南 在当今的网络环境中,负载均衡对于确保服务的高可用性和性能至关重要。本文将详细介绍负载均衡的相关概念、算法、配置以及管理方法。 1. 负载均衡算法 在LBaaS API v2版本中,有三种负载均衡算法可应用于池: - 轮询(Round Robin) :负载均衡器将…

作者头像 李华
网站建设 2026/6/14 20:52:48

医院急诊|基于springboot + vue医院急诊管理系统(源码+数据库+文档)

医院急诊 目录 基于springboot vue医院急诊系统 一、前言 二、系统功能演示 三、技术选型 四、其他项目参考 五、代码参考 六、测试参考 七、最新计算机毕设选题推荐 八、源码获取: 基于springboot vue医院急诊系统 一、前言 博主介绍:✌️大…

作者头像 李华
网站建设 2026/6/15 6:25:06

SymPy特殊函数库:为什么工程师和科学家都爱不释手?

你是否曾经在解决复杂的物理问题时,被那些看似简单却难以计算的数学函数困扰?😅 别担心,SymPy特殊函数库就是你的救星!这个强大的Python符号计算库,让贝塞尔函数、超几何函数这些"数学明星"变得触…

作者头像 李华