news 2026/6/15 14:32:11

大模型推理不确定性的根因和解决方法

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
大模型推理不确定性的根因和解决方法

根因:

不确定性是浮点运算导致的

  • 浮点运算中顺序不同,计算结果会有微小差异,即 a + b ≠ b + a
  • 推理过程由于需要加速运算,导致计算顺序不是固定的

解决方法:

  • api调用层面:设置确定性相关的参数
  • 服务端层面:控制底层的模型部署

https://zhuanlan.zhihu.com/p/1961192621759242664

实践效果:

api调用层面

对于短问题,仅采用该方法确定性已经较高。对长问题,效果很差

req_body = { "model": deepseek-v3-0324, # 假设LLMConf是您的配置对象 "messages": [ { "role": "user", "content": "假如美联储有降息的倾向,黄金会增值还是贬值,简要回答" } ], "max_tokens": 500, "temperature": 0, # 设为0,完全消除随机性 "top_p": 1, #
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 13:51:25

上线120小时,Moltbook全球瘫痪!150万AI服务器已炸?

就在刚刚,火遍全球的Moltbook,已经瘫痪了!网站无法访问,服务器账单已经涨成天文数字。刚被扒皮150万AI中大多数是人类假扮的,这个爆红的现象级网站就倒了。刚刚,Moltbook已经崩了。这个红极一时的网站&…

作者头像 李华
网站建设 2026/5/20 18:57:06

JY-KMT-LORA 微型LORA数传模块

JY-KMT-LORA 微型LORA数传模块 lora扩频数传网关 微型LORA数传模块 RS485转LORA模块 LORA无线串口模块 RS485转LORA 数传模块

作者头像 李华
网站建设 2026/6/5 15:10:38

近视防控到底在“防”什么?

‍  在和很多家长交流时,大家常把近视防控简单等同于“不让孩子度数涨”,可真正深入了解视力发展的规律后会发现,近视防控的核心远不止控制度数这么单一。我们每天面对的用眼场景、眼部功能的动态变化,都藏着近视防控需要关注的…

作者头像 李华
网站建设 2026/6/15 12:56:54

SpringBoot自动配置的黑魔法:5个你可能不知道的底层原理

SpringBoot自动配置的黑魔法:5个你可能不知道的底层原理 引言 SpringBoot的自动配置(Auto-configuration)是其最引人注目的特性之一,它极大地简化了Spring应用的开发流程。许多开发者享受着"开箱即用"的便利&#xff0c…

作者头像 李华
网站建设 2026/6/15 11:50:15

亚马逊云渠道商:AWS RDS备份恢复实战

一、引言在云计算时代,数据是企业最核心的资产。AWS RDS(关系型数据库服务)作为托管数据库解决方案,其备份与恢复功能是保障业务连续性的关键。无论是人为误操作还是系统故障,快速恢复数据都能最大限度减少损失。本文将…

作者头像 李华