news 2026/5/1 5:58:57

<span class=“js_title_inner“>反向工程构建高质量推理合成数据 | 直播预约</span>

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
<span class=“js_title_inner“>反向工程构建高质量推理合成数据 | 直播预约</span>

主题

反向工程构建高质量推理合成数据

时间

2026.01.25 周日 22:00 北京时间
2026.01.25 周六 09:00 美东时间
2026.01.25 周六 06:00 美西时间

直播平台

微信视频号:

b站直播间:

Youtube直播间:

https://www.youtube.com/live/U0rDRX7ZkYM

内容介绍

近年来,深度推理(deep reasoning)在数学、编程等可验证任务上取得了显著进展,但将其迁移到创意写作、开放式问答等不可验证的开放生成场景仍面临关键瓶颈:缺乏高质量奖励模型、训练代价高;通过教师模型进行蒸馏则成本昂贵,并受制于教师模型的能力上限。我们提出REverse-Engineered Reasoning(REER):一种反向构建推理思维链的全新范式。不同于从用户请求出发进行正向试错或模仿来生成推理过程,REER 从已知的高质量答案出发,反问思考“什么样的思考过程最可能导出该答案?”具体而言,对 给定的输入与高质量参考答案,REER的目标是找到一条推理轨迹,使得困惑度(perplexity)最小:

我们进一步提出一种无梯度(gradient-free)的合成方法:从初始轨迹出发,对轨迹进行分段,基段落进行扩写与替换,并用PPL作为代理指标进行选择与终止,从而在无需可验证奖励、无需昂贵蒸馏的情况下,规模化合成高质量深度思考轨迹。 基于该流程,我们构建并开源 DeepWriting-20K:覆盖 25 类开放式任务的 20,000 条深度推理轨迹数据,并以此微调得到 DeepWriter-8B(基座 Qwen3-8B-Base)。在 LongBench-Write、HelloBench、WritingBench 等基准上,DeepWriter-8B 不仅显著超越同规模开源基线(如 LongWriter-8B),还在多项开放生成评测中达到与 GPT-4o、Claude 3.5/3.7 等强闭源模型相当的表现。 总的来说,我们的工作提供了一条面向开放式生成的“第三路径”:通过反向搜索重构潜在推理过程来补齐推理数据与训练信号缺口,为在不可验证领域构建可扩展的思考链与结构化思考提供了新的方向。

Reverse-Engineered Reasoning for Open-Ended Generation
论文地址:https://arxiv.org/pdf/2509.06160

嘉宾

阙浩然,北京大学一年级博士生,导师为张世坤。研究方向包括大语言模型推理、长文本生成、多模态数据集等。在多个会议发表工作并担任评审,包括ACL,NeuraIPS等。

入群

欢迎加入NICE每周分享交流群,可与NICEer唠嗑,以及第一时间收到后续NICE分享报告的通知。加群通过小助手认证,群内无广告。

备注【昵称-单位-方向-NICE入群】

NICE介绍

NICE(Nexus forIntelligenCE)是一个由全球50+位一线青年学者共同发起的顶尖AI前沿交流平台。 成立以来,我们汇聚海内外300+嘉宾,通过百余场线上深度分享与线下高规格活动(北京/上海/苏州等),全网积累超13万关注。目前,NICE已构建起覆盖中、美、欧的国际化团队,正加速在硅谷、纽约、香港等地落地,致力于打造连接学术、产业与未来的全球化AI前沿社区。
NICE主页
https://nice-nlp.github.io
NICE海外
https://nice-intl.github.io
b站
https://space.bilibili.com/507524288
Youtube
https://www.youtube.com/@NLPAcademicExchangePlatform

编辑:冯可蘅 华盛顿大学
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 4:39:41

<span class=“js_title_inner“>4--Gradle入门 - 创建普通的web工程</span>

4--Gradle入门 - 创建普通的web工程前言上一篇,我们已经创建了java工程,本篇章再来创建web工程。“其实没啥用,还是研究如何部署 Springboot 环境就好了”创建普通的web工程1. 新建 gradle 管理的工程项目16858628472242. 设置项目使用本地的…

作者头像 李华
网站建设 2026/4/18 17:00:15

Flutter for OpenHarmony Python学习助手实战:函数定义与高级用法的实现

函数是代码复用的基础,掌握函数设计是成为优秀程序员的关键。在开发Python学习助手的过程中,我深刻体会到如何用Flutter为学习者打造一个优秀的函数定义与高级用法功能是多么重要。今天我来分享一下具体的实现思路和技术细节。 函数学习的核心挑战 在我多…

作者头像 李华
网站建设 2026/4/23 17:47:16

ZZ039 移动应用与开发赛项参考答案专栏必看说明

本专栏为ZZ039 移动应用与开发赛项参考答案。 内容全程涵盖国赛与省赛所有题目内容:模块A:移动应用界面设计、模块B:移动应用前端开发、模块C:移动应用测试与交付。 专栏后期会陆续更新各模块的答案,订阅专栏后您可永久…

作者头像 李华
网站建设 2026/4/8 14:37:29

ZZ039移动应用与开发赛项模块A—移动应用界面设计原型图XD参考答案(六)

ZZ039移动应用与开发赛项模块A—移动应用界面设计原型图XD参考答案(六) 文章目录 ZZ039移动应用与开发赛项模块A—移动应用界面设计原型图XD参考答案(六) 模块A:移动应用界面设计 任务1:环保中心界面设计(7.5分) 任务2:首页界面设计(7.5分) 任务3:积分捐献活动界面…

作者头像 李华
网站建设 2026/4/27 15:27:03

ZZ039移动应用与开发赛项模块A—移动应用界面设计原型图XD参考答案(九)

ZZ039移动应用与开发赛项模块A—移动应用界面设计原型图XD参考答案(九) 文章目录 ZZ039移动应用与开发赛项模块A—移动应用界面设计原型图XD参考答案(九) 模块A:移动应用界面设计 任务1:实现用户登录界面(7.5分) 任务2:实现主界面(7.5分) 任务3:实现民宿列表界面(…

作者头像 李华