news 2026/5/1 8:09:47

Seedream 3.0 填充:OneReward 使下一代掩码编辑成为可能

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Seedream 3.0 填充:OneReward 使下一代掩码编辑成为可能

概述

本文提出了一个新颖的强化学习框架 OneReward,用于综合处理图像生成中的多个编辑任务。

传统的图像编辑模型通常是专门针对个别任务(如内画(填充)、外画(增强)、对象移除和文本渲染)进行训练的,由于每个任务的数据分布和评估标准不同,限制了其通用性。

此外,传统的基于人类偏好的强化学习(RLHF)需要针对每个任务和评估维度建立不同的奖励模型,这对训练效率和一致性提出了挑战。

通过使用 VLM 作为唯一的奖励模型,本研究中的 OneReward 可以实现符合人类偏好的一致评价,同时区分任务和评价标准。
这样就能将不同的任务整合到一个统一的编辑模型中,创建一个兼具效率和性能的创新框架。

此外,应用该框架开发的 Seedream 3.0 Fill 在性能上优于最先进的商业和开源模型。

建议的方法

OneReward 的核心机制是使用单一 VLM 作为奖励模型,综合处理多个任务和多维评价标准。

OneReward 将任务 ID 和评价标准嵌入评价查询中,并确定哪个 VLM 更适合输入图像对。
这种基于比较的设计允许在保留不同评价维度之间不一致性的同时进行训练。

在学习过程中,现有的扩散模型被用作参考模型,而策略模型则与部分去噪生成的图像进行比较。
在此过程中,奖励模型使用二进制 "是/否 "输出来确定哪些图像符合人类偏好,并将这一概率作为强化学习的信号。

这样,该模型就能在多任务环境中同时学习多维偏好,并实现统一的性能提升,而无需额外的特定任务 SFT(监督微调)。

实验

作者将使用 OneReward 训练的 Seedream 3.0 Fill 的性能与最先进的模型(如 Adobe Photoshop、Ideogram 和 Flux Fill [Pro])进行了比较。

评估在四个主要任务中进行:图像填充、增强(有/无提示)、对象移除和文本渲染,从多个维度进行测量,包括可用率、文本一致性、结构一致性、美学质量和移除质量。
结果表明,Seedream 3.0 填充法在所有任务中的表现都优于现有方法,特别是在图像增强(无提示)中,可用率达到 87.54%,明显优于其他模型。

此外,在物体去除方面,它的去除质量高达 86.33%,生成的不需要的物体最少。
此外,在基于人工评估的 "好-同-坏 "测试中,与基本模型相比,带有 OneReward 的模型显著提高了 "好 "决策的比例。

这些实验表明,OneReward 可以通过单一奖励模型有效地完成各种编辑任务,从而实现统一的高性能图像编辑。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 1:54:19

从零开始学大模型:AI产品经理成长指南,附完整学习资源包,建议收藏!

本文系统介绍AI产业架构、产品经理分类与能力模型,详解计算机视觉、语音交互和自然语言处理三大应用领域的技术原理与瓶颈。同时阐述机器学习、深度学习等核心技术方法,并提供AI产品经理的完整学习路径和资源矩阵,帮助读者从理论到实践全面掌…

作者头像 李华
网站建设 2026/5/1 5:10:31

大模型应用要学会分而治之的思想

“ 大模型长文处理中,只能使用分段处理的思想,这是大模型应用的原则。” 最近在研究大模型报告生成和长文本处理的功能,然后发现之前在做大模型应用时很少出现上下文超长的情况,最多也就是多轮对话中出现,而多轮对话主…

作者头像 李华
网站建设 2026/5/1 6:16:12

这些品类适合做GOTS认证

GOTS认证适用品类 服装:包括T恤、衬衫、外套、裤子、裙子等各类用有机纺织品制成的服装。 家纺:如有机床单、被套、毛巾、浴巾等家居用品,以及有机棉床垫、枕头等床垫寝具。 布艺:像窗帘、沙发面料、桌布等家居装饰用的纺织产品。…

作者头像 李华
网站建设 2026/4/30 10:00:13

网络安全要学到什么程度,才能去大厂工作?

网络安全要学到什么程度,才能去大厂工作? 在数字化浪潮下,大厂(互联网头部企业、金融科技巨头、央企科技子公司等)对网络安全人才的需求持续爆发 —— 据行业报告显示,头部企业网络安全岗位年均招聘量增长 …

作者头像 李华
网站建设 2026/5/1 6:11:38

百考通AI:您的智能项目开发加速器,海量源码即取即用!

在当今快节奏的科技浪潮中,无论是高校学子、企业开发者还是独立工程师,都渴望找到一个能真正提升效率、降低开发门槛的得力助手。告别繁琐的重复造轮子,拥抱高效、智能、一站式的解决方案——这就是百考通AI(https://www.baikaoto…

作者头像 李华