news 2026/4/30 16:59:35

RWKV DevDay 2025 圆满落幕,看见 RWKV-8 的无限可能!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
RWKV DevDay 2025 圆满落幕,看见 RWKV-8 的无限可能!

2025 年 12 月 13 日,RWKV 在上海漕河泾举办了主题为《RWKV-8 与未来趋势》的 2025 RWKV DevDay。

十位来自 RWKV 开源社区的重磅嘉宾带来了深度分享,内容涵盖 RWKV-8 的核心 ROSA 机制、并发推理、端侧推理优化、评测方法,以及 RWKV 最新生态进展等多个维度。现场气氛热烈,观众与嘉宾进行了深入的互动与探讨。

分享嘉宾精彩回顾

侯皓文,人工智能与数字经济广东省实验室(深圳)副研究员,分享主题:《RWKV-8 介绍及 RWKV embedding》

郑云骜,来自北京邮电大学, 分享主题:《ROSA-tuning》

ROSA-Tuning 提供了一种基于 RWKV ROSA 思想的微调方法,使所有 LLM(例如 Qwen3) 使用滑动窗口注意力(SWA)+ ROSA 就能处理任意长的输入,同时获得比完整的全局注意力更好的性能

在推理过程中,ROSA 只需缓存与输入序列对应的rosa_token_id,而不是代价昂贵的 kv_cache,从而实现了显著更低的时空复杂度。

目前 ROSA-Tuning 已经支持多 GPU、多节点和多核训练。

黄文杰,浙江大学博士生,分享主题:《rosa_soft》

rosa_soft 提供了一个端到端可训练的 ROSA 算子实现,将原本离散、不可微的 ROSA 机制成功融入现代深度学习训练流程。

该方法在前向传播严格执行离散、高效的 Hard ROSA 后缀自动机逻辑,保证推理效率与语义忠实性;在反向传播则引入新设计 SUFA(Suffix Attention) 作为梯度代理,并结合 Value Detach + 几何衰减(VDD) 训练策略,使 Q/K 学会对齐最长公共后缀、V 保持结构化与清晰表达,从而实现稳定有效的训练。

rosa_soft 算子源自 RWKV-8 ROSA 的“无限长、无损信息传播”思想,因此具备无 KV Cache、无点积 Softmax、CPU 高效并行推理等优势,目前已提供高性能 C++ 内核与 PyTorch 接口。

顾真牛,RWKV 社区核心开发者、Ai00 作者,分享主题:《RWKV State Tuning 实战》

李韦乐,RWKV 社区核心开发者,分享主题:《RWKV 高并行 Demo》

王策,元始智能应用开发工程师,分享主题:《RWKV 端侧 Chat》

康嘉乐,元始智能高级算法工程师,分享主题:《ModRWKV:RWKV 端侧 See 和 Talk》

张恺之,SSPU AILab RA、RWKV 社区核心开发者,分享主题:《RWKV Benchmark》

Jellyfish042,深圳大学研究生,分享主题:《RWKV Uncheatable Eval》

罗璇,元始智能联合创始人,分享主题:《RWKV 生态进展》

大会现场还通过三个具体的 Demo,直观展示了 RWKV 在不同领域的实际应用能力:

  • 批量网页生成:通过高并行推理 Demo,展示了 RWKV 批量同时生成几十个网页代码的能力,体现了模型在多 agent 等高并发场景下的效率优势
  • 端侧多模态交互(Chat & See & Talk): 在端侧设备上直接运行 RWKV 多模态模型,无需联网即可实现流畅的视觉识别与语音对话,展现了 RWKV 低功耗、低资源占用的特性
  • 音乐生成(RWKV 作曲家 APP):基于 RWKV 模型的作曲工具,模型可以离线生成连贯且动听的乐曲

RWKV DevDay 2025 已圆满落幕,来自 RWKV 社区开发者与核心团队的精彩分享,让我们看见了 RWKV-8 的无限可能。

感谢每一位嘉宾和参会者的参与和支持。期待在下一次 DevDay,与大家再次相见!

精彩预告:《RWKV 论文研讨会》即将启动

RWKV 社区将于近期举办《RWKV 论文研讨会》。论文研讨会将以线上直播形式开展,进一步协助推广 RWKV 社区的学术研究工作。欢迎各位 RWKV 论文作者联系我们提交议题!(可在公众号后台留言)

《RWKV 论文研讨会》将于 2026 年开始定期播出,具体的议程及主题,敬请留意公众号后续通知。

加入 RWKV 社区

欢迎大家加入 RWKV 社区,可以从 RWKV 中文官网了解 RWKV 模型,也可以加入 RWKV 论坛、QQ 频道和 QQ 群聊,一起探讨 RWKV 模型。

  • 📖 RWKV 中文文档:https://www.rwkv.cn
  • 💬 RWKV 论坛:https://community.rwkv.cn/
  • 🐧 QQ 频道:https://pd.qq.com/s/9n21eravc | QQ 交流群:224287095
  • 📺 BiliBili 视频教程:https://space.bilibili.com/3546689096910933
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 7:19:05

私有化Dify端口配置避坑大全,20年经验工程师倾囊相授

第一章:私有化Dify端口配置概述在企业级AI应用部署中,私有化部署Dify平台已成为保障数据安全与系统可控性的首选方案。端口配置作为部署过程中的关键环节,直接影响服务的可访问性、安全性以及与其他系统的集成能力。合理的端口规划能够避免服…

作者头像 李华
网站建设 2026/5/1 7:17:37

设计师必备!OpenUI 本地搭建 + cpolar协作,效率提升不止一点点

文章目录前言1. 本地部署Open UI1.1 安装Git、Python、pip1.2 安装Open UI2. 本地访问Open UI3. 安装Cpolar内网穿透4. 实现公网访问Open UI5. 固定Open UI 公网地址前言 OpenUI 是一款能根据指令生成 UI 设计和代码的工具,支持 HTML、CSS 及 React、Vue 等框架&am…

作者头像 李华
网站建设 2026/4/26 7:52:08

8 个 MBA 任务书 AI 工具,高效写作降重推荐

8 个 MBA 任务书 AI 工具,高效写作降重推荐 论文写作的困境:时间与质量的双重挑战 MBA学生在撰写任务书、文献综述或毕业论文时,常常面临巨大的压力。一方面,课程安排紧凑,项目任务繁重,需要在有限的时间内…

作者头像 李华
网站建设 2026/5/1 7:19:50

【Dify高级开发必修课】:构建高吞吐并行工作流的7个关键步骤

第一章:Dify工作流并行执行的核心概念Dify 工作流的并行执行机制旨在提升复杂任务处理效率,通过允许多个节点同时运行,显著缩短整体执行时间。该机制适用于独立性强、无严格时序依赖的任务单元,例如数据采集、模型推理或日志处理等…

作者头像 李华
网站建设 2026/5/1 8:08:29

揭秘Dify工作流版本回滚机制:如何在5分钟内精准定位并恢复稳定版本

第一章:Dify工作流版本回滚机制概述 Dify作为一款面向AI应用开发的工作流引擎,提供了完整的工作流版本管理能力,其中版本回滚机制是保障系统稳定性和迭代安全的核心功能之一。该机制允许开发者在部署新版本后,快速恢复到历史稳定版…

作者头像 李华