news 2026/5/1 4:54:39

mHC:流形约束超连接

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
mHC:流形约束超连接

摘要

https://arxiv.org/pdf/2512.24880
近期,以超连接(Hyper-Connections, HC)为代表的研究扩展了过去十年确立的无处不在的残差连接范式,通过扩展残差流宽度和多样化连接模式。虽然这带来了显著的性能提升,但这种多样化从根本上损害了残差连接固有的恒等映射特性,导致严重的训练不稳定性和受限的可扩展性,并且额外产生了显著的内存访问开销。为了解决这些挑战,我们提出了流形约束超连接(Manifold-Constrained Hyper-Connections, mHC),这是一个通用框架,通过将HC的残差连接空间投影到特定流形上来恢复恒等映射特性,同时结合严格的基础设施优化以确保效率。实证实验表明,mHC在大规模训练中是有效的,提供了切实的性能改进和卓越的可扩展性。我们预期mHC作为HC的灵活实用扩展,将有助于更深入地理解拓扑架构设计,并为基础模型的演进指明有前途的方向。

图1 | 残差连接范式示意图。该图比较了(a)标准残差连接,(b)超连接(HC)和(c)我们提出的流形约束超连接(mHC)的结构设计。与不受约束的HC不同,mHC通过将矩阵投影到约束流形上来优化残差连接空间,以确保稳定性。

1. 引言

自从ResNets(He等,2016a)提出以来,深度神经网络架构经历了快速演变。如图1(a)所示,单层的结构可以表述如下:

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 5:03:18

CosyVoice3语音克隆系统搭建指南:一键运行脚本快速启动WebUI服务

CosyVoice3语音克隆系统搭建指南:一键运行脚本快速启动WebUI服务 在AI内容创作与智能交互日益普及的今天,个性化语音合成正从实验室走向千行百业。无论是虚拟主播需要复刻明星声线,教育机构希望用方言讲解课程,还是开发者构建情感…

作者头像 李华
网站建设 2026/4/23 0:51:40

OpenWebRX+完全指南:用浏览器开启你的软件无线电接收站

OpenWebRX完全指南:用浏览器开启你的软件无线电接收站 【免费下载链接】openwebrx Open source, multi-user SDR receiver software with a web interface 项目地址: https://gitcode.com/gh_mirrors/open/openwebrx 还在为复杂的无线电设备调试而烦恼吗&…

作者头像 李华
网站建设 2026/4/30 21:21:16

5分钟掌握Newscatcher:打造个性化新闻聚合系统的完整指南

5分钟掌握Newscatcher:打造个性化新闻聚合系统的完整指南 【免费下载链接】newscatcher Programmatically collect normalized news from (almost) any website. 项目地址: https://gitcode.com/gh_mirrors/ne/newscatcher 在信息爆炸的时代,如何…

作者头像 李华
网站建设 2026/4/12 13:37:31

EnergyPlus完全指南:建筑能耗模拟与HVAC系统优化的终极教程

EnergyPlus完全指南:建筑能耗模拟与HVAC系统优化的终极教程 【免费下载链接】EnergyPlus EnergyPlus™ is a whole building energy simulation program that engineers, architects, and researchers use to model both energy consumption and water use in build…

作者头像 李华
网站建设 2026/5/1 4:29:27

终极USB启动盘制作方案:Rufus完全使用指南

终极USB启动盘制作方案:Rufus完全使用指南 【免费下载链接】rufus The Reliable USB Formatting Utility 项目地址: https://gitcode.com/GitHub_Trending/ru/rufus 还在为系统安装的复杂流程而烦恼吗?每次重装系统都要面对繁琐的BIOS设置、镜像文…

作者头像 李华
网站建设 2026/4/25 3:46:24

CosyVoice3支持剧情分支语音吗?需配合游戏引擎逻辑

CosyVoice3 能否支撑剧情分支语音?关键在与游戏引擎的协同设计 你有没有遇到过这样的场景:玩家在视觉小说中做出一个选择,角色突然用带着颤抖的粤语说:“我一直都沒有騙你……”——语气里满是委屈和不甘。这种瞬间的情绪爆发&…

作者头像 李华