news 2026/5/9 14:20:35

华为CANN通信拓扑模型

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
华为CANN通信拓扑模型

拓扑模型

【免费下载链接】hcommHCOMM(Huawei Communication)是HCCL的通信基础库,提供通信域以及通信资源的管理能力。项目地址: https://gitcode.com/cann/hcomm

背景

在实现通信算子时,由于以下两种原因,需要在控制面提供拓扑查询相关接口:

  • 算子控制面实现需要为数据面创建Channel,那不同rank是否互连,以及通过哪些Endpoint互连,是创建Channel必备的信息,所以需要提供拓扑查询相关控制面接口。
  • 不同集群可能具有不同的连接关系,算子实现的性能好坏与拓扑连接强相关。为了算子能够适配不同拓扑形态,且具有较好性能,需要感知拓扑连接关系。

因此,HCCL对通信域内不同rank间的连接关系进行拓扑建模,构成的拓扑图称之为rank graph,并提供了连接关系查询相关的控制面接口,具体见拓扑信息查询。

拓扑模型介绍

HCCL使用传统节点与边的图(Graph)表达方式对拓扑建模。由于大规模AI集群一般会分级组建,比如一个服务器包含多个NPU互连,多台服务器组成一个Rack或SuperNode等。因此HCCL在图表达的基础上增加了拓扑层级的抽象。

下图是一个拓扑模型示例,通过该示例介绍拓扑模型中的概念:

  • Node:图(Graph)中的节点,包含两种类型:

    1. 通信对象:在通信域中以rank ID标识的实体。
    2. Fabric:对网络交换/路由的抽象。
      1. Fabric只能与通信对象相连。
      2. Fabric可以是一个交换机,也可以是由多个交换机组成一套网络设施。
      3. 抽象为Fabric节点的网络设施需要满足条件:与它相连的通信对象两两之间都可以通过它互通。
  • Endpoint:一个Node的逻辑端口,一个Node可以包含一个或多个Endpoint。

  • Edge:图(Graph)中的边,表示不同Node之间的连接关系,Edge两端是两个Node的Endpoint。

  • Link:表示两个通信对象之间可以建链的信息,包含两端的Endpoint等。

  • 拓扑层级:实际网络拓扑存在分级情况,如下图所示,拓扑分为Layer 0和Layer 1两级,内部包含两个Layer 0拓扑;每一层级的网络拓扑具备自己的拓扑类型,比如Fullmesh、Clos等。

【免费下载链接】hcommHCOMM(Huawei Communication)是HCCL的通信基础库,提供通信域以及通信资源的管理能力。项目地址: https://gitcode.com/cann/hcomm

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 14:18:03

CANN竞赛燃烧你的梦团队作品

README 【免费下载链接】cann-competitions 本仓库用于 CANN 开源社区各类竞赛、开源课题、社区任务等课题发布、开发者作品提交和展示。 项目地址: https://gitcode.com/cann/cann-competitions 团队信息 团队名称:燃烧你的梦所属单位:广州职业…

作者头像 李华
网站建设 2026/5/9 14:17:35

基于Hugging Face的语音识别工具:带时间戳的转录方案

1. 项目概述easytranscriber是一个基于Hugging Face生态系统的语音识别工具,它的核心价值在于能够生成带有精确时间戳的转录文本。我在处理大量访谈录音和会议记录时,发现市面上大多数语音转文字工具要么时间戳精度不足,要么需要复杂的后期处…

作者头像 李华
网站建设 2026/5/9 14:11:01

CANN/ops-collections安全声明

安全声明 【免费下载链接】ops-collections ops-collections是基于昇腾硬件的高性能容器模板库,提供运行在NPU上的static_map、dynamic_map、set等容器。利用最新的SIMT并发能力,支持对容器的批量插入、查找等操作,提升整个系统的能力。 项…

作者头像 李华
网站建设 2026/5/9 14:10:36

多模态大模型赋能港口,从视频孪生迈向空间原生智能

多模态大模型赋能港口,从视频孪生迈向空间原生智能副标题:Camera Graph™跨镜头拓扑推理 NeuroRebuild™动态实景复刻,定义港口智治新代际一、行业技术代际跃迁:从视频可视化到空间原生智能的变革智慧港口数字化建设历经硬件感知…

作者头像 李华
网站建设 2026/5/9 14:09:38

高性能计算驱动科学AI:并行训练与物理信息神经网络实践

1. 项目概述:当科学计算遇上AI,一场效率革命正在发生如果你和我一样,长期在科学计算、工程仿真或者物理建模领域工作,那么对“算力焦虑”这个词一定深有体会。一个复杂的流体动力学模拟,动辄需要调用上千个CPU核心&…

作者头像 李华