news 2026/5/9 12:30:25

CANN/hcomm组调用结束接口

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/hcomm组调用结束接口

HcclGroupEnd

【免费下载链接】hcommHCOMM(Huawei Communication)是HCCL的通信基础库,提供通信域以及通信资源的管理能力。项目地址: https://gitcode.com/cann/hcomm

产品支持情况

  • Ascend 950PR/Ascend 950DT:不支持
  • Atlas A3 训练系列产品/Atlas A3 推理系列产品:支持
  • Atlas A2 训练系列产品/Atlas A2 推理系列产品:支持
  • Atlas 推理系列产品:不支持
  • Atlas 训练系列产品:不支持

[!NOTE]说明 针对Atlas A2 训练系列产品/Atlas A2 推理系列产品,仅支持Atlas 800T A2 训练服务器、Atlas 900 A2 PoD 集群基础单元、Atlas 200T A2 Box16 异构子框。

功能说明

结束一个组调用。

在HcclGroupStart和HcclGroupEnd之间调用多个函数,作为一个整体执行,组调用支持以下三种场景:

  • 单进程多线程管理NPU:支持调用通信域管理接口HcclCommInitClusterInfo、HcclCommInitClusterInfoConfig、HcclCommInitRootInfo、HcclCommInitRootInfoConfig 、HcclCommDestroy。
  • 合并多个集合通信。
  • 合并多个点对点通信。

函数原型

HcclResult HcclGroupEnd()

参数说明

返回值

HcclResult:接口成功返回HCCL_SUCCESS,其他失败。

约束说明

  • 仅支持在单机环境中使用组调用接口进行通信域管理。
  • 在一个组调用中,通信域管理、集合通信、点对点通信类型的接口不可混用。
  • 合并多个点对点通信时,不支持调用HcclBatchSendRecv接口。
  • HcclGroupStart必须和HcclGroupEnd配套使用,HcclGroupStart在前,HcclGroupEnd在后。

调用示例

  • 示例一:单进程多线程管理NPU

    HcclComm hccl_comms[devCount]; HcclGroupStart(); for(int i = 0; i < ndev; i++){ // aclrtSetDevice(i); HcclCommInitRootInfo(devCount, &rootInfo, global_rank, &(hccl_comms[i])); } HcclGroupEnd();
  • 示例二:合并多个集合通信操作

    HcclGroupStart(); HCCLCHECK(HcclReduceScatter(sendBuf, recvBuf, 1, HCCL_DATA_TYPE_FP32, HCCL_REDUCE_SUM, hcclComm, stream)); HCCLCHECK(HcclAllGather(recvBuf, sendBuf, 1, HCCL_DATA_TYPE_FP32, hcclComm, stream)); HcclGroupEnd();
  • 示例三:合并多个点对点通信

    HcclGroupStart(); for(int i = 0; i < devCount; i++){ HCCLCHECK(HcclSend(sendBuf[i], count, HCCL_DATA_TYPE_FP32, i, hcclComm, stream)); } for(int i = 0; i < devCount; i++){ HCCLCHECK(HcclRecv(recvBuf[i], count, HCCL_DATA_TYPE_FP32, i, hcclComm, stream)); } HcclGroupEnd();

【免费下载链接】hcommHCOMM(Huawei Communication)是HCCL的通信基础库,提供通信域以及通信资源的管理能力。项目地址: https://gitcode.com/cann/hcomm

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 12:26:11

CANN/ops-math复制填充反向算子

aclnnReplicationPad2dBackward 【免费下载链接】ops-math 本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-math 📄 查看源码 产品支持情况 产品是否支持Ascend 950PR/Ascend 950D…

作者头像 李华
网站建设 2026/5/9 12:25:38

收藏 | 产品经理必修课:从入门到精通 Agent 架构,抢占 AI 产品先机!

文章探讨了 AI Agent 对产品逻辑的颠覆性影响,强调产品经理需从传统工具设计者转变为 Agent 架构师。文章介绍了 Agent 的四大核心模块:规划模块、记忆模块、行动模块和工具模块,并以市场分析报告为例说明其协作方式。此外,文章还…

作者头像 李华
网站建设 2026/5/9 12:21:59

构建基于Python与机器学习的智能客服

在人工智能技术落地的众多场景中,智能客服无疑是商业化最成熟、应用最广泛的领域之一。它不仅能够大幅降低企业的人力成本,还能通过7x24小时不间断服务提升用户体验。本文将围绕“Customer智能客服系统”这一主题,结合具体的Demo实现&#xf…

作者头像 李华
网站建设 2026/5/9 12:21:34

模型诊断与知识库调试:从冲突集到高效算法的工程实践

1. 从理论到实践:模型诊断与知识库调试的核心脉络在人工智能和软件工程的交叉领域,我们常常面临一个经典难题:一个理论上设计精良的系统,在实际运行中却产生了与预期不符的结果。是哪个组件出了问题?是规则冲突&#x…

作者头像 李华