TRACE_START
【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit
产品支持情况
功能说明
通过CAModel进行算子性能仿真时,可对算子任意运行阶段打点,从而分析不同指令的流水图,以便进一步性能调优。
用于表示起始位置打点,一般与TRACE_STOP配套使用。
[!CAUTION]注意 该功能主要用于调试和性能分析,开启后会对算子性能产生一定影响,通常在调测阶段使用,生产环境建议关闭。 默认情况下,该功能关闭,开发者可以按需通过如下方式开启打点功能。 修改Kernel直调工程cmake目录下的npu_lib.cmake文件,在ascendc_compile_definitions命令中增加-DASCENDC_TRACE_ON编译选项,来开启打点功能。示例如下:
// 打开算子的打点功能 ascendc_compile_definitions(ascendc_kernels_${RUN_MODE} PRIVATE -DASCENDC_TRACE_ON )
函数原型
#define TRACE_START(TraceId apid) #define TRACE_START(pipe_t pipe, TraceId apid) // 该接口仅支持Ascend 950PR/Ascend 950DT参数说明
| ||
返回值说明
无
约束说明
- TRACE_START/TRACE_STOP需配套使用,若Trace图上未显示打点,则说明两者没有配对。
- 不支持跨核使用,例如TRACE_START在AI Cube打点,则TRACE_STOP打点也需要在AI Cube上,不能在AI Vector上。
- 宏支持所有的产品型号,但实际调用时需与调测工具支持的型号保持一致。
- 仅支持Kernel直调工程,不支持自定义算子工程下开启打点功能。
调用示例
在Kernel代码中特定指令位置打上TRACE_START/TRACE_STOP:
TRACE_START(0x2); Add(zLocal, xLocal, yLocal, dataSize); TRACE_STOP(0x2);【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考