news 2026/5/20 4:21:00

Ascend(昇腾)性能优化文章导航

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Ascend(昇腾)性能优化文章导航

作者:昇腾实战派

算力赋能时代,性能优化既是突破算力瓶颈的关键,也是国产化智能化转型的核心命题。本文聚焦昇腾设备全链路性能优化,汇总从硬件到软件,从算子到框架的实用干货,拆解调优技巧、分享实战案例、解答常见痛点。无论你是深耕昇腾的技术开发者,还是初探优化领域的初学者,都能在这里找到有价值的内容,一起解锁昇腾算力潜能,共探性能优化之道。

一、基础知识

1.1 推理框架及其特性

【推理框架 - vLLM】:vLLM-Ascend模型推理知识管理地图
【推理框架 - SGLang】:SGLang知识地图

1.2 常用模型

【常用模型 - DeepSeek系列】:DeepSeek知识地图;DeepSeek推理部署知识地图

二、定位指导

【定位指导】性能问题通用定位指南

三、工具资源

【工具资源 - 环境预检工具】MindStudio预检工具 - msprechecker
【工具资源 - profiling采集工具】基于vllm-ascend的性能采集方法
【工具资源 - profiling分析工具】MindStudio-Insight

四、调优案例

4.1 推理案例

4.1.1 下发性能调优

【推理案例 - 下发性能调优】NPU推理性能优化实践:从CPU下发瓶颈到算子级调优
【推理案例 - 下发性能调优】Qwen3-32B 推理性能优化实践:基于绑核与NUMA内存调度的TTFT调优

4.1.2 计算性能调优

【推理案例 - 计算性能调优】模型Prefill阶段性能优化实践:从快慢卡问题到吞吐率提升

4.1.3 通信性能调优

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/20 4:18:02

【android opencv学习笔记】Day 17: 目标追踪(MeanShift)

均值漂移(MeanShift)目标追踪实现 在计算机视觉中,目标追踪是核心技术之一,而 MeanShift(均值漂移) 是无需训练模型、轻量高效的经典追踪算法。 它结合直方图反向投影,能在连续帧/不同图片中自动…

作者头像 李华
网站建设 2026/5/20 4:16:11

Langchain的学习(一)

目录 一,实操 编码 Runnable Runnable 是什么 核心方法(所有 Runnable 都有) 最关键能力:用 | 组合(LCEL) 常用内置 Runnable 总结 二,聊天模型-核心能力 定义模型 init_chat_model 本地部署 调用工具 定义工具-Tool version1 schema: version2(基于…

作者头像 李华
网站建设 2026/5/20 4:14:21

JavaEE进阶:MyBatis 操作数据库(入门)

1.什么是MyBatis?MyBatis是一款优秀的持久层框架,用于简化JDBC的开发.持久层,指的就是持久化操作的层,通常是指数据访问层.用来操作数据库.简单来说,MyBatis是更简单完成程序和数据库交互的框架,也就是更简单操作和读取数据库的工具.接下来我们就通过一个入门的程序,感受一下M…

作者头像 李华
网站建设 2026/5/20 4:13:11

ARM PMU原理与缓存性能优化实战

1. ARM PMU基础概念与工作原理性能监控单元(PMU)是现代处理器中用于硬件事件统计的关键模块,在ARM架构中扮演着系统性能分析的重要角色。PMU通过专用计数器实时记录各类微架构事件,为开发者提供底层硬件行为的可视化窗口。1.1 PMU的硬件实现机制ARM PMU通…

作者头像 李华