news 2026/5/1 10:47:02

华为昇腾CANN深度学习环境搭建-以搭建VLLM为例

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
华为昇腾CANN深度学习环境搭建-以搭建VLLM为例

1 )首先确定vllm-ascend依赖。

Installation — vllm-ascend

确定cann的版本8.3.rc2

确定vllm和vllm-ascend的对照关系

2) 查询物理机的驱动版本

假设不是cann8.3rc2,那就安装

网址在这里,需要自己注册登录一下:

https://www.hiascend.com/developer/download/community/result?from=firmware&product=1&model=30&cann=8.3.RC2

下载toolkit和 kernels, 我是910b,如果是310请选择对照的版本。

下载完了以后就安装这俩驱动

安装完了以后,再安装一下这几个包,推荐使用conda安装。

pip3 install attrs cython 'numpy>=1.19.2,<=1.24.0' decorator sympy cffi pyyaml pathlib2 psutil protobuf==3.20.0 scipy requests absl-py --user

到这个阶段,驱动安装完了。

3)开始安装torch和torch-npu

这是下载地址:

https://www.hiascend.com/document/detail/zh/Pytorch/720/configandinstg/instg/insg_0004.html

其中8.3rc1和rc2可以通用。

然后安装npu-插件

安装完了以后,测试安装效果

python3 -c "import torch;import torch_npu; a = torch.randn(3, 4).npu(); print(a + a);"

然后安装vllm

安装完了vllm以后呢,torch会被重新装一下,版本可能和你的驱动不搭配。所以

这一步,需要按照第2步重新装一下torch和torch-npu

然后vllm-ascend版本和vllm版本要对照。

然后就结束了。大功告成。

(根据本人的经验,vllm0.11比0.12要快一些。)

4)vllm起量化模型。

vllm serve ./model_path --served-model-name qwen_quant --quantization ascend --max-model-len 90000 --port 8999

访问vllm接口:

为什么要截取90000,因为如果请求超过vllm的max_len 会报错,所以最好限制一下,不要超过vllm起服务时候的最大长度。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 5:17:11

Packet Tracer在企业网络培训中的5个实战案例

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容&#xff1a; 开发一个企业网络培训模拟系统&#xff0c;基于Packet Tracer实现以下场景&#xff1a;1. 多分支站点VPN互联 2. 防火墙ACL配置 3. VLAN间路由 4. DHCP服务部署 5. 网络故障排查。要…

作者头像 李华
网站建设 2026/5/1 5:17:11

基于STM32直流电机的PID调节+程序对比,可应用于倒立摆,平衡车等等

文章末尾会有参数和波形对比。用 “生活化比喻 你的电机实际场景” 给你讲透&#xff0c;全程不绕专业术语&#xff0c;每个概念都对应你的程序和测试数据&#xff0c;保证你能听懂、会用&#xff01;一、先搞懂&#xff1a;PID 到底是干嘛的&#xff1f;你可以把 PID 想象成一…

作者头像 李华
网站建设 2026/5/1 5:20:06

Nacos漏洞入门:小白也能看懂的安全指南

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容&#xff1a; 创建一个交互式Nacos漏洞学习工具&#xff0c;通过问答形式引导用户了解常见漏洞。包含&#xff1a;1. 漏洞动画演示&#xff1b;2. 简单防护操作指南&#xff1b;3. 知识小测验。使…

作者头像 李华
网站建设 2026/5/1 6:26:28

AI如何简化Android调试?ADB命令智能生成指南

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容&#xff1a; 创建一个AI辅助ADB命令生成工具&#xff0c;支持自然语言输入如查看连接的设备或安装APK到模拟器&#xff0c;自动转换为正确的ADB命令。包含常用功能&#xff1a;设备列表查看、AP…

作者头像 李华
网站建设 2026/5/1 8:37:15

英国和加拿大合作开发用于绿色人工智能的光子引擎

跨大西洋合作&#xff1a;英加联手打造新型国际供应链&#xff0c;加速“绿色AI”创新一项新的英国-加拿大技术合作伙伴关系正在致力于研发一种先进的光子引擎。该技术旨在使全球的人工智能数据中心运行速度更快、效率更高&#xff0c;并更具可持续性。这项合作是今年早些时候签…

作者头像 李华
网站建设 2026/4/30 10:34:13

5分钟验证:用快马快速搭建Python开发环境原型

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容&#xff1a; 请快速生成一个可立即运行的Linux Python开发环境原型。要求&#xff1a;1.包含Python 3.9基础环境 2.预装常用开发工具(pip,virtualenv等) 3.集成简单示例代码 4.支持一键测试运行…

作者头像 李华