news 2026/5/27 17:03:09

mindie部署qwen3-8b

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
mindie部署qwen3-8b

参考:
https://www.hiascend.com/document/detail/zh/mindie/230/quickstart/mindie_quickstart_0004.html

https://www.hiascend.com/document/detail/zh/mindie/230/mindiellm/llmdev/mindie_service0285.html

mkdir /root/tmp
modelscope download --model Qwen/Qwen3-8B --local_dir /root/tmp/
将Qwen3-8B直接放到tmp中,目录结构为
/root/tmp/Qwen3-8B/config.json

1. 拉取镜像
docker pull --platform=arm64 swr.cn-south-1.myhuaweicloud.com/ascendhub/mindie:2.3.0-300I-Duo-py311-openeuler24.03-lts

docker images |grep 2.3.0-300I-Duo-py311-openeuler24.03-lts

2.启动容器
docker run -it -d --net=host --shm-size=4g \
       --name  qwen3-8b\
       -w /home \
       --device=/

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/23 11:55:50

ES6 核心语法精讲

一、变量声明javascript// let 块级作用域变量 let count 0 count 1 // ✅ 可重新赋值 if (true) {let count 2 // ✅ 新的块级变量 }// const 常量(引用不可变) const PI 3.14159 // PI 3.14 // ❌ 报错const user { name: John } user.name …

作者头像 李华
网站建设 2026/5/21 10:53:05

java数据结构基础-顺序表

一.顺序表是用一段物理地址连续的存储单元依次存储数据元素的线性结构,一般情况下采用数组存储。在数组上完成数据的增删查改。 顺序表接口的实现(手动实现,仅为方便初学理解,实际开发中都用java自带的不用手写): public class SeqList {// …

作者头像 李华
网站建设 2026/5/20 7:20:32

MySQL表的内连和外连

内连接外连接左外连接右外连接OJ内连接 实际上我们在表的复合查询部分用的就是内连接,只不过语法不是很规范。 标准语法: select 字段 from 表1 inner join 表2 on 连接条件 and 其他条件;如,显示SMITH的名字和部门名称: 之前的…

作者头像 李华
网站建设 2026/5/23 0:56:03

Hugging Face模型缓存提速实战

💓 博客主页:借口的CSDN主页 ⏩ 文章专栏:《热点资讯》 Hugging Face模型缓存提速实战:从原理到高效部署 目录 Hugging Face模型缓存提速实战:从原理到高效部署 引言:缓存瓶颈——AI开发者的日常痛点 一、缓…

作者头像 李华
网站建设 2026/5/1 7:46:54

【软件测试】4_性能测试实战 _性能测试计划

文章目录 一、测试背景二、测试目的三、测试范围四、测试策略4.1 基准测试4.2 负载测试4.3 稳定性测试 五、风险控制六、进度与分工 (人员安排)七、交付清单八、总结 一、测试背景 商城是公司新开发的一个电商项目, 为了保证项目上线后能够稳定的运行, …

作者头像 李华