news 2026/5/21 17:12:21

TensorRT-LLM 安装使用笔记

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
TensorRT-LLM 安装使用笔记

目录

2026.04.01 linux 安装成功;

docker版;

docker 验证:


2026.04.01 linux 安装成功;

pip install tensorrt-llm

上面的安装完,自己安装了torch2.9

匹配版本安装,待测试结果:

pip install torch==2.8.0+cu128 torchvision==0.23.0+cu128

tensorrt-llm应该安装哪个版本

python -c "import torch; print(f'torch=={torch.__version__}')" > /tmp/torch-constraint.txt

tensorrt_llm-1.1.0.tar.gz

conda install -c conda-forge openmpi mpi4py
ImportError: libcublasLt.so.13: cannot open shared object file: No such file or directory
from flash_head.ltx_video.ltx_vae import LtxVAE self.vae = LtxVAE( pretrained_model_type_or_path=vae_dir, dtype=self.param_dtype, device=self.device, )

docker版;

docker pull nvcr.io/nvidia/cuda:12.2.0-base-ubuntu20.04
docker compose \ --env-file ./.env \ -f docker-compose.cosyvoice2.dit.yml up
{ "registry-mirrors_1": [ "https://0qithrlo.mirror.aliyuncs.com" ], "runtimes": { "nvidia": { "args": [], "path": "nvidia-container-runtime" } } }

docker 验证:

import subprocess host = "registry-1.docker.io" try: result = subprocess.run(["ping", "-c", "3", host], capture_output=True, text=True) print(result.stdout) except Exception as e: print(f"无法 ping: {e}")
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/1 19:47:15

Qwen3.5-9B成本优化:Spot实例+自动休眠+低峰期资源释放策略

Qwen3.5-9B成本优化:Spot实例自动休眠低峰期资源释放策略 1. 项目概述 Qwen3.5-9B是一款拥有90亿参数的开源大语言模型,具备以下核心能力: 强逻辑推理:能够处理复杂的逻辑推理任务代码生成:支持多种编程语言的代码生…

作者头像 李华
网站建设 2026/5/21 17:10:21

千问3.5-2B在电商客服落地:买家上传问题图→自动识别商品+定位故障点

千问3.5-2B在电商客服落地:买家上传问题图→自动识别商品定位故障点 1. 电商客服的痛点与解决方案 电商客服每天面临大量买家咨询,其中很多问题都涉及商品图片。传统处理方式效率低下: 买家上传问题图片后,客服需要人工查看并判…

作者头像 李华
网站建设 2026/5/14 18:41:03

告别停机烦恼:手把手教你用倍福Hot Connect实现EtherCAT模块热插拔(附EK1101/EK1100配置对比)

工业现场零停机实战:倍福Hot Connect技术深度解析与配置指南 在自动化产线中,设备维护导致的停机每分钟都可能造成数万元损失。去年某汽车焊接车间因一个故障IO模块更换导致全线停产35分钟,直接损失超过50万元——这正是热插拔技术要解决的核…

作者头像 李华
网站建设 2026/4/8 13:59:43

【独家首发】Polars 2.0清洗错误码速查矩阵(覆盖98.7%生产环境异常),含12个真实脱敏日志+对应修复命令

第一章:Polars 2.0清洗错误码速查矩阵全景概览Polars 2.0 在数据清洗阶段引入了更精细化的错误分类机制,将传统模糊的 ComputeError 拆解为语义明确的清洗专属错误类型,覆盖空值处理、类型强制转换、正则匹配失败、时间解析异常等高频场景。这…

作者头像 李华
网站建设 2026/4/1 19:38:34

eNSP 安装全攻略:从虚拟机配置到依赖软件详解

1. eNSP安装前的环境准备 第一次接触eNSP的朋友可能会被一堆专业名词吓到,其实没那么复杂。简单来说,eNSP就是华为推出的一款网络设备模拟器,可以让你在电脑上搭建虚拟的网络环境,用来练习配置路由器、交换机这些设备。我自己刚开…

作者头像 李华
网站建设 2026/4/1 19:32:34

STM32F103RCT6 -- 基于FreeRTOS队列机制的USART1高效串口通信实现

1. 为什么需要队列机制优化串口通信? 在嵌入式开发中,串口通信就像两个人在嘈杂的菜市场里喊话——数据随时可能被淹没在噪声中。我刚开始用STM32F103RCT6做串口项目时,经常遇到数据丢失的问题。后来发现,裸机环境下直接操作USART…

作者头像 李华