news 2026/5/2 15:25:32

[AI] 日志与监控:用 Prometheus + Grafana 监控本地 LLM 指标

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
[AI] 日志与监控:用 Prometheus + Grafana 监控本地 LLM 指标

目标:为本地/私有化 LLM 部署建立可观测性,覆盖指标采集、日志结构化、可视化面板与报警实践,适用于 vLLM/TGI/llama.cpp 等。

1. 监控范围

  • 性能:TTFT、p50/p95/p99 延迟、tokens/s、QPS、并发数。
  • 资源:GPU 显存/利用率、CPU、内存、磁盘 I/O、网络。
  • 质量:错误率、超时、重试、拒答率、敏感词命中。
  • 成本:tokens 消耗、缓存命中率。

2. 指标采集

  • vLLM/TGI:自带 Prometheus 端点(如:8000/metrics),包含请求延迟、tokens、显存。
  • llama.cpp:可通过--metrics或 exporter(如 telegraf + exec)采集;
  • GPU:nvidia-smi --query-gpu=utilization.gpu,memory.used --format=csv
  • 自定义:在网关/业务层增加请求计数、错误率、命中缓存等指标。

3. 日志

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/2 12:25:00

猫抓资源嗅探扩展终极使用教程:从新手到高手全掌握

猫抓资源嗅探扩展终极使用教程:从新手到高手全掌握 【免费下载链接】cat-catch 猫抓 chrome资源嗅探扩展 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 猫抓资源嗅探扩展作为一款功能强大的浏览器工具,能够智能识别并下载网页中的…

作者头像 李华
网站建设 2026/5/1 8:22:00

OpenCore Simplify高效配置指南:3步实现专业级黑苹果部署

OpenCore Simplify高效配置指南:3步实现专业级黑苹果部署 【免费下载链接】OpCore-Simplify A tool designed to simplify the creation of OpenCore EFI 项目地址: https://gitcode.com/GitHub_Trending/op/OpCore-Simplify OpenCore Simplify作为一款专为黑…

作者头像 李华
网站建设 2026/5/1 10:40:08

无人机语音控制:抗风噪环境下的情绪识别优化

无人机语音控制:抗风噪环境下的情绪识别优化 在户外复杂环境中操控无人机时,传统遥控器操作存在视线遮挡、双手受限等问题。而语音控制本应是更自然的交互方式——可现实却很骨感:大风呼啸、螺旋桨轰鸣、环境嘈杂,让普通语音识别…

作者头像 李华
网站建设 2026/5/1 11:32:50

Windows系统防护终极利器:OpenArk深度实战指南

Windows系统防护终极利器:OpenArk深度实战指南 【免费下载链接】OpenArk The Next Generation of Anti-Rookit(ARK) tool for Windows. 项目地址: https://gitcode.com/GitHub_Trending/op/OpenArk 在日益复杂的网络安全环境中,你的Windows系统真…

作者头像 李华
网站建设 2026/5/1 9:25:48

YOLO26工业互联网:设备故障预警系统搭建实战

YOLO26工业互联网:设备故障预警系统搭建实战 在制造业智能化升级浪潮中,产线设备的实时状态感知与早期故障识别正成为工厂降本增效的关键突破口。传统依赖人工巡检或固定传感器阈值告警的方式,存在响应滞后、漏报率高、泛化能力弱等明显短板…

作者头像 李华
网站建设 2026/5/2 4:00:26

EmojiOne Color彩色字体:开启数字表情新时代的完整指南

EmojiOne Color彩色字体:开启数字表情新时代的完整指南 【免费下载链接】emojione-color OpenType-SVG font of EmojiOne 2.3 项目地址: https://gitcode.com/gh_mirrors/em/emojione-color 在这个表情符号风靡全球的数字时代,如何让你的项目在视…

作者头像 李华