news 2026/6/8 23:10:35

我没买云服务器,用一台旧电脑跑了个24小时AI客服(附完整命令)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
我没买云服务器,用一台旧电脑跑了个24小时AI客服(附完整命令)

云服务器一年至少500元,还担心数据泄露。我用一台闲置的旧电脑,装了个Ubuntu,跑着一个真正的AI客服。数据全在本地,断网也能用,电费几乎可以忽略不计。

这篇文章不是理论,是我亲手跑通的完整记录。每一步都有命令,你可以直接复制粘贴。


一、先看结果

在开始之前,这是最终跑出来的界面:

一个完整的AI对话界面,你可以问任何客服问题,模型实时回答。速度很快,完全可用。

这就是你一个下午能搞定的东西。


二、这篇文章适合谁?

✅ 适合你,如果:

  • 你有一台闲置的旧电脑(4GB内存以上就能跑,8GB更佳)
  • 你想零成本验证AI客服能不能落地
  • 你希望数据不出门、不依赖云API
  • 你愿意花一个下午跟着命令走一遍

⚠️ 不适合你,如果:

  • 你想找一个“一键安装、三分钟完事”的方案
  • 你没有任何Linux基础(会复制粘贴命令就够了)
  • 你想处理每秒100个请求的高并发(这是企业级需求,不是本方案的目标)

三、硬件要求:比你想象的低

配置最低要求推荐配置
内存4GB8GB+
硬盘10GB空闲20GB+
显卡不需要(纯CPU运行)不需要
系统Ubuntu 20.04+Ubuntu 22.04

我用的就是一台16GB内存的旧电脑,没有独立显卡。你甚至可以拿树莓派、老笔记本、甚至云服务器的最低配来跑。


四、完整操作步骤(复制即用)

第一步:安装依赖(2分钟)

sudoaptupdate&&sudoaptinstall-ybuild-essentialgitwget

第二步:下载并编译 llama.cpp(5分钟)

# 克隆代码gitclone https://github.com/ggerganov/llama.cppcdllama.cpp# 创建构建目录并编译mkdirbuild&&cdbuild cmake..cmake--build.--configRelease-j4

💡说明:旧版教程用make,现在官方已切换到 CMake。上面这个命令是最新的标准方式。

编译成功后,可执行文件在./bin/目录下。

第三步:下载模型文件(10分钟,取决于网速)

# 回到上一级目录cd~/dev/llama# 创建模型存放目录mkdir-pmodels# 下载 3B 量化模型(约2.5GB,速度快且内存占用低)wget-chttps://hf-mirror.com/Qwen/Qwen2.5-3B-Instruct-GGUF/resolve/main/qwen2.5-3b-instruct-q4_k_m.gguf-O./models/qwen2.5-3b-instruct-q4_k_m.gguf

如果镜像慢,可以换成官方源,但国内推荐用上面这个hf-mirror.com

第四步:启动 AI 客服服务(10秒)

cd~/dev/llama/llama.cpp/build ./bin/llama-server-m~/dev/llama/models/qwen2.5-3b-instruct-q4_k_m.gguf--host0.0.0.0--port8080

看到类似HTTP server listening的日志,说明服务启动成功。

第五步:打开聊天界面

在浏览器输入:http://你的电脑IP地址:8080

你会看到一个完整的AI对话界面。输入任何问题,模型会实时回复。

如何查看你的IP地址?

hostname-I

会显示类似192.168.1.xxx的地址,用这个地址加:8080即可访问。


五、进阶:让服务后台运行(不掉线)

如果关掉终端服务就停了,可以用screen让它后台运行:

# 安装 screensudoaptinstall-yscreen# 创建一个新会话screen-Sai-server# 在里面启动服务(执行第四步的命令)# 按 Ctrl+A 然后按 D 即可离开,服务继续运行

下次想回来看看:

screen-rai-server

六、性能实测:到底能跑多快?

模型内存占用响应速度推荐场景
3B (Q4量化)~2.5GB非常快(1-3秒)实时客服对话
7B (Q4量化)~4.5GB较快(3-6秒)更复杂的回答质量

我实测3B模型:16GB内存的旧电脑,回答一个20字的问题约2-3秒,完全可用。


七、常见问题

Q1:make: command not found怎么办?

sudoaptinstallbuild-essential

Q2:cmake: command not found怎么办?

sudoaptinstallcmake

Q3:编译很慢怎么办?

-j4参数(4个核心并行),如果电脑核心多可以改成-j8

Q4:模型下载太慢怎么办?

用国内镜像:hf-mirror.com,我上面给的命令已经用了这个镜像。

Q5:启动后网页打不开?

  • 检查服务是否启动成功(终端有日志输出)
  • 检查防火墙:sudo ufw allow 8080
  • 检查IP地址是否正确

Q6:我想用自己的数据微调模型怎么办?

那是下一篇文章的内容。先跑通这个基础版,确认整个链路没问题,再用自己的数据做微调。


八、总结:你现在能做什么?

跑通之后,你手里就有了:

能力说明
✅ 一个可演示的AI客服系统可以给客户看截图/录屏
✅ 完整的部署脚本下次5分钟就能搭一个新的
✅ 本地部署的能力数据不出门,完全合规
✅ 零云服务成本一次投入,永久使用

这就是我写这篇文章的方式:不是讲理论,而是把我踩过的坑和跑通的命令,全部摊在桌上。你不需要成为AI专家,只需要跟着命令走一遍。


最后一句:你的第一个AI客服系统不需要完美,只需要跑通。今天花一个下午,明天你就多了一个24小时在线的员工。
在这里插入图片描述


(本文所有命令均已在实际环境中验证,Ubuntu 20.04/22.04均可运行。如果你遇到任何问题,欢迎在评论区留言。)

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/8 23:10:28

苏州吴江区高新技术企业认定的条件和优惠政策

一、苏州市吴江区高新认定条件1.企业成立时间:在吴江区域内注册成立一年(365个日历天数)以上,且为居民企业。2.知识产权所有权:通过自主研发、受让等方式,获得对主要产品(服务)核心技…

作者头像 李华
网站建设 2026/6/8 23:09:33

26个高质量书源一键导入指南:告别阅读APP无书可读的烦恼

26个高质量书源一键导入指南:告别阅读APP无书可读的烦恼 【免费下载链接】Yuedu 📚「阅读」自用书源分享 项目地址: https://gitcode.com/gh_mirrors/yu/Yuedu 还在为阅读APP找不到好书源而烦恼吗?是不是经常遇到书源失效、加载失败&a…

作者头像 李华
网站建设 2026/6/8 23:07:59

遗传算法进阶:动态算子适配与工业级参数调控

1. 项目概述:为什么遗传算法第二讲比第一讲更“烧脑”,也更值得深挖“A Fundamental Introduction to Genetic Algorithm – Part Two”这个标题乍看平平无奇,像是某门大学选修课的PPT第12页,或是某本经典教材的第6章小节。但如果…

作者头像 李华
网站建设 2026/6/8 23:05:56

2026年6月8日博客精选

今日摘要 本期精选涵盖了 LLM 在软件测试与项目重构中的深度应用,探讨了 AI 生成代码的质量权衡。Simon Willison 带来了基于 MicroPython 和 WASM 的沙箱安全方案。此外,还涉及 Go 语言存储 SDK 优化、IBM 604 硬件考古以及对 Apple AI 战略的独到见解…

作者头像 李华
网站建设 2026/6/8 23:01:46

基于NXP多PMIC的Zynq UltraScale+ MPSoC高可靠电源与功能安全设计

1. 项目概述与核心挑战在汽车自动驾驶、工业控制这类对系统可靠性要求严苛的领域,为高性能处理器设计供电方案从来都不是一件简单的事。这不仅仅是把电“供上”就行,它更像是在给一个精密而挑剔的“大脑”搭建一套稳定、高效且具备自我诊断和容错能力的生…

作者头像 李华