news 2026/6/15 10:22:41

可能是最简单的本地化 DeepSeek+个人知识库实现方案

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
可能是最简单的本地化 DeepSeek+个人知识库实现方案

“本地化大模型+知识库”介绍

其实是一套本地化的 RAG 的方案,整体技术架构如下图所示:

[图片来源见文末]图中重要的三个组件:

1-LLM我们使用 Ollama 下载到本地;

2-文本切片Embedding后放入向量数据库的过程与组件, 使用 AnythingLLM 来提供;

3-Embedding 模型可以使用 AnythingLLM 自带的,也可以使用本地部署的。


使用 Ollama 下载 LLM

在 Ollama 的官网(https://ollama.com)下载并安装 Ollama 。

安装后,根据你本地硬件的配置,选择合适的模型下载。

对于 DeepSeek-R1 模型,可以参考下图中对显存的需求,选择不同模型。我选择的是一个7B 的模型。

选择好模型后,复制这里的命令行,粘贴至终端。Ollama 开始下载:

为提高后续的检索精度,我使用 Ollama 又下载了一个 Embedding 模型,Bge-m3。

AnythingLLM 自带了一个嵌入模型,所以这里你也可以不下载,用这个自带的嵌入模型。

到这里,我们使用 Ollama 成功下载了需要的两个模型:


安装并配置 AnythingLLM

从 AnythingLLM 的官网(https://anythingllm.com/)下载适合你系统的 AnythingLLM:

安装过程比较缓慢,耐心等待即可。

安装后进入欢迎界面,点击“开始”按钮:

之后的配置可以先不管,一直向右滑动:

进入到工作区界面,点击配置按钮:

Step1:LLM 配置

找到 “LLM 首选项”,选择LLM 提供商为 Ollama,会自动找到我们已经拉取的DeepSeek-R1: 7B模型:

配置后之后点“ Save Change ”。

向量数据库选择默认的即可。

Step2: Embedding 配置

嵌入引擎提供商选择 Ollama,配置 Embedding 模型为 bge-m3。

如果你没有拉取 bge-m3,保持默认的AnythingLLM Embedder就可以。

Step3:工作区配置

回到工作区界面,新建一个工作区,然后点击上传按钮:

点击这里,选择你需要放到知识库的本地文档。

之后,选中知识库中的文档,点击“ Move to Workspace”,将文档移入工作区:

工作区这时已经看得到放进去的文档了。保存并进行 Embed:

这个过程中,看得到 GPU 已经开始疯狂工作了

嵌入完成后,回到工作区,就可以针对我们的文档进行提问与分析了。


测试,及使用云端模型

根据我们的文档提问。推理速度很快,但结果并不太好:

因为我们本地算力有限,模型太小,性能上差很多。

使用云端模型试试。

回到设置,我们配置 LLM 首选项为 DeepSeek,填入一个可用的 API,选择推理模型:

同样的问题再测试一下,结果(仅截取部分)要比我们的本地模型好得多,而且初步来看,答案相关性和上下文相关性都更高:


总结

以上就是使用 Ollama + Anything 构建本地化大模型+知识库的极简方案,希望能帮到大家。

需要注意的是,并非所有的业务场景都需要完全本地化部署

在本地没有足够算力,又需要文档不出域的情况下,只要保证文档存储和检索过程在本地,即使大模型在云端,也可通过技术手段(如仅向云端发送查询向量或脱敏后的文本)实现合规;这也是一种很常见的技术方案。

读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

作为一名老互联网人,看着AI越来越火,也总想为大家做点啥。干脆把我这几年整理的AI大模型干货全拿出来了。
包括入门指南、学习路径图、精选书籍、视频课,还有我录的一些实战讲解。全部免费,不搞虚的。
学习从来都是自己的事,我能做的就是帮你把路铺平一点。资料都放在下面了,有需要的直接拿,能用到多少就看你自己了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以点击文章最下方的VX名片免费领取【保真100%】

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/13 15:20:29

《AI Agent开发实战》AI Agent开发到底怎么学

当大模型的基础能力逐渐普及时,我们清晰地看到:AI Agent(智能体)正成为决定AI应用成败的关键。从自动化客服到金融分析,从内容创作到企业决策,智能体已经展现出惊人的问题解决能力。它不再是那个被动回答问…

作者头像 李华
网站建设 2026/6/13 20:46:21

亚马逊小卖家广告越烧越亏?精准捡漏策略藏着破局秘诀

在亚马逊这个巨头林立的竞技场中,预算有限的小卖家若与巨头正面竞价,无异于以卵击石,一套被业内称为“低成本高回报捡漏打法”的精巧策略,正为小卖家开辟出一条差异化生存路径,核心在于通过极致的策略设计与数据驱动&a…

作者头像 李华
网站建设 2026/6/1 5:27:27

LangFlow镜像上下文管理:长对话记忆不丢失

LangFlow镜像上下文管理:长对话记忆不丢失 在构建智能客服、个性化助手或多轮任务型Agent时,一个常被忽视却极其关键的问题浮出水面:用户刚说完“帮我查上次会议纪要”,系统却已经忘了之前聊的是哪个项目。这种“金鱼脑”式的交互…

作者头像 李华
网站建设 2026/6/14 19:51:19

基于51单片机的室内灯光窗帘控制系统设计与实现

一、系统设计背景与总体目标 随着智能家居理念的普及,室内环境的自动化控制成为提升居住舒适度与节能性的重要方向。传统室内灯光与窗帘多依赖手动操作,存在响应滞后、能源浪费等问题,而基于51单片机的控制系统凭借成本低、稳定性高、开发难度…

作者头像 李华
网站建设 2026/6/13 20:54:01

【大厂都在用的AI提醒方案】:Open-AutoGLM赋能外卖商家实时响应

第一章:Open-AutoGLM在外卖出餐提醒中的核心价值在现代外卖平台的高并发订单处理场景中,及时、精准的出餐提醒机制是提升用户体验与商家协作效率的关键环节。Open-AutoGLM 作为一款基于自研大语言模型的任务推理引擎,通过语义理解与动态决策能…

作者头像 李华
网站建设 2026/6/14 20:28:23

LangFlow镜像循环结构支持:处理批量数据更高效

LangFlow镜像循环结构支持:处理批量数据更高效 在AI应用开发日益普及的今天,一个常见的痛点浮出水面:如何高效地对成百上千条文本进行统一处理?无论是客户邮件分类、用户评论情感分析,还是简历筛选与日志解析&#xff…

作者头像 李华