news 2026/5/1 7:27:57

大模型+知识库要怎么做才有效果?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
大模型+知识库要怎么做才有效果?

最近调研了多个知识库产品,主要是因为要通过LLM+RAG的方式实现企业内的知识问答。现在提到知识库,已经不是指飞书,notion,wiki,金山了,更多是说RAG(检索增强生成)知识库,通过LLM+RAG的方式,可以实现知识检索准确率的提高。

LLM+RAG简述

大佬的流程图是这样的。

小弟的流程图是这样子的:

知识库产品(RAG技术),都已经作为智能体开发的基础组件。离开知识库,大模型就是个傻子。那么,大家都说大模型是傻子,究竟犯了什么事呢?为什么越来越不认可大模型的价值?下面,我给大家说说大模型的几个局限性。

大模型的局限性

1、陈述的内容过期,没有新鲜知识。

模型训练的数据是在模型发布前就已经决定的,24年发布的模型,你没法问他2025年的总统是谁,你也没法问他,昨天蔚来发布的财报说明什么问题。

当然,你可以通过联网查询功能来实现新知识的获取,可以是大模型支持的联网查询功能,也可以是豆包这种提供的联网查询功能,实际就是通过爬虫去爬取网页上的排名靠前的,与你问题匹配度较高的内容,然后丢给大模型整理输出而已。如果你使用联网功能很多,那么很快,平台的广告就来了,谁给的钱多,谁就能在大模型联网搜索时被召回。下一个莆田医院就不远了。

2、一本正经地胡说八道。

让他找出《千字文》中重复的3个字。他就会找出3个字。还记得我们问1.11大,还是1.9大的问题吗?他将1.11大的结论分析得井井有条。

从书籍中,只找到一个“巨”,而“钜野洞庭”不是“巨”,而“发”之所以重复,是头“髪”的发,和發财的“發”,简体重复了。同样的,玉出昆冈,是 “崑”,而 “昆池碣石” 中的 “昆”没有山字头,简体重复了。

好吧,即使他检索的是简体,3个错了2个就算了。我让他再找20个,他真的就找20个了,管你对不对

所以我认识的CEO和非CEO们,都说豆包是小学生。

3、企业内部知识无法给出合适的答案。

这些毋容置疑,大模型对于企业内的知识,肯定是一无所知的。

其他一些局限问题,比如:逻辑推理能力极差,还不承认;上下文窗口限制,不能处理太大的如此,根据不同模型及参数量,会有些区别,比如128K token已经是极限。

怎么解决大模型的问题呢?

用了知识库,使用LLM+RAG就能解决问题吗?

答案是,不能。

企业知识现状

大多数企业的知识整理都是零散的,有的部门用飞书,有点用金山,也有部署了confluence,还有用外部的其他免费系统。对于知识,极少公司愿意买一个容器,来存放知识。

导致大量的企业知识都在人员流动过程中丢失,知识不是企业生产力,人才是。一个任务丢给那个人,就指望着那个人去完成即可,至于是否有知识沉淀,是否有操作指引,是否有验收标准,都是去执行的那个人去搞定。所谓牛马,即如此。把责任人定义好,好像事情就解决了一样。

于是,牛马完成了工作之后,也不会主动将知识沉淀,成为企业的资产。只会用这些知识,敲开他下一个马厩/牛棚的大门。

知识管理,企业从不重视!

有了AI,企业是怎么用知识的?

现如今,需要用AI去替代人了,就想到,如果将我企业的知识给到AI,是否AI就能提高员工的工作效率了呢?

答案是,没错!

于是,企业导出搜刮知识,东一片,西一片,也没有分类,也没有标签,跟没有统一格式。阿牛写的文档,跟阿马写的风格不同。也有线上的,有线下的。都投到Agent开发平台的所谓“知识库”里,期望就能从中找到答案。

于是,agent开发工程师上线了。通过各种操作,高端操作。通过各种技术手段,解析、分段、向量化、知识图谱等等,无法穷尽,催生了各类微调模型,Lora,embedding,排序算法。

唯一不处理的,就是知识的质量!

没人关心知识质量,都认为知识在那里了,作为agent开发工程师,你用好知识是你的本职工作。怎么实现我不管。

于是,公司内形成了一种共识:推动企业知识治理是极其艰难的事情。

于是,Agent工程师就开干了。搞不定知识,总能搞定领导吧?领导问数据,我写好常用的SQL语句,只要匹配到了,就用这个SQL执行。领导问问题,写好问题分类,只要匹配到了,就回答这些内容。问到的片段很少,没关系,我让LLM扩写就行了。实在不行,我通过FAQ文档,整理一些常见问题,也能路演,能拿到结果。不就做做宣发嘛,我的强项!

其实知识治理可以这么做

通过知识获取、知识加工到知识治理,设计7个环节,

短期:平台构建,驱动方案落地

技术层面:完成知识知识管理平台搭建,实现采集、加工、存储、基础检索功能建设;

流程层面:制定初版知识录入规范(如标题、分类模板)、知识运营体系,确保知识可被各类系统使用;

业务参与:业务部门提供核心知识清单及分类,IT 部门负责数字化落地。

中期:知识运营体系初步落地

业务主导知识建模:建立业务领域的知识分类体系,定义实体关系,定义标签体系;

IT 优化技术支撑:基于业务模型升级检索算法(如相似内容推荐),开发知识复用的工具组件(如模板库、案例库);

建立运营机制:业务部门指定知识管理员,制定知识质量标准,负责知识审核、更新和培训,IT 部门提供数据看板(如知识使用率、复用次数)

长期:知识运营体系高水平

业务流程与知识管理深度绑定:将知识获取、应用、治理嵌入业务系统,打通研、产、供、销、服、管全价值链,减少知识盲区;

建立知识生态文化:业务部门将 “知识贡献” 纳入绩效考核(如分享案例得积分),形成 “用知识解决问题” 的组织习惯,通过业务领域、团队、个人协作保障知识及时更新及持续新增;

IT 提供智能化支撑:引入 AI 技术实现知识的自动更新、关联和推荐,减少人工干预成本。

通过知识运营,可以提高知识的可用性,针对LLM+RAG的场景,可以更自如地应对。

单纯的RAG知识库,没有知识运营的能力,就如现在很多产品做的那样,而真正要起到效果的是知识成效。而要做知识治理,非得从根基做起不可,也就是还是要回归到知识库与wiki,飞书集成,与业务系统集成,与数据中台集成。通过知识库做好知识运营,方可用于Agent开发。

领导者,应该给执行人提供方向,决定做什么的同时,更重要的是决定不要什么。

不要安排一件事情下去,就等着见效果。你见到的效果,或许是假的。不稳的地基,工人给你建的楼房多漂亮,也心中要有数,打个卡发个朋友圈可以,可千万别进去住。

想入门 AI 大模型却找不到清晰方向?备考大厂 AI 岗还在四处搜集零散资料?别再浪费时间啦!2025 年AI 大模型全套学习资料已整理完毕,从学习路线到面试真题,从工具教程到行业报告,一站式覆盖你的所有需求,现在全部免费分享

👇👇扫码免费领取全部内容👇👇

一、学习必备:100+本大模型电子书+26 份行业报告 + 600+ 套技术PPT,帮你看透 AI 趋势

想了解大模型的行业动态、商业落地案例?大模型电子书?这份资料帮你站在 “行业高度” 学 AI

1. 100+本大模型方向电子书

2. 26 份行业研究报告:覆盖多领域实践与趋势

报告包含阿里、DeepSeek 等权威机构发布的核心内容,涵盖:

  • 职业趋势:《AI + 职业趋势报告》《中国 AI 人才粮仓模型解析》;
  • 商业落地:《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》;
  • 领域细分:《AGI 在金融领域的应用报告》《AI GC 实践案例集》;
  • 行业监测:《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。

3. 600+套技术大会 PPT:听行业大咖讲实战

PPT 整理自 2024-2025 年热门技术大会,包含百度、腾讯、字节等企业的一线实践:

  • 安全方向:《端侧大模型的安全建设》《大模型驱动安全升级(腾讯代码安全实践)》;
  • 产品与创新:《大模型产品如何创新与创收》《AI 时代的新范式:构建 AI 产品》;
  • 多模态与 Agent:《Step-Video 开源模型(视频生成进展)》《Agentic RAG 的现在与未来》;
  • 工程落地:《从原型到生产:AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。

二、求职必看:大厂 AI 岗面试 “弹药库”,300 + 真题 + 107 道面经直接抱走

想冲字节、腾讯、阿里、蔚来等大厂 AI 岗?这份面试资料帮你提前 “押题”,拒绝临场慌!

1. 107 道大厂面经:覆盖 Prompt、RAG、大模型应用工程师等热门岗位

面经整理自 2021-2025 年真实面试场景,包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题,每道题都附带思路解析

2. 102 道 AI 大模型真题:直击大模型核心考点

针对大模型专属考题,从概念到实践全面覆盖,帮你理清底层逻辑:

3. 97 道 LLMs 真题:聚焦大型语言模型高频问题

专门拆解 LLMs 的核心痛点与解决方案,比如让很多人头疼的 “复读机问题”:


三、路线必明: AI 大模型学习路线图,1 张图理清核心内容

刚接触 AI 大模型,不知道该从哪学起?这份「AI大模型 学习路线图」直接帮你划重点,不用再盲目摸索!

路线图涵盖 5 大核心板块,从基础到进阶层层递进:一步步带你从入门到进阶,从理论到实战。

L1阶段:启航篇丨极速破界AI新时代

L1阶段:了解大模型的基础知识,以及大模型在各个行业的应用和分析,学习理解大模型的核心原理、关键技术以及大模型应用场景。

L2阶段:攻坚篇丨RAG开发实战工坊

L2阶段:AI大模型RAG应用开发工程,主要学习RAG检索增强生成:包括Naive RAG、Advanced-RAG以及RAG性能评估,还有GraphRAG在内的多个RAG热门项目的分析。

L3阶段:跃迁篇丨Agent智能体架构设计

L3阶段:大模型Agent应用架构进阶实现,主要学习LangChain、 LIamaIndex框架,也会学习到AutoGPT、 MetaGPT等多Agent系统,打造Agent智能体。

L4阶段:精进篇丨模型微调与私有化部署

L4阶段:大模型的微调和私有化部署,更加深入的探讨Transformer架构,学习大模型的微调技术,利用DeepSpeed、Lamam Factory等工具快速进行模型微调,并通过Ollama、vLLM等推理部署框架,实现模型的快速部署。

L5阶段:专题集丨特训篇 【录播课】


四、资料领取:全套内容免费抱走,学 AI 不用再找第二份

不管你是 0 基础想入门 AI 大模型,还是有基础想冲刺大厂、了解行业趋势,这份资料都能满足你!
现在只需按照提示操作,就能免费领取:

👇👇扫码免费领取全部内容👇👇

2025 年想抓住 AI 大模型的风口?别犹豫,这份免费资料就是你的 “起跑线”!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 7:22:51

无需安装!在线体验VMware Workstation 17核心功能

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 构建一个基于Web的VMware Workstation 17功能演示平台,实现以下核心功能的模拟:1.虚拟机创建流程演示 2.快照管理体验 3.网络配置模拟 4.硬件资源分配调整 5…

作者头像 李华
网站建设 2026/5/1 7:10:58

AI如何帮你快速实现IntelliJ IDEA中文插件开发

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个IntelliJ IDEA插件项目,实现中文界面支持功能。要求:1. 自动识别系统语言为中文时加载中文资源文件 2. 提供中英文切换功能 3. 包含常见菜单项和对话…

作者头像 李华
网站建设 2026/4/27 9:45:37

企业级应用连接失败的5个真实案例与解决方案

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个案例展示应用,包含5个真实的企业级Connection Failed错误场景(如微服务通信失败、云数据库连接超时等)。每个案例需展示:1) …

作者头像 李华
网站建设 2026/4/23 12:43:57

Flutter 与开源鸿蒙(OpenHarmony)的融合开发实践

Flutter 与开源鸿蒙(OpenHarmony)的融合开发实践 **作者:L、218 发布平台:CSDN 日期:2025年12月16日 引言 随着国产操作系统的崛起,开源鸿蒙(OpenHarmony)作为华为主导、开放原子开…

作者头像 李华
网站建设 2026/4/30 16:29:18

1小时打造Windows版PDF文本提取工具

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个简单的Windows GUI应用原型,使用Poppler实现以下功能:1) 选择PDF文件;2) 提取指定页面文本;3) 显示提取结果;4) …

作者头像 李华
网站建设 2026/4/30 8:42:50

5分钟构建Node.js环境检测工具原型

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 快速开发一个Node.js环境检测工具原型,核心功能包括:1. 快速环境检测 2. 问题诊断 3. 最小化修复方案 4. 结果反馈。要求使用最简代码实现核心功能&#xff…

作者头像 李华