从大数据,走向内容治理
2015 年,探码科技成立。彼时,大数据风头正劲——结构化数据、指标大屏、实时分析成为主流。我们也曾深陷其中,但很快发现一个普遍问题:企业虽有大平台,却常常缺乏高质量的内容支撑。结构化数据越来越像“面子工程”,而真实世界中,企业 80% 的数据都是非结构化的——方案、手册、话术、培训资料、品牌素材,以及 AI 快速生成的海量内容。
这些,才是员工每天真正打交道的东西。AI 让内容生成成本趋近于零,却也让内容治理的成本急剧上升:谁写的、哪个版本、能否对外、能否被搜索、能否被 AI 正确引用?
于是,我们决定 All in Content。不是追风口做 AI,而是在非结构化内容中找到了长期刚需。Baklib 的使命,是把企业散落各处的内容,变成可管理、可检索、可复用、可对外体验的知识资产——在 AI 时代,这既是给人类看的,也是给机器读的“组织记忆”。
Baklib 是什么?
一句话:AI + 内容云。
我们希望解决企业所有与内容相关的问题——不局限于某类文档或某个部门,而是覆盖内容从生产、治理到分发的全生命周期。
自 2019 年上线至今,Baklib 已迭代至第三个大版本,服务超过800 家企业,其中近一半是软件与 SaaS 公司。它们既有庞大的对外输出,也有复杂的内部知识,与 Baklib 的定位天然契合。
三层架构:资源 · 知识 · 体验
我们将企业内容拆解为三个层级,缺一不可:
资源层
一切文件的归宿。图片、PDF、视频、文档片段——最小单元是一张图、一份文件,带版本、带标签、带权限。IT 和治理角色关心的是:文件在哪、版本对不对、谁有权看。
知识层
内容的编辑与组织。企业 Wiki、产品手册、API 文档、制度规范——Word 级的编辑体验,树形目录,多人协同,版本回溯。内容运营和各部门在这里把信息写清楚、排整齐。
体验层
大多数人真正使用的入口。一个 120 人的组织,可能只有 10 人负责整理内容,剩下 110 人每天都在搜索与消费。消费侧,才是 KPI。门户、帮助中心、Chat 问答、素材库——都是体验的不同面孔。找得到,才是知识库存在的理由。
体验先于管理
国内讲“内容管理”“知识管理”,但我们反复确认:核心不是管理,是体验。
知识不是形式化工程。方案、售前话术、培训课件——这些不是用完即弃的附件,而是企业最耐用的资产。用得越久,沉淀越深;引用越多,价值越大。
当公司的完整产品文档、历史案例、内部规范被结构化地融入上下文,再结合实际需求生成方案——答案一定比直接问通用大模型更准确。
我们卖的不是“又一个管理系统”,而是内容的体验层。
同一份内容,多张脸
内容在知识库里;应用库给它穿一件衣服,就对外了。同一份知识库,可以再穿 Chat 的衣服、门户的衣服、帮助中心的衣服、API 的消费端。
这叫Headless。在企业知识库语境里,它意味着终结“一个库一个死页面”。售前改话术,门户和 Chat 同步更新;产品文档修订,所有出口一起生效。内容不再被锁死在某个静态 URL 里。
多站点发布也是同一逻辑:品牌官网、营销落地页、多语言海外站、内网知识门户——同一套内容源,改一处,多处同步。需要自有域名时,多个站点还可聚合到同一域名下的不同目录,对外完全使用企业品牌。
AI Ready:一半给人,一半给机器
AI 时代的内容,一半给人看,一半的能力是要给 AI 看的。这不是营销词,而是接口事实:
导出 Markdown / JSON
页面 URL 加
.md/.json一键连接 ChatGPT、Claude
MCP 让 Cursor 等 Agent 直接读写知识库指定目录
llms.txt让大模型高效索引
我们把自己的产品文档做成AI Ready——直接问“Baklib 是什么”,模型就能准确介绍。选型路径本身,就是产品能力的最佳佐证。
明文检索 + AI 聚合
在“RAG = 企业知识库标准答案”的舆论场中,我们走了一条反共识的路:坚持明文检索 + AI 聚合。
企业最重要的是安全合规、审计溯源——“你是怎么答的、从哪来的”。明文在库里,人能检索、能看、能追责。RAG 一切片就变黑洞:前半年效果可能特别好,后半年像很聪明的人,你不知道他脑袋在想啥。
我们的AI 智能搜索结合传统关键词与 AI 总结——搜出来不是枯燥列表,而是一句话核心答案。AI 知识库问答支持多轮对话,基于自有业务文档提取人话回复,并标注来源。