news 2026/5/20 15:19:59

【产品底稿 15】RAG 系统极致降维切割:砍掉重型中间件,三模架构实现 0 依赖盲跑(验证中)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【产品底稿 15】RAG 系统极致降维切割:砍掉重型中间件,三模架构实现 0 依赖盲跑(验证中)

现有完整版 RAG 整体功能完备,但底层深度绑定 MySQL、Redis、Milvus、Ollama 等多款重型中间件,日常开发调试、本地联调、低配环境运行都处处受限,体验与落地性大打折扣。

本地调试搭建环境繁琐耗时,低配设备资源占用过高极易卡顿,项目启动容错率极低,任意一项外部服务、密钥、端口异常,都会直接导致项目启动失败,严重影响开发效率与项目通用性。

本次架构切割核心目标

✅ 搭建 demo / standard / professional 三模运行体系,实现多环境自由切换

✅ 对大模型、向量库等重型组件完成解耦,由强制依赖改为按需加载启用

✅ 实现纯离线零依赖运行,demo 模式脱离所有外部服务,快速启动助力前后端联调

✅ 上层核心业务代码保持原样不动,仅通过底层装配与策略模式完成无感适配


一、核心架构切割设计

1.1 大模型与向量库分层解耦

依托环境配置搭配条件注解,完成重型组件灵活管控。

本地大模型独立拆分加载逻辑,简易环境直接屏蔽加载,减少资源开销;远程大模型去除启动强制校验,离线场景可模拟数据运行;向量库拆分配置层与连接层,保留完整配置规避报错,低负载环境自动平滑降级。

目前代码层面拆分全部完成,正在测试三类模式切换稳定性。

1.2 权限模块精简瘦身

整合项目内繁杂冗余的权限校验逻辑,统一多端校验规则,剔除重复冗余代码。

弱化 Redis 强依赖,改为非强制注入,无缓存场景自动切换本地无状态校验,在精简代码的同时,保障权限流程正常流转。

1.3 数据层启动逻辑优化

针对 MyBatis-Plus 启动强制校验数据源、数据表的硬性问题做出优化。

舍弃多余虚拟数据库依赖,调整连接池初始化规则,关闭启动阶段强制数据校验。

实现项目不受数据库连通状态影响,优先正常启动,数据连接校验延后至实际业务调用阶段,彻底打破启动层面的环境束缚。


二、架构优化优先级

优先级优化项实施方式预期效果
P0多环境模式适配落地三类运行完整逻辑一套项目适配离线调试、日常运行、全功能使用
P0重型组件解耦策略模式 + 条件装配实现组件热插拔削减无效资源占用,大幅缩短项目启动时长
P1权限逻辑优化精简校验代码,完善无缓存降级方案提升断网、轻量化环境下项目运行稳定性
P2架构整体轻量化沉淀精简版 RAG 基础架构适配轻量化业务快速搭建使用

三、迭代坚守原则

  • 只做底层解耦轻量化改造,绝不改动原有核心业务逻辑

  • 专注架构精简优化,不额外堆砌新增业务功能

  • 直面框架原生耦合问题,用架构思路解决痛点,不盲目堆砌组件

  • 一切优化围绕简化开发调试、拓宽项目适配场景为核心


四、技术沉淀价值

完成整套 RAG 架构降维改造,能够吃透 Spring Boot 自动装配、MyBatis-Plus 底层启动机制以及各类 AI 中间件适配逻辑,沉淀出一套通用可复用的轻量化 AI 项目架构模板,后续同类项目可直接复用搭建。

改造完成后项目彻底摆脱繁重环境依赖,日常演示、本地调试无需搭建全套服务,普通设备即可流畅运行,极大降低项目使用门槛,适配更多日常开发与项目试用场景。


五、当前进度与后续规划

目前全量代码架构拆分改造已经结束,正式进入多场景实测验证阶段,逐一排查模式切换各类异常问题,稳定无误后合并至正式分支。

现存难点在于原有业务层与数据底层耦合较深,虽已绕过启动强制校验,部分业务调用依旧存在依赖牵连,后续逐步梳理分层逻辑,完成数据层最后优化闭环。

整体架构切割完毕后,下一步同步推进前端层面适配拆分,完成前后端一体化轻量化改造。整体打磨稳定后,敲定六月正式对外上线推出,打磨成型完整可用的轻量化实用产品。


写在最后

此次底层架构重构,是一次彻底的松绑升级。

深耕开发多年,早已不再盲目堆砌热门技术与各类中间件。真正实用长久的架构,既能承载复杂完整的业务场景,也可剥离所有外部负担,在简易环境中平稳运行,兼具实用性与灵活度。

稳步打磨好底层架构,筑牢项目根基,后续所有布局与推进都会更加顺畅从容。


本文是《产品底稿》系列第 15 篇,记录 RAG 架构轻量化拆分改造思路与实测进度,专注实战落地,沉淀一线架构优化经验。

欢迎留言交流你在架构轻量化中遇到的坑。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/18 13:02:34

FanControl风扇控制软件:告别电脑噪音困扰的终极解决方案

FanControl风扇控制软件:告别电脑噪音困扰的终极解决方案 【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHub_Trending…

作者头像 李华
网站建设 2026/5/18 13:02:24

使用大模型的问题及小trick

1、如何少烧一点token。避免模糊的提问,能多详细就多详细2、丢失上下文问题。场景:比如“我让大模型帮我写了一个番茄钟项目,给了他一个需求说明书,包括两个功能点,一个是番茄钟倒计时,一个是自定义专注时间…

作者头像 李华
网站建设 2026/5/18 13:02:18

HarmonyOS 服务卡片开发之JS 卡片开发

ArkTS 卡片是主流,但还有一种更老的方案——JS 卡片,基于 HML CSS JS 开发,风格跟前端三件套很像。虽然华为推荐用 ArkTS,但一些老项目还在用 JS 卡片,理解它有必要。 今天基于 JSForm 项目,把 JS 卡片的…

作者头像 李华
网站建设 2026/5/18 13:01:06

终极英雄联盟工具箱:5分钟快速上手League Akari的完整指南

终极英雄联盟工具箱:5分钟快速上手League Akari的完整指南 【免费下载链接】League-Toolkit An all-in-one toolkit for LeagueClient. Gathering power 🚀. 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit League Akari是一款基于…

作者头像 李华
网站建设 2026/5/18 13:00:05

高效完成20万字专著,AI写专著工具大揭秘,让写作不再繁琐!

撰写学术专著的挑战与AI工具助力 撰写学术专著时,研究者需要在“深度”和“广度”之间找到合适的均衡点,这成为了很多人面临的障碍。从深度来看,AI写专著需要提出扎实的核心观点,不仅要清晰解释“是什么”,还需深入探…

作者头像 李华
网站建设 2026/5/18 13:00:02

对比按需与Plan套餐Taotoken账单下的成本控制感受

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 对比按需与Plan套餐Taotoken账单下的成本控制感受 在接入大模型API进行开发或业务应用时,成本是团队和个人开发者必须关…

作者头像 李华