大模型 + 规则引擎：构建高可控性的企业级对话系统-编程实验室

大模型 + 规则引擎：构建高可控性的企业级对话系统

引言

在金融、政务、医疗等高风险企业场景中，纯大模型（LLM）的“幻觉”与不可控性是致命短板。“LLM + 规则引擎”架构通过规则层实现输入过滤、流程控制、输出兜底，在保留LLM语义理解能力的同时，赋予系统军工级的确定性与合规性。2026年的核心趋势是**“规则先行，LLM后置”**，将业务红线100%交由规则引擎守护。

技术背景

痛点：LLM在敏感场景下可能泄露隐私、给出违规建议或执行危险操作，且调试困难。
解决方案：引入规则引擎（如Drools）作为**“交警”，负责路由、鉴权、参数校验；LLM仅作为“语义解析器”**在沙箱内运行。
价值：规则引擎提供可视化规则编辑、热更新与审计日志，满足企业IT治理要求。

应用使用场景

银行信贷审批：规则引擎前置校验用户权限与输入格式，LLM仅用于解析用户意图并生成话术，最终审批动作由规则引擎触发。
政务热线：规则层过滤敏感词、识别紧急事件并路由至人工，LLM处理常规政策咨询。
医疗分诊：规则引擎严格限制LLM的诊断范围，禁止跨科室建议，确保合规。

核心架构与原理

原理流程图

核心特性

双保险机制：规则引擎在LLM调用前后各设一道关卡（Pre-LLM Filter & Post-LLM Validator）。
状态可追溯：所有规则触发记录存入审计库，满足合规审计要求。
热切换：业务规则变更无需重启服务，直接更新DRL文件即可生效。

环境准备（Python 3.11+）

# 核心框架pipinstallfastapi uvicorn pydantic redis httpx# Drools规则引擎集成（通过REST调用Kie-Server）pipinstallrequests# LLM集成（以OpenAI为例）pipinstallopenai

场景一：银行信贷对话系统（Drools + LLM）

场景描述

用户咨询贷款额度，系统需先校验用户身份、查询历史记录（规则引擎），再由LLM生成个性化回复，最后校验回复中是否包含违规承诺（规则引擎）。

代码实现

1. 规则定义（Drools DRL）

// rules/loan.drl rule "Check User Authentication" when $input: LoanInput( authenticated == false ) then $input.setBlockReason("用户未认证"); $input.setBlocked(true); end rule "Check Loan Query Frequency" when $input: LoanInput( userId != null, queryCount > 10 ) then $input.setBlockReason("查询频率超限，请稍后再试"); $input.setBlocked(true); end rule "Route to Human if High Risk" when $input: LoanInput( riskLevel == "HIGH" ) then $input.setTargetAction("ROUTE_HUMAN"); end

2. Python核心服务

# bank_loan_bot.pyimportjsonimporthttpxfrompydanticimportBaseModelfromenumimportEnumfromtypingimportOptionalclassLoanInput(BaseModel):userId:strauthenticated:bool=FalsequeryCount:int=0riskLevel:str="LOW"userMessage:strblocked:bool=FalseblockReason:Optional[str]=NonetargetAction:str="CHAT"classRuleEngineClient:def__init__(self,kie_server_url:str,auth:tuple):self.kie_server_url=kie_server_url self.auth=authasyncdefexecute_rules(self,loan_input:LoanInput)->LoanInput:"""调用Drools Kie-Server执行规则"""payload={"loan-input":loan_input.dict()}asyncwithhttpx.AsyncClient()asclient:resp=awaitclient.post(f"{self.kie_server_url}/kserver/rest/server/containers/instances/loan-rules",json=payload,auth=self.auth,headers={"Content-Type":"application/json"})result=resp.json()returnLoanInput(**result["results"][0]["value"])classLLMClient:def__init__(self,api_key:str):self.api_key=api_keyasyncdefgenerate_reply(self,message:str,history:list)->str:"""调用LLM生成回复（模拟）"""# 实际集成OpenAI/Claudereturn"根据您的信用记录，预估额度为5万元。详情请咨询客户经理。"classLoanChatBot:def__init__(self):self.rule_engine=RuleEngineClient("http://drools:8080",("admin","password"))self.llm=LLMClient("your-api-key")asyncdefprocess_message(self,user_id:str,message:str)->dict:# 1. 构建输入事实loan_input=LoanInput(userId=user_id,authenticated=True,# 模拟已认证queryCount=5,# 模拟查询次数userMessage=message)# 2. 前置规则拦截loan_input=awaitself.rule_engine.execute_rules(loan_input)ifloan_input.blocked:return{"reply":f"请求被拦截：{loan_input.blockReason}","action":"BLOCK"}# 3. 路由决策ifloan_input.targetAction=="ROUTE_HUMAN":return{"reply":"正在为您转接人工客服...","action":"HUMAN"}# 4. LLM生成回复reply=awaitself.llm.generate_reply(message,[])# 5. 后置规则校验（检查LLM回复是否合规）if"绝对通过"inreplyor"包下款"inreply:reply="具体情况请以银行审批为准。"return{"reply":reply,"action":"CHAT"}# 测试asyncdefmain():bot=LoanChatBot()result=awaitbot.process_message("u123","我想查询贷款额度")print(result)# 输出: {"reply": "根据您的信用记录...", "action": "CHAT"}

运行结果与测试

# 启动Drools Kie-Server（需提前部署）dockerrun-p8080:8080-eKIE_SERVER_USER=admin-eKIE_SERVER_PASSWORD=password jboss/kie-server:latest# 测试命令curl-XPOST"http://localhost:8000/chat"-H"Content-Type: application/json"-d'{"user_id": "u123", "message": "查询贷款"}'# 输出: {"reply": "根据您的信用记录...", "action": "CHAT"}

场景二：政务热线敏感词过滤（正则规则 + Redis缓存）

场景描述

对用户输入进行实时敏感词扫描，若触发高风险规则则直接转人工，避免LLM处理敏感话题。

代码实现

# gov_hotline.pyimportreimportredisfromtypingimportListclassSensitiveWordFilter:def__init__(self,redis_client:redis.Redis):self.redis=redis_client self.patterns=[(re.compile(r"领导.*电话"),"涉及隐私信息"),(re.compile(r"举报.*贪污"),"涉及敏感举报"),]defscan(self,text:str)->List[str]:"""返回匹配到的违规原因列表"""violations=[]forpattern,reasoninself.patterns:ifpattern.search(text):violations.append(reason)returnviolationsclassGovHotlineBot:def__init__(self):self.redis=redis.Redis(host='localhost',port=6379,decode_responses=True)self.filter=SensitiveWordFilter(self.redis)asyncdefhandle_message(self,user_id:str,text:str)->dict:# 1. 敏感词过滤（规则引擎）violations=self.filter.scan(text)ifviolations:# 记录审计日志self.redis.lpush(f"audit:{user_id}",f"BLOCKED:{text}")return{"reply":"您的问题涉及敏感内容，已转交人工处理。","action":"HUMAN","violations":violations}# 2. LLM处理常规问题reply="根据最新政策，您的情况符合条件。"return{"reply":reply,"action":"CHAT"}# 测试if__name__=="__main__":importasyncio bot=GovHotlineBot()result=asyncio.run(bot.handle_message("u456","我想举报某领导贪污"))print(result)# 输出: {"reply": "您的问题涉及敏感内容...", "action": "HUMAN", "violations": ["涉及敏感举报"]}

场景三：生产级部署（Redis状态管理 + 异步规则链）

场景描述

高并发场景下，使用Redis缓存用户状态，并通过异步任务执行复杂的规则链评估，不阻塞主响应线程。

代码实现

# production_bot.pyimportasyncioimportredis.asyncioasredisfromfastapiimportFastAPI,BackgroundTasks app=FastAPI()redis_client=redis.Redis(host='localhost',port=6379,decode_responses=True)classAsyncRuleEngine:asyncdefevaluate_complex_rules(self,user_id:str,message:str):"""异步执行耗时规则评估（如风控模型）"""awaitasyncio.sleep(0.1)# 模拟复杂规则计算# 实际集成Drools或风控APIreturn{"risk_score":80,"action":"ALLOW"}@app.post("/v2/chat")asyncdefchat_v2(user_id:str,message:str,background_tasks:BackgroundTasks):# 1. 快速前置规则（同步）iflen(message)>1000:return{"reply":"输入过长","action":"BLOCK"}# 2. 异步执行复杂规则（不阻塞响应）background_tasks.add_task(AsyncRuleEngine().evaluate_complex_rules,user_id,message)# 3. 立即返回，LLM异步处理return{"reply":"请求已接收，处理中...","action":"PENDING"}# 规则热更新监听@app.post("/rules/reload")asyncdefreload_rules(rule_version:str):# 从配置中心拉取新规则，更新KieContainerawaitredis_client.publish("rule-update",rule_version)return{"status":"ok"}

疑难解答

规则冲突：Drools规则优先级（salience）设置不当导致误拦。建议使用规则测试平台模拟各种输入，确保规则顺序正确。
性能瓶颈：规则引擎引入额外延迟。解决方案：异步规则评估（非关键规则放后台）、规则结果缓存（相同输入直接复用上次结果）。
LLM绕过规则：Prompt Injection导致LLM忽略系统指令。必须采用输出层规则校验（Post-LLM Validator）作为最后一道防线。

未来展望与技术趋势

规则即代码（Rules as Code）：将法律法规直接编译为可执行的DRL规则，实现政策与代码的同步更新。
AI生成规则：利用LLM分析历史对话日志，自动生成或优化业务规则，减少人工维护成本。
边缘规则引擎：在移动设备或边缘节点部署轻量级规则引擎（如Wasm），实现离线合规控制。

总结

企业级对话系统的核心是**“可控”。“LLM + 规则引擎”** 架构通过**“规则管生死，LLM管体验”** 的分工，完美解决了LLM的不可控难题。2026年的最佳实践是：简单问题由规则引擎直接回复（低成本、高可控），复杂问题由LLM处理（高智能），敏感问题由规则引擎拦截（高安全）。这种架构不仅降低了运维风险，更让企业能够通过可视化规则平台实时调整业务逻辑，真正实现AI的**“可观测、可审计、可管理”**。