架构设计实战指南：在约束中做取舍的工程智慧-编程实验室

架构设计实战指南：在约束中做取舍的工程智慧

版本：V1.0

适合人群：开发工程师、架构师、技术负责人、CTO、技术出身的创业者

写在前面：你是不是也遇到过这些问题？

如果你是开发工程师：

刚写完的代码，业务一改版就要推倒重来，感觉自己像个"代码搬运工"
接手老项目，看代码像看天书，改一个bug引出三个新bug
每次加新功能都要改一堆老代码，最后整个系统变成"不敢碰的屎山"

如果你是技术负责人/架构师：

团队天天在"救火"，没有精力做技术优化
系统越做越复杂，新人上手要三个月，问题排查要一整天
老板问"为什么要用这个技术"，你答不上来，因为当初就是"别人这么用的"

如果你是老板/技术决策者：

技术团队天天说"要重构"，但重构了半年还是老问题
花大价钱上了微服务、中台、云原生，但业务没增长，成本倒增加了
技术团队和业务团队天天吵架，互相觉得对方"不靠谱"

如果你中了两条以上，别担心——这不是你一个人的问题，而是架构思维方式的问题。

这篇文章不跟你讲什么"分布式理论"、“CAP定理”，就用大白话 + 实际案例，帮你搞懂一件事：怎么做架构设计，才能从"被动救火"变成"主动掌控"。

一、先搞明白：架构到底是什么？

1.1 一个生活中的比喻

想象你要建一栋楼：

没有架构思维：来了一个住户说"我要个阳台"，你就加一个阳台；来了一个住户说"我要个地下室"，你就挖一个地下室。最后这栋楼歪歪扭扭，水管电线乱成一团，下雨漏水、停电跳闸。
有架构思维：先想清楚这栋楼住什么人、多少人、需要什么功能，然后设计好承重墙在哪、水管电线怎么走、电梯放哪里。住户再提需求，你在这个框架内满足他。

架构不是"技术选型"，而是"在约束条件下做取舍"。

1.2 架构的核心公式

架构 = 业务目标 + 资源约束 + 复杂度控制

要素	含义	关键问题
业务目标	架构要支撑什么业务	这个系统要解决什么问题？
资源约束	你有多少人力、时间、预算	团队几个人？什么时候上线？服务器预算多少？
复杂度控制	系统不能太复杂	出了问题能不能快速定位？新人能不能快速上手？

最常见的坑：一上来就讨论"用Spring Cloud还是Dubbo"、“上不上K8s”、“要不要搞微服务”——这些是取舍的结果，不是架构的起点。

核心结论：架构的第一原则不是"技术先进"，而是"当前最合适"——在业务目标、资源成本和系统复杂度之间找到平衡。

二、架构师的四个段位：你在哪一层？

做架构设计，能力可以分为四个段位。看看你在哪一层：

第一段位：技术堆砌者（有需求→选技术→写代码）

典型表现：

业务说要"快"→ 上Redis缓存
业务说要"稳"→ 上消息队列
业务说要"扩展"→ 拆微服务
技术栈越来越丰富，系统越来越复杂

问题：你只是在"堆技术"。每个技术单独看都没问题，但组合在一起复杂度爆炸。出了问题，排查链路横跨5个系统、3种语言、7个中间件。

老板的内心OS：“技术挺牛，但业务没增长，成本倒增加了。”

第二段位：模式套用者（见过场景→套方案→解决问题）

典型表现：

见过类似的场景，知道用什么方案
能设计分层架构（Controller→Service→DAO）
知道要做缓存、做限流、做降级
能解决常见的技术问题

进步：你有了一定的经验积累，能独立设计中等规模的系统。

问题：你只能做好你"见过"的场景。遇到新的业务模式，就不知道该怎么设计了。而且容易"拿着锤子找钉子"——因为熟悉某个技术，就强行用它。

老板的内心OS：“常规场景没问题，但新业务能不能hold住？”

第三段位：系统思考者（看业务→做取舍→设计架构）

典型表现：

不是先想"用什么技术"，而是先想"业务需要什么"
知道什么该做、什么不该做（取舍）
能预判系统演进的方向，提前留出扩展点
关注可观测、可降级、易排查，不只是"能跑就行"

进步：你有了系统思维，能在约束条件下做出合理的架构决策。

问题：你的取舍更多靠"经验直觉"，没有形成可复用的思维框架。换个团队、换个业务，可能就不准了。

老板的内心OS：“这个系统架构不错，但你能不能把这个能力复制到其他团队？”

第四段位：架构思维者（抽象规律→建立框架→指导决策）

典型表现：

不管什么业务、什么规模，都能快速找到架构设计的核心矛盾
不是靠"经验"，而是靠"思维框架"
能从具体架构决策中抽象出通用的原则
能指导团队做架构决策，而不是自己包揽

进步：你已经不是靠"经验"做架构，而是靠"思维"做架构。经验会过时（今天流行微服务，明天可能流行Serverless），但思维不会。

老板的内心OS：“这个人带的团队，架构质量就是稳定。”

你的成长路径

堆技术解决问题（第一段位） ↓ 学会看业务 套模式解决场景（第二段位） ↓ 学会做取舍 看约束设计架构（第三段位） ↓ 学会抽象思维 建框架指导决策（第四段位）

关键洞察：从一段位到二段位，靠的是"多看多学"；从二段位到三段位，靠的是"学会取舍"；从三段位到四段位，靠的是"抽象能力"。

越往上走，越不是靠技术广度，而是靠思维深度。

三、架构设计的核心认知：四条铁律

铁律一：架构必须服务业务

这是最重要的一条。很多架构问题不在于技术不够新，而在于过度设计。

一个真实案例：

场景：做一个查询引擎，支持多个数据源的查询路由。
过度设计方案：
用机器学习做智能路由（根据查询特征自动选择最优数据源）
引入服务网格做流量治理
设计动态插件机制，支持运行时加载新的路由策略
结果：开发了3个月，上线后发现——
数据源只有5个，规则路由3行代码就能搞定
机器学习需要训练数据，但根本没有
服务网格增加了排查难度，出了问题没人会看
简单可靠方案（最终选择）：
第一期：规则路由（根据查询类型匹配数据源）
设计原则：稳定、可灰度、可回滚
结果：2周上线，稳定运行6个月后，才根据实际流量特征引入动态路由。

关键原则：

阶段	架构重点	技术选择
0→1（验证期）	快速上线、验证业务	简单可靠、团队熟悉的技术
1→10（成长期）	支撑增长、保证稳定	引入必要的中间件和优化
10→100（成熟期）	提升效率、降低成本	引入智能化、自动化能力

不要在第一阶段做第三阶段的事。

铁律二：复杂度本身就是长期成本

很多架构师只关注"功能能不能实现"，不关注"系统有多复杂"。但复杂度是隐形的长期成本：

复杂度来源	短期影响	长期成本
技术栈过多	开发时要学多种技术	新人上手慢、问题排查难、升级困难
服务拆分过细	每个服务都很小很"干净"	分布式事务、链路追踪、部署复杂
抽象层次过深	代码看起来很"优雅"	理解成本高、改不动、只能加新代码
配置项过多	看起来很"灵活"	配置爆炸、测试覆盖不了、线上出问题

控制复杂度的三个方法：

（1）可观测优先

设计系统时，先想好出了问题怎么排查。
日志怎么打？能不能通过一个traceId串起整个链路？
监控怎么上？核心指标是什么？阈值怎么设？
告警怎么配？不能只有"挂了才告警"，要有"快挂了就告警"

（2）可降级设计

任何依赖都可能挂，先想好挂了怎么办。
缓存挂了→ 能不能直接查数据库？
推荐服务挂了→ 能不能返回默认列表？
第三方API挂了→ 能不能用缓存的旧数据？

（3）易排查设计

出了问题，能不能在30分钟内定位根因？
错误信息有没有上下文？（不只是"NullPointerException"）
关键决策点有没有日志？（“为什么走了A路径而不是B路径”）
数据变更有没有记录？（“这个值什么时候被改的”）

铁律三：重视边界与隔离

不同业务对系统的要求完全不同，必须做好隔离。

一个真实案例：

同样是查询，风控和BI的需求完全不同：
维度风控查询 BI查询
延迟要求 毫秒级（<100ms）秒级/分钟级都可以
并发量 极高（每秒上万）低（几个人同时查）
数据新鲜度 实时 T+1也可以
查询复杂度 简单（查几个字段）复杂（多表JOIN、聚合）
挂了的影响 业务直接停摆报表晚出几个小时
如果把它们放在同一个查询引擎里：
BI的复杂查询会把资源占满，风控查询超时
风控的高并发会把引擎打挂，BI也查不了
出了问题，不知道是风控的问题还是BI的问题

维度	风控查询	BI查询
延迟要求	毫秒级（<100ms）	秒级/分钟级都可以
并发量	极高（每秒上万）	低（几个人同时查）
数据新鲜度	实时	T+1也可以
查询复杂度	简单（查几个字段）	复杂（多表JOIN、聚合）
挂了的影响	业务直接停摆	报表晚出几个小时

隔离的三个层次：

隔离层次	做法	适用场景
资源隔离	不同的服务部署在不同的机器/容器上	不同业务对资源需求差异大
故障隔离	一个服务挂了不影响其他服务（熔断、降级）	服务之间有依赖关系
数据隔离	不同的业务用不同的数据库/表	数据敏感性不同、访问模式不同

关键原则：不要为了"复用"而强行合并。隔离带来的稳定性提升，往往大于复用带来的开发效率提升。

铁律四：架构要能持续演进

业务和流量一直在变，没有一步到位的终极设计。

一个系统的演进路径：

第一阶段（规则路由） ↓ 业务验证成功，数据源增加到20+ 第二阶段（动态模型） ↓ 规则维护成本变高，查询特征多样化 第三阶段（智能调度） ↓ 积累了足够的流量数据 第四阶段（自适应优化）

每个阶段的设计原则：

阶段	业务特征	架构策略	技术选择
第一阶段	业务模式未验证	简单直接、快速迭代	规则引擎、硬编码
第二阶段	业务模式稳定	抽象配置、灵活调整	配置中心、动态路由
第三阶段	规模扩大	自动化、智能化	机器学习、自适应
第四阶段	大规模复杂场景	自优化、自愈	AI驱动、混沌工程

关键原则：架构演进的核心是"在合适的时机做合适的事"。太早做智能化是过度设计，太晚做自动化是效率瓶颈。

四、架构设计实战：先回答四个问题

很多系统做砸了，是因为一上来就画架构图、选技术栈、拆微服务。但在这之前，你必须先回答四个问题：

问题一：这个系统要支撑什么业务？

业务目标决定了架构的方向。

业务目标	架构重点	反例
快速验证商业模式	开发速度优先、架构简单	一上来就搞微服务、服务网格
支撑高并发交易	性能优先、稳定性优先	用复杂但性能差的技术栈
处理海量数据分析	吞吐优先、成本优先	用实时架构做离线分析
多租户SaaS服务	隔离优先、可扩展优先	所有租户共享同一套数据

自我检验：你能不能用一句话，说清楚这个系统的"核心业务指标"是什么？（比如"支撑每秒1万笔订单"、“T+1出全量报表”）

问题二：你的约束条件是什么？

没有约束的架构设计是空中楼阁。

约束类型	关键问题	影响
人力约束	团队几个人？技术水平如何？	决定技术栈的复杂度
时间约束	什么时候必须上线？	决定架构的完整度
预算约束	服务器预算多少？	决定能不能用昂贵的中间件
合规约束	有没有数据合规要求？	决定数据架构的设计

一个真实案例：

场景：做一个数据平台
约束条件：
团队：3个后端 + 1个前端
时间：2个月内必须上线MVP
预算：5台服务器
错误的架构决策：
用K8s做容器编排（团队没人会，运维成本高）
拆10个微服务（3个人维护10个服务，沟通成本爆炸）
用Flink做实时计算（5台服务器跑不动）
正确的架构决策：
单体应用 + 清晰的分层（3个人能维护）
先做T+1离线，实时后续再加（2个月能上线）
用现成的开源组件，不做二次开发（降低风险）

问题三：系统的核心矛盾是什么？

每个系统都有一个"最难受"的地方，这就是核心矛盾。

系统类型	核心矛盾	架构策略
交易系统	高并发 vs 数据一致性	分库分表 + 异步化 + 最终一致性
查询系统	查询复杂度 vs 响应速度	预计算 + 缓存 + 多级索引
数据平台	数据多样性 vs 处理统一性	统一数据模型 + 插件化处理器
SaaS平台	多租户隔离 vs 资源利用率	逻辑隔离 + 资源配额 + 弹性伸缩

找到核心矛盾的方法：

列出系统的所有需求
找出哪些需求是"互相冲突"的
冲突最激烈的那个，就是核心矛盾
架构设计围绕核心矛盾展开，其他需求在解决核心矛盾的前提下满足

问题四：架构怎么演进？

不要设计一个"终极架构"，要设计一个"能演进的架构"。

演进维度	关键问题	设计方法
功能演进	未来会加什么功能？	留出扩展点（插件机制、配置化）
规模演进	数据量/流量增长10倍会怎样？	提前设计分片/分区策略
技术演进	未来可能换什么技术？	抽象接口，隔离变化

关键原则：扩展点不是越多越好。每个扩展点都是复杂度，只在"确定会变化"的地方留扩展点。

五、架构决策实战：怎么做取舍？

5.1 架构取舍的核心框架

架构决策不是"选最好的技术"，而是"在约束条件下做最合适的取舍"。

技术先进性 │ 过度设计 ←──┼── 技术债务 │ 业务适配度 ──────┼────── 资源不足 │ 资源充足

象限	类型	特征	应对方法
过度设计	技术先进但业务不需要	微服务拆分过细、引入了用不上的中间件	做减法，砍掉不需要的
技术债务	业务适配但技术太简单	硬编码、没有监控、不能扩展	制定偿还计划，逐步优化
理想状态	技术先进且业务需要	架构与业务完美匹配	持续监控，及时调整
资源不足	业务需要但资源不够	想做好但人手/时间不够	分阶段实施，先解决核心矛盾

5.2 常见的架构取舍场景

场景一：单体 vs 微服务

维度	单体架构	微服务架构
适用规模	团队<10人，业务模式未验证	团队>20人，业务模式稳定
开发效率	高（代码在一个项目里）	低（服务间调用、版本管理）
部署复杂度	低（一个包搞定）	高（CI/CD、服务发现、配置管理）
扩展性	低（只能整体扩展）	高（可以按服务扩展）
排查难度	低（日志在一个地方）	高（链路横跨多个服务）

取舍原则：

团队<10人 → 单体，别犹豫
团队10-20人 → 模块化单体（代码分层清晰，但部署在一起）
团队>20人 → 微服务（但要先想清楚服务边界）

场景二：同步 vs 异步

维度	同步调用	异步消息
实时性	高（调用完立刻有结果）	低（消息处理有延迟）
可靠性	低（调用方挂了，请求就丢了）	高（消息队列保证不丢）
复杂度	低（代码直观）	高（需要处理消息重复、顺序、失败）
性能	低（调用方要等）	高（调用方不用等）

取舍原则：

用户在前端等着结果 → 同步
后台处理、不急着出结果 → 异步
需要保证不丢 → 异步 + 重试
需要高性能 → 异步 + 批量

场景三：强一致 vs 最终一致

维度	强一致性	最终一致性
用户体验	好（操作完立刻看到结果）	差（可能需要等几秒才能看到）
性能	低（需要锁、分布式事务）	高（不需要等待）
复杂度	高（分布式事务、两阶段提交）	中（需要补偿机制）
适用场景	资金交易、库存扣减	数据同步、通知推送

取舍原则：

涉及钱/库存 → 强一致（或补偿机制）
展示类数据 → 最终一致
能容忍短暂不一致 → 最终一致（性能提升明显）

六、避坑指南：架构设计最常见的6个坑

坑1：为了"技术酷"而做架构

“我们要上K8s！”“我们要搞Service Mesh！”“我们要用Rust重写！”

问题：技术选型基于"哪个技术酷"，而不是"哪个技术合适"。

后果：

团队没人会，招人也难招
运维复杂，出了问题没人能修
业务没增长，成本倒增加了

应对方法：每次引入新技术前，问三个问题：

这个技术解决什么业务问题？
不用这个技术，有没有更简单的解决方案？
团队有没有人能维护这个技术？

坑2：微服务拆得太细

一个10人的团队，拆了15个微服务。

问题：服务拆分过度，沟通成本超过收益。

后果：

一个业务流程横跨8个服务，排查问题要查8个日志
每次发版要协调5个服务，版本管理混乱
分布式事务、服务降级、链路追踪……运维复杂度爆炸

应对方法：

一个服务对应一个明确的业务领域
服务之间的调用不超过3层
团队规模 < 10人 → 不要拆超过3个服务

坑3：只关注" happy path"，不关注异常

架构设计只画了"正常流程"的图：
用户请求 → API网关 → 业务服务 → 数据库 → 返回结果

问题：没有考虑异常场景：

数据库挂了怎么办？
网络超时怎么办？
并发量突然增加10倍怎么办？

后果：上线后一遇到异常就崩，天天在救火。

应对方法：设计架构时，必须回答：

每个依赖挂了，系统能不能降级运行？
每个环节超时，有没有重试/熔断机制？
流量突增，有没有限流/排队机制？

坑4：没有监控和可观测性

系统上线了，但：
不知道系统健不健康（没有监控）
出了问题不知道在哪（没有链路追踪）
用户报障才知道（没有告警）

问题：架构设计只关注"功能"，不关注"可观测"。

后果：

出了问题靠用户反馈，而不是主动发现
排查问题靠"猜"，而不是靠数据
每次出问题都要重启，而不是定位根因

应对方法：架构设计必须包含"可观测性设计"：

日志：统一的日志格式，包含traceId
指标：核心指标的监控和告警（QPS、延迟、错误率）
链路：关键请求的链路追踪

坑5：过度抽象，代码看不懂

为了"优雅"，设计了8层抽象：
Factory → Builder → Strategy → Adapter → Proxy → Decorator → Facade → Controller

问题：抽象层次过深，代码可读性极差。

后果：

新人来了3个月还看不懂代码
改一个功能要穿越8层抽象
最后大家放弃理解，直接加新代码

应对方法：

抽象层次不超过3层
每个抽象必须有明确的复用场景（不是"可能用到"）
代码的首要原则是"可读"，不是"优雅"

坑6：架构设计完就不管了

架构设计文档写完了，评审通过了，然后就没人管了。

问题：架构不是一次性的，需要持续演进。

后果：

业务变了，架构没变，越来越不适应
技术债务越积越多，最后只能重构
架构文档和实际代码完全对不上

应对方法：

每季度做一次架构回顾：当前架构还合适吗？
建立技术债务清单，定期偿还
架构文档和代码同步更新

七、架构师的四项基本功

基本功一：看业务——别先想技术，先想业务

什么是"看业务"？就是做架构设计之前，先搞懂业务要什么。

一个案例：

业务方提需求：“系统太慢了，能不能优化？”
❌ 直接想技术：加缓存、上CDN、改异步……
✅ 先看业务：
哪里慢？→ 只有"月度报表"慢
谁在用？→ 只有财务和老板用，每天不到10次
慢到什么程度？→ 从点击到出结果要30秒
能不能接受？→ 财务说"反正不是实时要的，1分钟也行"
结论：不需要复杂的架构优化，加个"异步生成+消息通知"就行。
用户点击→后台生成→完成后通知用户→用户下载。
开发成本：2天。性能提升：从"30秒卡住"到"随时下载"。

看业务的方法：

步骤	关键问题	方法
理解场景	谁在什么情况下用什么功能？	用户访谈、现场观察
量化需求	QPS多少？延迟要求多少？数据量多大？	数据分析、压测
识别约束	团队几个人？什么时候上线？预算多少？	和老板/PM对齐
找到矛盾	最难受的地方在哪？	列出所有冲突的需求

基本功二：控复杂度——复杂度是隐形成本

什么是"控复杂度"？就是时刻关注系统的复杂度，不让它失控。

复杂度失控的信号：

信号	含义	应对方法
新人上手超过1个月	系统太复杂，理解成本高	简化架构、补充文档
一次发版影响3个以上服务	服务耦合度高	解耦、明确接口
排查问题需要3个以上同事协作	系统不可观测	加强监控、链路追踪
改一个bug引出2个新bug	代码结构混乱	重构、加测试

控制复杂度的原则：

能不用中间件就不用（每个中间件都是复杂度）
能不分服务就不分（每个服务都是运维成本）
能不用新技术就不用（每个新技术都是学习成本）
能简单就不搞复杂（简单=好排查=好维护）

基本功三：做隔离——不同业务不同对待

什么是"做隔离"？就是把不同要求的业务分开，避免互相影响。

隔离的层次：

层次	做法	成本	效果
代码隔离	不同业务用不同的模块/包	低	避免代码耦合
部署隔离	不同业务部署在不同的进程/机器	中	避免资源竞争
数据隔离	不同业务用不同的数据库/表	中	避免数据互相影响
团队隔离	不同业务由不同的团队负责	高	避免协作瓶颈

隔离的原则：

核心业务和非核心业务 → 必须隔离
高并发和低并发 → 必须隔离
敏感数据和非敏感数据 → 必须隔离
两个差不多业务 → 可以合并

基本功四：能演进——架构是长出来的，不是设计出来的

什么是"能演进"？就是架构要能随着业务变化而演进，而不是一次性设计完。

演进的原则：

原则	含义	反例
小步快跑	每次只改一点，验证后再改下一步	一次性重构3个月
向后兼容	新架构要能兼容老数据/老接口	改架构导致老数据全废
可回滚	新架构出问题能回退到老架构	改完发现不行，但回不去了
灰度发布	先让一部分用户用新架构	全量上线，出问题全挂

演进的心法：

好的架构不是"设计"出来的，是"长"出来的。
先做一个能跑的简单架构，然后在运行中发现问题，逐步优化。
每次优化都是"小步"，验证有效再继续。

八、给不同角色的建议

给开发工程师：别只写代码，多想一步

你不需要成为架构师，但理解架构思维对你的工作有帮助：

理解"为什么这样设计"：你知道架构决策的原因，就能写出更符合架构意图的代码
关注"出了问题怎么办"：不只是"功能能跑"，还要想"挂了怎么办、慢了怎么办"
控制"你这块的复杂度"：你写的模块能不能让下一个人快速理解？

建议：

每次写代码前，花10分钟想清楚"这个模块在整个系统中的位置"
每次加功能前，花5分钟想清楚"这个改动会影响什么"
每次修bug后，花3分钟想清楚"怎么避免同类bug再出现"

给技术负责人：别只盯进度，要盯架构质量

你的核心价值不是"把项目做完"，而是"让系统能长期健康运行"。

关注这些指标：

指标	含义	健康值
新人上手时间	新同事多久能独立开发	<2周
问题排查时间	出问题多久能定位根因	<30分钟
发版频率	多久发一次版	每周至少1次
回滚率	发版后需要回滚的比例	<10%
技术债务	已知的技术债务数量	持续减少

建议：

每周花2小时看代码，不只是review，而是理解架构
每月花半天做架构回顾，问"当前架构还合适吗"
每季度花一天做技术规划，想"下个季度要解决什么架构问题"

给老板/技术决策者：怎么判断架构好不好？

不要看这些：

❌ 用了多少新技术
❌ 拆了多少个微服务
❌ 架构图画得多漂亮

要看这些：

✅ 出了问题多久能定位？
✅ 新需求多久能上线？
✅ 新人多久能上手？
✅ 系统挂了能不能降级运行？
✅ 服务器成本在可控范围内吗？

建议：

给技术团队空间做架构优化，不要只盯业务需求
理解"技术债务"的概念，定期安排时间偿还
不要盲目追求"大厂架构"，适合你的才是最好的

九、总结：记住这三句话就够了

第一句：架构的本质是在约束中做取舍

没有"最好的架构"，只有"当前最合适的架构"。

做架构决策时，先想清楚：业务目标是什么？约束条件是什么？核心矛盾是什么？

第二句：复杂度是隐形的长期成本

每个中间件、每个服务、每个抽象层次，都是长期的运维成本。

能简单就不搞复杂——简单=好排查=好维护=好招人。

第三句：好的架构是"长"出来的，不是"设计"出来的

先做一个能跑的简单架构，然后在运行中发现问题，逐步优化。

不要追求"一步到位"，要追求"持续演进"。

附录：架构决策自检清单

每次做架构决策前，过一遍这个清单：

我清楚这个架构要支撑什么业务目标吗？
我考虑了团队规模、时间、预算等约束条件吗？
我找到了系统的核心矛盾吗？
我做了取舍吗？（做了什么、不做什么）
我考虑了异常场景吗？（挂了怎么办、慢了怎么办）
我设计了监控和可观测性吗？
我做了必要的隔离吗？（核心/非核心、高并发/低并发）
架构能持续演进吗？（能加新功能、能扩规模）
新人能看懂这个架构吗？
出了问题能在30分钟内定位吗？

如果超过3个"没有"，说明你需要重新思考。

最后的话：架构没有银弹。一致性vs性能、成本vs稳定、实时vs复杂度……我们每天都在做平衡。说到底，架构师的价值不是"选最牛的技术"，而是"在种种约束中，做出那个对业务最有利的取舍"。