从单体到微服务：复杂度的重新分布

2026年3月12日 · 78 字 · 1 分钟

关于微服务的讨论，常常会落入一种过于简单的表述：单体系统复杂、微服务系统简单，因此随着业务增长，系统理应从单体自然演进到微服务。这个判断的问题，不在于它完全错误，而在于它忽略了一个更关键的事实: 微服务通常并不会消除复杂度，它更像是在重写复杂度的分布方式。

单体系统的复杂度往往集中在代码库内部，表现为模块耦合、发布风险、技术栈僵化以及协作冲突。微服务则试图把这些问题拆开，让团队围绕业务能力独立开发、独立部署、独立扩展。但拆分之后，复杂度并没有凭空消失，它只是从进程内调用、单库事务和单代码库协作，转移到了服务边界、网络时序、数据一致性、运行时治理以及组织协同之中。

因此，讨论微服务是否“更好”，本质上不是比较哪种架构更先进，而是在比较哪种复杂度分布方式更适合当前的业务和组织。

单体系统的问题，并不只是代码量大

工程实践里，很多团队把单体的问题概括为“项目太大了”。这当然是表象，但不够准确。单体真正棘手的地方在于，它把不同层次的变化耦合到了同一个交付单元里。

当订单、支付、库存、营销都运行在同一个进程里时，开发者获得了很多天然的便利。函数调用是本地的，事务是一致的，调试路径是短的，日志上下文也更容易串起来。这意味着，单体虽然在代码组织上可能逐渐失控，但它的运行时模型通常更直接、更确定。

问题出在另一个层面: 随着业务和团队增长，不同模块的发布节奏、资源需求和稳定性要求开始分化。某个高频变更的功能模块，会不断裹挟整个系统上线；某个局部热点，会逼迫整个应用一起扩容；某个低质量改动，也可能放大全局回归风险。换句话说，单体的核心矛盾并不是“所有代码放在一起”，而是“所有变化被绑定在一起”。

微服务正是试图解决这个问题。它希望把一个庞大的交付单元拆成多个更小的业务单元，让变化可以局部发生，责任可以局部归属，扩展也可以局部完成。

微服务优化的，不是复杂度总量，而是复杂度位置

很多关于微服务的误解，来自一个默认前提：只要把系统拆细，复杂度就会下降。实际上，系统拆分通常只会让局部变简单，让整体变得更依赖边界设计和治理能力。

在单体里，一个模块调用另一个模块，问题主要是接口设计是否合理、依赖方向是否清晰、事务边界是否稳定。到了微服务里，同样一个调用会立刻附带一组新的问题：超时怎么设，失败是否重试，重试是否幂等，调用链如何追踪，版本如何兼容，数据何时最终一致。

这意味着，微服务并不是把复杂系统切成几块之后让每一块自动变得容易，而是把原本隐藏在进程内部的复杂性暴露出来，并要求团队用显式的工程机制去接住它。对成熟团队来说，这种暴露有价值，因为它让边界更清晰、责任更明确；但对工程基础薄弱的团队来说，这种暴露只会让问题从“代码难懂”变成“系统难以解释”。

复杂度究竟被转移到了哪里

1. 从模块边界转移到服务边界

单体中的模块边界设计错误，通常还可以通过重构逐步修正，成本主要体现在代码调整和回归测试。微服务中的服务边界如果设计错误，代价就会高得多，因为边界一旦固化到 API、数据库、消息契约和团队 ownership 中，修正它就不再只是一次重构，而是一次系统级迁移。

很多失败的微服务实践，并不是因为服务拆得不够细，而是因为服务边界被过早冻结。团队常常按数据库表、按技术分层、按组织汇报线去拆服务，而不是按业务能力和变化方向去拆。结果是，原本在单体里只是模块间耦合的问题，到了微服务里变成了跨服务高频调用、职责反复穿透和 ownership 不清的长期负担。

服务边界本质上不是代码拆分问题，而是业务建模问题。只有当团队真正理解哪些能力应当独立演进、哪些数据应当共同维护时，服务边界才会稳定。

2. 从本地调用转移到网络不确定性

进程内调用失败的概率极低，而网络调用的默认状态则是不确定。请求可能超时、连接可能抖动、对端可能半失败、重试可能引发重复写入，链路上的任何一个组件都可能成为局部故障源。

这类复杂度的麻烦之处在于，它并不总是以“系统宕机”的形式出现，更多时候它表现为灰色故障：部分请求变慢、特定节点异常、偶发幂等问题、峰值时才触发的级联超时。这种问题在单体里相对少见，而在微服务里却是常态。

因此，微服务设计中真正重要的，往往不是接口本身，而是接口失败时系统如何退化。超时、重试、熔断、限流、隔离、降级，这些机制并不是锦上添花的“治理能力”，它们本身就是微服务运行时的一部分。如果团队把这些能力当成后续再补的平台功能，那么复杂度只是被延后支付。

3. 从单库事务转移到分布式一致性

单体架构并不天然优雅，但它有一个极其重要的工程优势：大量业务约束可以借助本地事务和同库查询来完成。这使得“写入成功”的语义相对明确，“回滚”的实现也相对直接。

一旦进入微服务，每个服务独立持有数据之后，很多过去由数据库直接保证的约束，都要转化成应用层协议。订单创建后库存是否一定扣减成功，支付成功后订单状态何时更新，营销补贴失败后是否需要补偿，这些问题不会因为服务拆开而变简单，反而会变成持续存在的系统级议题。

这也是为什么“每个服务一个数据库”听上去像原则，落地时却像起点。真正困难的从来不是把库拆开，而是在拆开之后，如何重新定义一致性、恢复能力和审计能力。没有补偿机制、没有事件回放、没有对账链路的微服务系统，往往只是把原本数据库层面的确定性，替换成了业务层面的模糊性。

4. 从代码协作转移到平台依赖

单体架构下，团队的主要协作对象是代码库；微服务架构下，团队的主要协作对象逐渐变成平台。服务发现、配置中心、链路追踪、日志聚合、发布流水线、灰度能力、权限体系、契约管理，这些基础设施共同构成了微服务的控制面。

这也是许多团队低估的地方。业务服务拆分本身并不难，真正难的是当服务数量上来之后，如何让这些服务在一个可观测、可运维、可回滚、可追责的环境里长期运行。很多团队在微服务初期感觉“拆完很顺”，是因为系统规模还小，很多问题被人的记忆和沟通成本暂时覆盖了。一旦服务数量、研发人数和发布频率同时增长，缺失控制面的代价会以告警噪音、发布事故和定位困难的形式集中爆发。

换句话说，微服务不是单纯的应用架构选择，它同时也是平台工程成熟度的选择。

5. 从团队共享代码转移到团队共享约束

在单体里，协作冲突主要表现为代码冲突、发布冲突和设计分歧。到了微服务里，这些冲突并没有消失，只是变成了更难被察觉的形式：接口契约谁说了算，字段语义何时可以变化，谁负责链路稳定性，谁为跨服务故障负责。

这类问题的本质是，微服务把“共享实现”改成了“共享协议”。共享实现虽然容易耦合，但至少问题暴露得早；共享协议则可能在一段时间内看起来井井有条，直到某个依赖方升级、某个字段含义漂移、某个 SLA 被长期透支，系统才开始显现断裂。

所以，微服务对组织的要求，并不是“每个团队写自己的代码”这么简单，而是“每个团队必须长期维护自己与其他团队之间的契约”。这比管理共享代码更难，因为它需要稳定的 ownership、统一的技术规范和足够强的跨团队治理纪律。

为什么很多团队拆完微服务之后反而更慢了

一个很常见的现象是，系统拆完之后，团队表面上获得了更多独立性，但实际交付速度却下降了。原因通常不是某个技术选型错了，而是团队误判了自己需要承接的复杂度类型。

最常见的误判有三种。

第一，把代码拆分当成架构升级。代码从一个仓库变成多个仓库，不等于边界变清晰；接口从函数签名变成 HTTP 或 RPC，不等于职责变合理。没有业务边界支撑的拆分，只会把单体里的混乱复制成分布式的混乱。

第二，把独立部署理解成纯收益。独立部署确实降低了全量发布频率，但它同时引入了版本兼容、灰度策略、环境漂移和回滚协调等新的运行时问题。如果没有相应的发布工程体系，独立部署只是把“集中风险”改成“持续风险”。

第三，高估团队的治理能力。微服务要求团队不仅会写业务代码，还要能稳定维护服务契约、处理分布式故障、建设观测能力、管理生产变更。很多团队在单体阶段并没有建立起这些基本纪律，却希望通过微服务解决协作问题，最后往往只是把原本在代码层面的混乱，升级成了架构层面的混乱。

这也是为什么一些团队在演进一段时间后，又重新强调模块化单体、领域边界和平台标准化。不是微服务理念错了，而是他们开始意识到，拆分本身从来不是目标，稳定承接拆分后的复杂度才是目标。

微服务真正依赖的是控制面，而不是服务数量

如果一定要总结微服务能否成功的关键，我更倾向于把答案放在控制面而不是业务面。业务服务再多，如果没有控制面承托，它们就只是一些彼此调用的进程；只有当服务发现、配置治理、指标告警、链路追踪、日志检索、身份认证、权限边界、发布回滚等能力形成体系，微服务才真正具备工程意义。

这也是为什么很多公司在微服务成熟之后，组织结构会越来越像“业务研发 + 平台研发 + SRE”三层协作。业务研发负责交付业务能力，平台团队负责收敛共性基础设施，SRE 则负责把系统运行风险变成可管理的工程问题。缺少其中任何一层，微服务都会退化成名义上的服务拆分。

从这个角度看，微服务从来不是一种低门槛架构。它不是团队成长早期用来解决混乱的捷径，反而更像是在工程纪律已经成形之后，用来重新分配复杂度和组织责任的手段。

什么时候微服务是值得的

这并不意味着微服务不值得采用。相反，当系统已经满足一些前提条件时，微服务能够带来非常真实的收益。

例如，不同业务域之间的变更节奏已经明显分化；局部服务的负载特征差异很大；团队 ownership 足够稳定；监控、日志、发布和权限体系已经具备统一基础；组织也愿意为平台工程持续投入。在这种情况下，微服务的价值会非常明确，因为它允许团队围绕业务能力建立更稳定的自治边界。

但如果团队还处在需求高频波动、边界持续变化、基础设施薄弱、线上治理主要依赖人工经验的阶段，那么优先选择模块化单体通常更务实。模块化单体不是“落后的保守策略”，而是很多团队在组织能力尚未成熟之前，更合理的复杂度控制手段。

工程上真正可靠的演进路径，通常不是“单体失败了，所以拆微服务”，而是“先把单体做成边界清晰、模块稳定、发布可控的系统，再把那些确实需要独立演进的部分拆出来”。如果一个团队连单体内部的模块边界都无法稳定维护，那么它大概率也无法长期维护服务边界。

结论

从单体到微服务，并不是从落后走向先进，而是从一种复杂度分布方式，走向另一种复杂度分布方式。单体把复杂度压缩在代码和交付单元内部，因此更拥挤，但也更直接；微服务把复杂度扩散到网络、数据、平台和组织边界，因此更灵活，但也更依赖治理能力。

因此，评价微服务是否适合一个团队，最重要的问题不是“系统够不够大”，而是“团队是否具备承接复杂度转移的能力”。如果答案是否定的，那么微服务不会让系统变简单，它只会让复杂度从看得见的代码问题，转化成更难定位、更难治理的系统问题。

架构设计的成熟，不体现在是否追逐了更流行的模式，而体现在是否选择了当前组织能够稳定承受的复杂度形态。

解决 OpenCode 通过第三方代理使用 GPT 时无法命中 Prompt Cache 的问题 C++ 协程进阶：将 std::future 转换为 asio::awaitable