约翰·奥斯特豪特：实用设计、Tcl 与复杂性的代价

Q: How can a team spot complexity early, before it becomes a crisis?

寻找使推理变贵的信号： - 行为依赖于 隐藏的依赖 （你没意识到重要的列、任务、配置或缓存）。 - “正常路径”由于叠加的 例外 而不明确（“企业客户除外”、“老用户除外”）。 - 为了安全变更需要跨多人/服务的 协调 。 - 文档和注释像警告标签一样（“除非 X 否则不要调用 Y”）。

Q: What’s the difference between essential and accidental complexity?

本质复杂性 来自领域本身（法规、现实世界的边缘情况、核心业务规则），你不能消除它——只能把它建模好。 偶然复杂性 是自我造成的（泄露的抽象、重复逻辑、过多模式/标志、不清晰的 API）。这是团队可以通过设计与简化持续减少的部分。

Q: What is a “deep module,” and why does it matter?

一个 深模块 在内部承担大量工作，同时暴露出一个小且稳定的接口。它把脏活（重试、序列化、顺序、不变量）吸收掉，让调用者无需了解细节。 实用测试：如果大多数调用者不需要知道内部规则就能正确使用模块，它就是深的；如果调用者必须记住规则和顺序，那就是浅的。

Q: How do you recognize a shallow module or leaky abstraction?

常见症状： - 参数和布尔值太多（ 、 、 、 ）。 - 需要特定调用顺序（“先调用 A 再调用 B”），但 API 不强制执行。 - 内部概念泄露到接口（表名、文件路径、缓存键）。 - 小改动向许多调用点蔓延。 浅模块往往看起来“有条理”，但把复杂性推到了每个调用者身上。

Q: What are practical rules for designing APIs that reduce cognitive load?

偏好这样的 API： - 小而一致 ：少量可组合的概念。 - 难以误用 ：边界处有校验、明确不变量、安全的默认值。 - 组合复杂度低 ：避免选项爆炸导致标志相互作用不可预测。 当你想“再加一个选项”时，先问是否能把大多数调用者从这个决策中解放出来。

Q: How should teams manage feature flags so they don’t create permanent complexity?

把功能标志用于受控发布，然后把它们当作债务来管理： - 创建 flag 时附带移除计划（负责人 + 截止日期）。 - 定期清理过时标志，合并重叠的标志。 - 避免在许多地方改变语义的标志——优先在一个边界处做决策。 长期存在的标志会成倍增加工程师需要推理的“系统”数量。

Q: What does it mean to put a “complexity budget” on a roadmap?

在规划中把复杂性显式化，而不是只在代码评审时发现： - 设定规则，比如“无新增概念除非同时移除一个”。 - 对引入新模式、配置或特例的功能收取额外的范围成本。 - 每次发布跟踪简单信号（新增公开端点/选项、添加的配置字段、变更失败率）。 目标是把权衡在复杂性制度化之前摊到桌面上来讨论。

Q: What’s the difference between tactical and strategic programming in practice?

战术编程 为本周优化：快速修补、最小改动、“先上线”。 战略编程 为来年优化：小范围重设计，去除反复出现的错误类别，减少未来工作量。 一个有用的启发式：如果修复需要 调用者知识 （“先调用 X”或“仅在生产设置此标志”），你很可能需要把复杂性藏到模块内部，做更战略性的改变。

Q: What can modern teams learn from Tcl’s “glue language” philosophy?

Tcl 的持久教训是：一组小而一致的原语加上强组合能力的力量——通常作为嵌入式“胶水”层。 现代等价体包括： - 以稳定主原语为基础的插件/扩展系统。 - 用于自动化的脚本或策略层（运维、QA、内部工具）。 - 让核心保持稳定而通过组合灵活的配置语言。 设计目标相同：让核心简单稳定，通过干净的接口来承载变化。

登录开始使用

约翰·奥斯特豪特：实用设计、Tcl 与复杂性的代价 | Koder.ai

为什么 Ousterhout 的观点仍然重要

约翰·奥斯特豪特（John Ousterhout）是一位计算机科学家和工程师，既有研究也有真实系统的实践经验。他创造了 Tcl 编程语言，参与了现代文件系统的设计，并在多年经验基础上提出了一个简单但有点刺耳的断言：复杂性是软件的主要敌人。

这个观点至今仍然适用，因为大多数团队并不是因为缺少功能或努力而失败——他们失败是因为系统（和组织）变得难以理解、难以修改且容易被破坏。复杂性不仅会拖慢工程师速度。它还会渗透到产品决策、路线图信心、客户信任、事故频率，甚至招聘上——因为入职变成了一个需时数月的过程。

核心主题：复杂性对一切征税

Ousterhout 的表述很务实：当系统积累了特例、例外、隐藏依赖和“就这一次”的修补时，代价并不限于代码库。整个产品变得更昂贵以致难以演进。功能需要更久，QA 更难，发布风险更高，团队开始回避改进，因为触碰任何东西都感觉危险。

这不是呼吁学术上的纯粹主义。这是在提醒：每个捷径都有利息支付——而复杂性是利率最高的债务。

本文将从三个视角审视这个想法

为了把想法具体化（而不是仅仅激励人心），我们将从三个角度来看 Ousterhout 的观点：

Tcl 的遗产：Tcl 在简洁、组合性和“胶水”方面做对了什么，以及这些理念为何超越语言本身传播开来。
与 Brooks 的关联："No Silver Bullet" 如何与 Ousterhout 的观点相关，他们何处一致、何处分歧，以及这些分歧对尝试交付的团队有什么启示。
实用设计规则：尤其是“深模块”和降低下一个改动者（通常就是你）认知负担的 API 设计技巧。

你会收获什么

这篇文章不仅写给语言爱好者。如果你构建产品、领导团队或在做路线图权衡，你会找到可操作的方法来及早发现复杂性，阻止它成为制度化，并把简洁作为一项一等约束而非上线后的附加品。

在日常团队中，“复杂性”到底意味着什么

复杂性并不是“代码多”或“数学难”。它是你对系统在改动后会做什么的预期与实际行为之间的差距。当小改动显得冒险——因为你无法预测波及范围时，系统就是复杂的。

复杂性在日常工作的表现

在健康的代码中，你可以回答：“如果我们改了这个，还可能有什么坏掉？”复杂性让这个问题变得昂贵。

它常常藏在：

隐藏的依赖：某个功能悄悄依赖于数据库列、后台任务或配置标志，而这些并不明显。\n- 特例：“企业客户例外”、“2021 年之前注册的用户例外”、“如果请求来自移动端则例外”。这些例外堆叠直到“正常路径”不再清晰。\n- 不明确的归属：没人对某个领域感到负责，于是修复变成谨慎的补丁而不是明确的改进。随着时间推移，最安全的做法变成“再加一个变通方案”。

成本：速度、质量与信心

团队感受到的复杂性表现为发布更慢（更多时间用于调查）、更多 bug（行为令人惊讶）、以及脆弱的系统（改动需要多方和多服务协调）。它也会拖累入职：新人无法建立心智模型，因此会回避触碰核心流程。

必要复杂性与偶然复杂性

有些复杂性是必要的：业务规则、合规要求、现实世界的边缘情况。这些你无法删除。

但很多是偶然的：令人困惑的 API、重复逻辑、变成常设的“临时”标志以及泄露内部细节的模块。这些是设计选择造成的复杂性——也是你可持续地偿还的那种债务。

Tcl 的遗产：流传甚广的好想法

Tcl 的初衷很务实：让自动化软件、扩展已有应用而无需重写变得容易。约翰·奥斯特豪特把它设计为团队可以向工具中添加“恰到好处的可编程性”，并把这种能力交给用户、运维、QA 或任何需要脚本化工作流的人。

“胶水语言”理念

Tcl 推广了胶水语言的概念：一个小而灵活的脚本层，用来连接用更快速、低级语言写成的组件。与其把每个功能都加进单体，不如暴露一组命令，然后把它们组合出新行为。

这一模式之所以有影响，是因为它符合实际工作的方式。人们不仅构建产品；他们还构建构建系统、测试夹具、管理工具、数据转换器和一次性自动化工具。轻量脚本层把“提交工单”变成“写一段脚本”。

Tcl 做对的事（以及传播开的理念）

Tcl 把嵌入解释器当作一等关注点。你可以把解释器嵌入应用、导出一套干净的命令接口，从而立刻获得可配置性和快速迭代能力。

今天相同的模式出现在插件系统、配置语言、扩展 API 和嵌入式脚本运行时中——无论脚本语法是否像 Tcl。

它还强化了一个重要的设计习惯：把稳定的原语（宿主应用的核心能力）与可变的组合（脚本）分开。当运作良好时，工具能更快演进而不会频繁动摇核心。

局限与为什么关注度转移

Tcl 的语法和“万物皆字符串”的模型有时会让人感觉不直观，大型 Tcl 代码库若没有强约定也会变得难以推理。随着生态系统提供更丰富的标准库、更好的工具链和更大的社区，许多团队自然迁移到别处。

但这些并不抹杀 Tcl 的遗产：它让可扩展性与自动化不再是附加项——它们是能显著降低使用和维护系统人员复杂性的产品特性。

隐藏在 Tcl 哲学里的设计教训

Tcl 建立在一个看似严格的理念上：保持核心小巧，使组合强大，并让脚本可读，以便多人协作而不需不断翻译。

鼓励组合的小核心

Tcl 没有提供一大堆专门特性，而是依赖一组紧凑的原语（字符串、命令、简单的求值规则），期望用户组合它们。

这一哲学促使设计者倾向于更少的概念，在多个场景下重用。对产品与 API 设计的教训很直白：如果用两三个一致的构建块能解决十个需求，你就缩小了人们必须学习的面。

“易用”与“易实现”的区别

软件设计的一个陷阱是为构建者的方便而优化。一个特性可能易于实现（复制已有选项、添一个特殊标志、打补丁），但会让产品变得更难用。

Tcl 强调的是相反方向：保持心智模型紧凑，即便实现端需要在后台做更多工作。

在评审一个提案时，问自己：这能减少用户必须记住的概念，还是在加入一个例外？

小原语能带来安慰——也可能是危险的锋利

极简只有在原语一致时才有帮助。如果两个看似类似的命令在边缘行为上不一样，用户就会记住琐碎规则。一组小工具在规则微妙变化时会变成“锋利边缘”。

可组合性 vs 一次性特性（非技术层面）

把它想成厨房：一把好刀、一口平底锅和一台烤箱可以通过组合技术做出很多菜。一个只切牛油果的工具是一次性特性——容易卖，但会让抽屉凌乱。

Tcl 的哲学主张选择刀和锅：可组合的通用工具，而不是为每道菜都准备新小玩意。

用一页话读懂 Brooks："No Silver Bullet" 的主张

1986 年，弗雷德·布鲁克斯写了一篇文章，结论故意挑衅：没有单一突破——没有“银弹”——能在一跃之间让软件开发快一个数量级、便宜或更可靠。

他的观点并不是进步不可能，而是软件作为一种媒介几乎能做任何事，而这种自由带来了独特的负担：我们在构建的同时不断定义这个事物。更好的工具能帮忙，但它们不会抹去最难的部分。

必要复杂性与偶然复杂性的划分

布鲁克斯把复杂性分成两类：

必要复杂性：来自问题本身的难度——现实世界规则、边缘情况和相互冲突的目标。\n- 偶然复杂性：由我们的方法和工具创造的难度——笨拙的语言、糟糕的构建流水线、手工部署或迫使你同时考虑过多细节的架构。

工具可以压碎偶然复杂性。想想高级语言、版本控制、CI、容器、托管数据库和优秀 IDE 带来的收获。但布鲁克斯认为必要复杂性占主导地位，而它不会因为工具改进就消失。

为什么这仍然重要

即便有现代平台，团队仍把大部分精力花在协商需求、整合系统、处理例外并保持行为一致上。表面可能变化（云 API 取代设备驱动），但核心挑战仍在：把人类需求翻译成精确且可维护的行为。

这就形成了 Ousterhout 倾向的张力：如果必要复杂性无法被消除，是否通过严谨的设计可以显著减少其“泄露”到代码中——以及每天泄露到开发者头脑中的程度？

“Ousterhout vs Brooks” 的争论（去除火药味）

掌控实现细节

当准备深入时，通过导出源代码保留所有权。

导出代码

人们有时把“奥斯特豪特 vs 布鲁克斯”看作乐观与现实的对立。更有用的方式是把它当成两位有经验的工程师在描述同一问题的不同部分。

Ousterhout 的反驳：设计比你想象的更有价值

布鲁克斯说没有银弹，Ousterhout 并不是真的反对这一点。

他的反驳更狭窄也更务实：团队常把复杂性视为必然，而很多复杂性其实是自招的。

在 Ousterhout 看来，良好的设计可以显著减少复杂性——不是让软件“变简单”，而是让它改动时不那么令人困惑。这是一个重要的主张，因为困惑会把日常工作变成缓慢的工作。

Brooks 的提醒：有些复杂性是内建的

布鲁克斯强调必要难度：软件必须建模混乱的现实、不断变化的需求和存在于代码之外的边缘情况。即便有优秀的工具和聪明的人，你也无法删除这些复杂性——你只能管理它们。

他们实际上的共识

二者的重叠比争论显得的更多：

世界本身复杂，有些复杂性无法避免。\n- 很多痛苦来自偶然复杂性——不必要的细节和例外。\n- 真正的代价在后期显现：迭代变慢、风险上升、出现“别碰它”的区域。

团队的实用问题

与其问“谁对”，不如问：本季度我们能控制哪些复杂性？

团队无法控制市场变化或领域的核心难度。但他们可以控制新功能是否引入特例、API 是否强迫调用方记住隐藏规则，以及模块是否隐藏复杂性或把它泄露出去。

这是可操作的中间地带：接受必要复杂性，并对偶然复杂性进行无情筛选。

深模块：以正确的方式隐藏复杂性

深模块是能做很多事同时只暴露少量、易于理解接口的组件。模块的“深度”即其承担的复杂性：调用者不需要知道混乱细节，接口也不会把这些强加给他们。

浅模块则相反：它可能封装少量逻辑，但把复杂性向外推——通过大量参数、特殊标志、必需的调用顺序或“你必须记住……”的规则。

深与浅：现实类比

想象一家餐厅。深模块是厨房：你从简单菜单点“意面”，不关心供应商选择、煮面时间或装盘。

浅模块是一个把原材料和 12 步说明交给你的“厨房”，还要你自备锅具。工作仍然完成——但移到了客户那边。

何时增加层次有益（何时有害）

增加层次有益当它把许多决策折叠成一个明显的选择。

例如，暴露 save(order) 的存储层并在内部处理重试、序列化和索引就是深的。

层次有害当它主要是在重命名或增加选项。如果新抽象引入的配置比它移除的还多——比如 save(order, format, retries, timeout, mode, legacyMode)——它很可能是浅的。代码看起来“有组织”，但认知负担出现在每个调用点。

快速清单：如何识别浅模块

API 有很多参数，尤其是布尔值如 useCache、skipValidation、force、legacy。\n- 调用者必须遵循特定顺序（“先 A 后 B”）以避免微妙的 bug。\n- 模块把内部概念（文件路径、表名、线程规则）泄露到接口里。\n- 大多数更改需要触及许多调用点，因为抽象没有稳定行为。\n- 文档读起来像警告标签而不是承诺（“当 Y 时别用 X，除非 Z”）。

深模块不仅仅是“封装代码”。它们封装决策。

降低认知负担的 API 设计

追求深度模块

定义小而清晰的接口，然后让 Koder.ai 处理其后的复杂细节。

开始项目

“好”的 API 不仅能做很多事，更重要的是它能被人类在工作时掌握。

Ousterhout 的设计视角促使你根据 API 要求的心理努力来评判它：你必须记住多少规则、预测多少例外、以及多容易犯错。

什么样的 API 更适合人

对人友好的 API 往往是小、始终如一且难以误用的。

“小”并不意味着无能——它意味着表面面积集中在少数可组合的概念上。始终如一意味着相同模式在整个系统中适用（参数、错误处理、命名、返回类型）。难以误用意味着 API 引导你走向安全路径：清晰的不变量、边界校验以及早期失败的类型或运行时检查。

为什么“更多选项”会提高所有人的成本

每多一个标志、模式或“以防万一”的配置都会成为所有用户的税。即使只有 5% 的调用者需要它，100% 的调用者现在也必须知道它存在、怀疑是否需要它，并在它与其他选项交互时解释行为。

这就是 API 通过组合爆炸积累隐藏复杂性的方式：不是在单次调用里，而是在组合学上。

默认值、约定与命名

默认值是一种善意：它们让大多数调用者可以省略决策仍能得到合理行为。约定（一个明显的做法）减少用户心中的分叉。命名也在做实事：选择与用户意图相符的动词和名词，并保持相似操作命名的一致性。

再提醒一点：内部 API 与公共 API 同等重要。产品的大部分复杂性存在于幕后——服务边界、共享库和“帮助”模块。把这些接口当作产品来对待，进行评审与版本管理（另见 /blog/deep-modules）。

复杂性如何悄悄渗入：战术修复与特例

复杂性很少以一次“坏决策”出现。它通过小而合理的补丁逐步积累——尤其是团队在期限压力下，短期目标是上线时。

常见陷阱会悄然复合

一个陷阱是到处都是功能标志。标志对于安全发布有用，但当它们滞留时，每个标志都会乘以可能行为的数量。工程师不再推理“系统”，而是推理“系统，在标志 A 打开且用户属于分段 B 的情况下除外”。

另一个是特例逻辑：“企业客户需要 X”、“除非在 Y 区域”、“除非账户超过 90 天”。这些例外常会散布到代码库中，几个月后没人知道哪些仍然必要。

第三是泄露的抽象。一个强迫调用者理解内部细节（时序、存储格式、缓存规则）的 API，会把复杂性推向外部。结果不是一个模块承担负担，而是每个调用者都学会这些古怪规则。

战术编程 vs 战略编程（通俗版）

战术编程为本周优化：快速修复、最小改动、“先打补丁”。

战略编程为来年优化：小幅重设计以防止同类错误，减少将来工作。

危险在于“维护利息”。一个看似便宜的临时方案会用利息偿还：更慢的入职、脆弱的发布、以及因惧怕触碰旧代码而产生的恐惧型开发。

真正有用的轻量护栏

在代码评审中加入轻量提示：“这是不是引入了新的特例？”“API 能否隐藏这一细节？”“我们会留下什么复杂性？”

对非琐碎权衡保留短小的决策记录（几条要点即可）。并在每个 sprint 中保留一个小的重构预算，这样战略性修复就不会被视为课外工作。

为何复杂性会杀死产品，而不仅仅是代码库

复杂性不会困在工程内部。它渗透到进度、可靠性和客户体验中。

产品层面的成本：速度、稳定性与入职

当系统难以理解时，每次改动都需要更久。上市时间延后，因为每次发布需要更多协调、更多回归测试和更多“以防万一”的审查周期。

可靠性也会受损。复杂系统会产生无人能完全预测的相互作用，bug 会以边缘案例出现：只有当优惠券、已保存购物车和某地区税率在特定组合下才会导致结账失败。这类事件最难复现、修复最慢。

入职成为隐性拖累。新人无法建立有用的心智模型，于是回避高风险区域，拷贝他们不理解的模式，且无意中加入更多复杂性。

复杂性表现为客户的困惑

客户不在意某个行为是否由代码里的“特例”导致。他们体验到的是不一致：设置并非处处生效、流程取决于你的到达路径、功能“大多数时候”可用。

信任下降，流失率上升，采用停滞。

支持与运营承担的复杂性税

支持团队通过更长的工单和更多的来回交流为复杂性买单。运营通过更多告警、更多运行手册和更小心的部署支付代价。每个例外都需要监控、记录与解释。

一个实用示例：再加一个功能 vs 简化流程

假设有人请求“再加一个通知规则”。添加它看上去很快，但它引入了行为分支、更多的 UI 文案、更多测试用例，以及更多用户误配置的方式。

再把它和简化现有通知流程比较：更少的规则类型、清晰的默认值、以及跨 Web 与移动的一致行为。你可能上线更少的旋钮，但你减少了惊喜——使产品更易用、更易支持、更快进化。

把复杂性作为一等产品约束来管理

分享真实感演示

与利益相关者分享时，用自定义域名把原型呈现得像真实产品。

添加域名

把复杂性像性能或安全那样计划、衡量并保护。如果你只在交付变慢时才注意到复杂性，那你已经在付利息了。

在路线图上放一个“复杂性预算”

在功能范围之外，定义一个发布可以引入的新复杂性的量。预算可以很简单：“不引入净新增概念，除非我们移除一个”，或“任何新集成都必须替代旧路径”。

在规划时把权衡显式化：如果某个功能需要三个新配置模式和两个例外情况，那它应该比适配现有概念的功能“花费”更多预算。

使用团队能维持的轻量指标

你不需要完美的数据——只要有朝正确方向的信号：

模块表面面积：公共方法/端点、标志或配置字段数量。\n- 概念计数：用户（或新工程师）为成功需要学会多少概念。\n- 变更失败率：部署或发布需要回滚、热修复或紧急后续工作的频率。

按发布跟踪这些指标，并把它们与决策联系起来：“我们新增了两个公共选项；我们移除了或简化了什么来补偿？”

用原型来测试简洁性，而不仅仅是可行性

原型通常以“能否构建？”来评判。相反，请用它们来回答：“这是否感觉易用且难以误用？”

让不熟悉该功能的人用原型完成真实任务。衡量成功所需时间、提出的问题和他们犯的错误假设。这些都是复杂性热点。

这也是现代构建流程可以减少偶然复杂性的地方——前提是它们保持快速迭代并易于回滚。例如，当团队使用像 Koder.ai 这样的平台通过聊天草拟内部工具或新流程时，诸如 planning mode（在生成前澄清意图）和 snapshots/rollback（快速撤销风险性改动）等功能能让早期试验更安全——而无需提交一堆半成品抽象。如果原型通过评审，你仍可导出源代码并应用上文描述的“深模块”和 API 纪律。

安排复杂性清理并设定明确完成标准

把“复杂性清理”工作定期化（每季度或每次大版本），并定义“完成”意味着什么：

移除一个选项或特例（不仅仅是重构）。\n- 减少入职步骤或必需配置。\n- 把两个重叠的 API 合并为一个。\n- 改善特定区域的变更失败率。

目标不是抽象意义上的更干净代码，而是更少的概念、更少的例外和更安全的变更。

本季度团队的实用要点

下面是把 Ousterhout 的“复杂性是敌人”理念转化为每周团队习惯的几条举措。

5–7 条精炼要点

把复杂性当作成本中心：如果它不带来用户价值，就需要预算审批。\n- 偏好更少但更深的模块，而不是许多泄露细节的薄层。\n- 追求自解释的接口：好名字、小表面、明确不变量。\n- 不要“就加一个选项”。选项会成倍增加交互；特例会随时间复合。\n- 如果修复需要额外的调用者知识，你很可能把复杂性往外移了。\n- 把删除当作成功指标：移除代码和特例往往是杠杆最高的设计工作。

一个短期（1–2 周）的行动计划

挑一个经常造成困惑的子系统（入职痛点、重复 bug、频繁的“这如何工作？”问题）。

映射接口：列出公共函数/端点/配置标志以及调用者必须知道的内容。\n2. 简化契约：合并参数，移除“模式”标志，写下模块保证的 2–3 条不变量。\n3. 删除特例：移除为单个客户、单个环境或历史 bug 添加的分支——改用通用规则。\n4. 加一个轻量门槛：新标志和例外需要简短的设计说明和一位审阅者提出“我们能避免特例吗？”的质问。

延伸阅读与后续

约翰·奥斯特豪特，《软件设计的哲学》\n- 弗雷德·布鲁克斯，“No Silver Bullet”\n- 弗雷德·布鲁克斯，《人月神话》（特别是关于概念完整性的讨论）

你可以在内部运行的后续：在规划中做一次“复杂性审查”（/blog/complexity-review）以及快速检查你的工具链是在减少偶然复杂性还是在增加抽象层（/pricing）。

如果本周你只能删除一个特例，你会先移除哪一条复杂性？

常见问题

What does “complexity” mean in everyday software work?

复杂性是你对系统在修改后会发生什么的“预期”与实际行为之间的差距。

当小改动看起来很冒险、因为你无法预测波及范围（测试、服务、配置、客户或可能被破坏的边缘情况）时，你就能感受到复杂性。

How can a team spot complexity early, before it becomes a crisis?

寻找使推理变贵的信号：

行为依赖于隐藏的依赖（你没意识到重要的列、任务、配置或缓存）。
“正常路径”由于叠加的例外而不明确（“企业客户除外”、“老用户除外”）。
为了安全变更需要跨多人/服务的协调。
文档和注释像警告标签一样（“除非 X 否则不要调用 Y”）。

What’s the difference between essential and accidental complexity?

本质复杂性来自领域本身（法规、现实世界的边缘情况、核心业务规则），你不能消除它——只能把它建模好。

偶然复杂性是自我造成的（泄露的抽象、重复逻辑、过多模式/标志、不清晰的 API）。这是团队可以通过设计与简化持续减少的部分。

What is a “deep module,” and why does it matter?

一个深模块在内部承担大量工作，同时暴露出一个小且稳定的接口。它把脏活（重试、序列化、顺序、不变量）吸收掉，让调用者无需了解细节。

实用测试：如果大多数调用者不需要知道内部规则就能正确使用模块，它就是深的；如果调用者必须记住规则和顺序，那就是浅的。

How do you recognize a shallow module or leaky abstraction?

常见症状：

参数和布尔值太多（legacy、skipValidation、force、mode）。
需要特定调用顺序（“先调用 A 再调用 B”），但 API 不强制执行。
内部概念泄露到接口（表名、文件路径、缓存键）。
小改动向许多调用点蔓延。

浅模块往往看起来“有条理”，但把复杂性推到了每个调用者身上。

What are practical rules for designing APIs that reduce cognitive load?

偏好这样的 API：

小而一致：少量可组合的概念。
难以误用：边界处有校验、明确不变量、安全的默认值。
组合复杂度低：避免选项爆炸导致标志相互作用不可预测。

当你想“再加一个选项”时，先问是否能把大多数调用者从这个决策中解放出来。

How should teams manage feature flags so they don’t create permanent complexity?

把功能标志用于受控发布，然后把它们当作债务来管理：

创建 flag 时附带移除计划（负责人 + 截止日期）。
定期清理过时标志，合并重叠的标志。
避免在许多地方改变语义的标志——优先在一个边界处做决策。

长期存在的标志会成倍增加工程师需要推理的“系统”数量。

What does it mean to put a “complexity budget” on a roadmap?

在规划中把复杂性显式化，而不是只在代码评审时发现：

设定规则，比如“无新增概念除非同时移除一个”。
对引入新模式、配置或特例的功能收取额外的范围成本。
每次发布跟踪简单信号（新增公开端点/选项、添加的配置字段、变更失败率）。

目标是把权衡在复杂性制度化之前摊到桌面上来讨论。

What’s the difference between tactical and strategic programming in practice?

战术编程为本周优化：快速修补、最小改动、“先上线”。

战略编程为来年优化：小范围重设计，去除反复出现的错误类别，减少未来工作量。

一个有用的启发式：如果修复需要调用者知识（“先调用 X”或“仅在生产设置此标志”），你很可能需要把复杂性藏到模块内部，做更战略性的改变。

What can modern teams learn from Tcl’s “glue language” philosophy?

Tcl 的持久教训是：一组小而一致的原语加上强组合能力的力量——通常作为嵌入式“胶水”层。

现代等价体包括：

以稳定主原语为基础的插件/扩展系统。
用于自动化的脚本或策略层（运维、QA、内部工具）。
让核心保持稳定而通过组合灵活的配置语言。

设计目标相同：让核心简单稳定，通过干净的接口来承载变化。