序　没有神谕的世界

古希腊人出征、婚嫁、建城之前，会先去德尔斐求一次神谕。神谕的意义不在它有多准，而在它承诺了一件事：在你行动之前，存在一个能告诉你答案的地方。两千年后，计算机科学家借走了这个词。在他们那里，神谕（oracle）是一个黑箱，你把一个自己算不出的问题递进去，它当即吐出正确答案。两种神谕共享同一个幻想：在动手之前，先把对错验明。

这本书讲的，是这个幻想破灭之后的世界。

我们几乎从不验证，我们只是行动，然后或迟或早地知道，或者永远不知道。我们以为「凡事可检验」是常态，是因为我们最早的训练来自一类特别狭小的事：算术、给清单排序、核对一张收据。在那些事里，答案触手可及，于是我们误以为整个世界都该如此。可一旦走出这一小块，验证立刻变成奢侈品。你能验证七乘八，你无法在说「我愿意」之前验证这段婚姻会长久，无法在上线之前验证这个代码库没有 bug，无法在投身之前验证一个理论为真、一家公司是健康的、一个决定是对的。大多数重大的行动，都踩在未经验证的地面上。神谕没有回话，而你还是得迈步。

面对这个处境，常见的反应是哀叹或假装。哀叹的人说，既然什么都无法确定，那一切判断都不过是臆断；假装的人则给自己造一个假神谕，把一个测得出的数字供起来，假装它就是那个测不出的真相。这本书两样都不做。它问一个更有意思的问题：那些确实有能力的人，科学家、工程师、数学家、治理者，在神谕缺席时，究竟做了什么？

把这个问题在足够多的领域里追下去，会撞见一个出人意料的观察，它是全书的由来：尽管无法验证的来源天差地别，有能力的人的应对却反复收敛到同一小套。

这就引出本书的两层结构，请先记住，因为后面所有章节都挂在它上面。

第一层，问题是异质的。「我没法检验它」这句话底下，藏着五种结构全然不同的处境：有些原则上就没有判定程序（不可判定 undecidable），有些有程序却代价大到不可能（难解 intractable），有些是相关状态对你隐藏（部分可观测 partially observable），有些是你本可验证却没有那个时间、算力或样本（预算受限 budget-constrained），还有些是对面那个系统在主动挫败你的验证（对抗 adversarial）。把这五种等量齐观，是这个领域最常犯的错。第一部会把它们一一掰开。

第二层，应对却收敛。无论问题是哪一种处境，有能力的主体伸手去够的，反复是同样几样东西：用一个测得出的代理（proxy）替换测不出的真目标，在一个能查的切片上证一个界，把昂贵的查验花在信息量最大处，引进一个外部的判断者，缩小失败的爆炸半径，给残余的风险标定（calibration）一个概率，把检查从事前挪到事后，用多个互相独立的判断去抵消单点的失误。本书把它们归纳为八招，并论证这八招可以收进四根更基本的杠杆。第二部走进四个现场，让这些招数嵌在各自的行话里、交织地出现；第三部再把每一招单独拎出来、整理、命名，铺成一张跨领域的对照表，那是这本书真正的载荷；第四部追问，为什么偏偏是这几招。

有一句话得先撂在前头。这套收敛，究竟是一条定律（某种东西迫使任何有限的主体都必然走到这几招上），还是仅仅一个很强的经验模式（我们一再看到它，却没能证明它非如此不可）？我此刻没有证据说它是定律。这本书交付的，是一个把边界划清了的猜想，外加一套能把许多领域串起来的共同词汇，而不是一条定理。第 14 章会正面讨论这件事。

而这恰恰带来一个无法回避、也不该回避的递归：一本论述「如何在无法验证中行动」的书，自己也无法验证它的核心命题。于是它只能做它通篇所描述的那件事，陈述一个标定的信念，给主张划清边界，邀请你来反驳，然后照样把话说下去。这本书会亲自演练它所讲的那些方法。如果它讲对了，这种自我演练就不是缺陷，而是它唯一站得住的写法。

最后留一个画面，跋会回到它。一艘船在浓雾里改变航向。船长手上有海图、有罗盘、有对洋流的估算，唯独没有一双能看穿雾的眼睛。她无法在转舵之前验证前方是不是暗礁。雾不会散，神谕不会来。可航行不能因此停下。这本书想弄清楚的，不是怎样等到雾散，而是一个好船长在雾里究竟是怎样操舵的。

下一章： 1. 验证的奢侈 →

参考文献

落足点：① 历史上科学家的判断　② 理论上被研究过的东西　③ 科学如何进展　④ 如何在无法验证的世界里生活。本节经网络逐条核实。

H. A. Simon (1969).《The Sciences of the Artificial》. MIT Press. [②④] 西蒙在此区分自然科学与「人造物的科学」，论证设计是一门以有限理性应对复杂环境的学问，并提出近似分解、层级结构与满意化等思路。它为本书的核心立场提供了底色：行动主体并不追求验明一切，而是在算力与信息受限下设计出够用的应对，正对应本节标注的「理论上被研究过的东西」与「如何在无法验证的世界里生活」。
F. H. Knight (1921).《Risk, Uncertainty and Profit》. Houghton Mifflin. [②] 奈特在此划出影响深远的一道界线：「风险」是概率已知、可被度量的不确定，而真正的「不确定」连概率分布都无从给定。他进而把企业利润归因于承担后一类不可度量的不确定。这条区分是本书谈论「不可验证」的概念源头之一，提醒读者把测得出概率的处境与连概率都测不出的处境分开。
N. N. Taleb (2007).《The Black Swan: The Impact of the Highly Improbable》. Random House. [②④] 塔勒布论证，极少数难以预见、影响巨大、事后又被强行解释为可预测的「黑天鹅」事件，主导了历史与市场的走向，而常规的钟形分布统计会系统性地低估它们。本书可读其对预测局限的诊断：当尾部事件无法事先验证时，与其追求精确预报，不如调整自身对意外的暴露方式。
W. C. Wimsatt (2007).《Re-Engineering Philosophy for Limited Beings: Piecewise Approximations to Reality》. Harvard University Press. [②③④] 维姆萨特主张，认知能力有限的存在者不可能掌握完备真理，只能借助偏倚却好用的启发式、稳健性分析与分段近似来逼近实在，而科学正是这样一种逐步生成的工程。这本书几乎是本章主旨的哲学对应物，值得读其对「稳健性」与多重独立路径相互印证的论述，呼应本节标注的三个落足点。
J. M. Keynes (1921).《A Treatise on Probability》. Macmillan. [②] 凯恩斯把概率理解为命题之间的一种逻辑关系，即给定证据下信念的合理程度，并指出许多概率根本无法用数字精确衡量，甚至彼此不可比较。他还引入「证据权重」来刻画证据多寡本身。该书提供了一个早于现代决策论的视角：当证据稀薄时，量化的信心未必成立，正是不可验证处境的题中之义。
L. J. Savage (1954).《The Foundations of Statistics》. Wiley. [②] 萨维奇为主观期望效用奠定公理基础：只要一个人的偏好满足若干一致性公理，他的选择就如同在按某个主观概率最大化期望效用。这是把不确定纳入理性计算的标准框架。该书是理解后续争论的基准：唯有先看清它对一致性的要求，才能看懂埃尔斯伯格等人如何指出真实判断对它的偏离。
D. Ellsberg (1961).「Risk, Ambiguity, and the Savage Axioms」. Quarterly Journal of Economics, 75(4), 643-669. [②] 埃尔斯伯格用著名的摸球实验表明，人们普遍偏好概率已知的赌局而回避概率不明的赌局，这种「模糊厌恶」系统性地违反萨维奇公理，无法用任何单一主观概率来调和。本文是奈特式区分的实验证据，说明连概率本身都不确定时，理性主体的反应不同于面对纯粹风险，对应本节「理论上被研究过的东西」。
H. A. Simon (1955).「A Behavioral Model of Rational Choice」. Quarterly Journal of Economics, 69(1), 99-118. [②④] 西蒙在这篇奠基性论文中提出「有限理性」与「满意化」：受认知与信息限制的主体并不穷举所有选项求最优，而是设定一个抱负水平，找到第一个达标的方案便停手。这是本书反复借用的母题，说明在无法完全验证时，「够好即止」往往是理性的形态而非失败。
H. A. Simon (1947).《Administrative Behavior: A Study of Decision-Making Processes in Administrative Organization》. Macmillan. [②④] 西蒙在此把组织理解为放大个体有限理性的决策结构，论证组织通过设定前提、划分职责与建立惯例，使成员在不完全信息下仍能做出可接受的选择。本书把有限理性从个人推广到机构层面，对应本书第二部对「现场」中应对机制的关注：制度本身就是一种集体的应对装置。
A. Tversky & D. Kahneman (1974).「Judgment under Uncertainty: Heuristics and Biases」. Science, 185(4157), 1124-1131. [②] 特沃斯基与卡尼曼指出，人在不确定下依赖代表性、可得性与锚定等少数启发式来估计概率，这些捷径通常有效，却会导致可预测的系统性偏差。本文开启了「启发式与偏差」研究纲领，是理解人类判断在何处可靠、何处失灵的起点，对应本节「理论上被研究过的东西」。
D. Kahneman & A. Tversky (1979).「Prospect Theory: An Analysis of Decision under Risk」. Econometrica, 47(2), 263-291. [②④] 前景理论用一个相对参照点的价值函数与对概率的非线性加权，刻画真实选择如何偏离期望效用：人们对损失比对等量收益更敏感，并高估小概率、低估中高概率。它是对萨维奇式规范理论的描述性修正，本书可读其对「人实际如何在风险下取舍」的精细刻画。
D. Kahneman (2011).《Thinking, Fast and Slow》. Farrar, Straus and Giroux. [②④] 卡尼曼以「系统一」（快速、直觉）与「系统二」（缓慢、费力）的双过程框架，综述了数十年关于判断偏差与决策的研究。该书是这一研究传统面向读者的总览，适合用来建立对认知局限的整体图景，理解为何即便专家也需要外部纠错机制，呼应本节「如何在无法验证的世界里生活」。
G. Gigerenzer & D. G. Goldstein (1996).「Reasoning the Fast and Frugal Way: Models of Bounded Rationality」. Psychological Review, 103(4), 650-669. [②④] 吉仁泽与戈尔茨坦提出「快速节俭」启发式，论证只用少量线索、按序停止搜索的简单规则，在现实环境中常能逼近甚至超越复杂统计模型的表现。这与卡尼曼传统的「启发式即偏差」形成对照：本书可读其对「简单何以有效」的辩护，理解有限理性也可以是一种生态上的优势。
G. Gigerenzer, P. M. Todd & the ABC Research Group (1999).《Simple Heuristics That Make Us Smart》. Oxford University Press. [②④] 这本论文集系统铺陈「适应性工具箱」的纲领：心智配备一组针对特定环境的简单启发式，其有效性来自与环境结构的契合，即「生态理性」。它把前一篇的单点论证扩展为完整研究计划，本书可读其大量实证案例，看简单规则如何在信息不足时稳健地做出好判断。
F. A. Hayek (1945).「The Use of Knowledge in Society」. American Economic Review, 35(4), 519-530. [②④] 哈耶克论证，社会所需的知识本质上是分散的、与具体时空相关的，无法汇总到任何一个中央计划者手中，而价格机制恰恰是把这些分散信息协调起来的去中心装置。本文重要在于揭示一种不可验证的根源：相关信息从未被任何单一主体完整掌握，对应本书所说的「部分可观测」处境。
M. Polanyi (1958).《Personal Knowledge: Towards a Post-Critical Philosophy》. Routledge & Kegan Paul. [①③④] 波兰尼论证，一切认识都含有不可言传的「默会知识」与认识者的个人投入，纯客观、可完全形式化的知识是一种幻象。该书重要在于解释科学家的判断为何无法被规则完全替代，对应本节三个落足点，呼应本书对专家直觉与亲历判断的关注。
P. E. Meehl (1954).《Clinical versus Statistical Prediction: A Theoretical Analysis and a Review of the Evidence》. University of Minnesota Press. [①④] 米尔综述大量研究后得出一个令专家不安的结论：简单的统计或精算式预测，在准确度上往往不逊于甚至超过临床专家的直觉判断。该书是「把判断外包给可核查的规则」这一招的经典证据，提示读者专家的自信与其实际准确度未必相符，对应本节「历史上科学家的判断」。
D. A. Schön (1983).《The Reflective Practitioner: How Professionals Think in Action》. Basic Books. [①④] 舍恩提出「行动中的反思」，论证专业人士面对独特而模糊的实践情境时，靠的不是套用既定理论，而是在行动中即时地与情境对话、不断重构问题。该书重要在于刻画了一种无法事先验证的专业能力，与米尔的统计预测形成张力，对应本书对实践者如何在雾中操舵的关心。
G. A. Klein (1998).《Sources of Power: How People Make Decisions》. MIT Press. [①④] 克莱因通过对消防员、护士等真实专家的现场研究，提出「识别启动决策」模型：富有经验者在时间压力下并不比较选项，而是凭模式识别直接生成一个可行方案再做心理模拟。该书是自然主义决策的代表作，说明专家直觉在何种条件下可靠，为本书对专业判断的讨论提供经验支撑。
P. E. Tetlock (2005).《Expert Political Judgment: How Good Is It? How Can We Know?》. Princeton University Press. [①④] 泰特洛克历经多年追踪政治与经济专家的预测，发现其平均准确度往往不如简单的外推，且认知风格比专业本身更能解释优劣：思路驳杂、自我怀疑的「狐狸」胜过执守单一大理论的「刺猬」。该书重要在于用可核查的记分把专家判断真正置于检验之下，对应本节「历史上科学家的判断」。
P. E. Tetlock & D. Gardner (2015).《Superforecasting: The Art and Science of Prediction》. Crown. [①④] 本书是泰特洛克预测锦标赛研究的延续，刻画出一类「超级预测者」：他们把大问题拆解、给出可计分的概率、依新证据频繁微调，并以团队互校来提升准确度。它把预测从天赋还原为可习得的实践，正对应本书所倡的事后校准与多重独立判断，呼应本节「如何在无法验证的世界里生活」。
N. N. Taleb (2001).《Fooled by Randomness: The Hidden Role of Chance in Life and in the Markets》. Texere. [②④] 塔勒布论证人们惯于把随机产生的结果误读为技能或必然，尤其在金融市场中把幸存者当成高手，从而低估了运气与噪声的作用。本书可读其对「事后归因」陷阱的剖析，提醒读者在无法验证因果时，成功的事实本身并不证明判断正确。
N. N. Taleb (2012).《Antifragile: Things That Gain from Disorder》. Random House. [④] 塔勒布提出「反脆弱」概念：有些系统不仅能承受波动，还能从无序与冲击中获益，与之相对的是脆弱与仅仅强韧。他主张在无法预测的世界里，应通过保留可选项、限制下行风险来主动从意外中受益。该书直接关联本书所谈的「缩小失败的爆炸半径」，对应本节「如何在无法验证的世界里生活」。
C. E. Lindblom (1959).「The Science of "Muddling Through"」. Public Administration Review, 19(2), 79-88. [④] 林德布洛姆论证现实中的公共政策并非自上而下的理性全局优化，而是「渐进主义」：在现状附近做有限的小幅调整、边走边比较、与已有手段挂钩。本文重要在于把「步步为营、随时纠偏」正名为一种应对复杂的合理策略，对应本书把检查从事前挪到事后、用小步迭代控制风险的思路。
K. R. Popper (1959).《The Logic of Scientific Discovery》. Hutchinson. [③] 波普尔系统提出证伪主义：科学理论无法被经验证实，只能被经验否证，因此可证伪性才是划分科学与非科学的标准。该书是本书主旨的哲学源头之一，正面回应「凡事可验证」的幻想，说明即便是科学也并非靠验证为真，而是靠经得起反驳来前进，对应本节「科学如何进展」。
T. S. Kuhn (1962).《The Structure of Scientific Revolutions》. University of Chicago Press. [①③] 库恩提出，科学并非线性累积，而是在「常规科学」与「科学革命」之间交替：研究在某一范式下解谜，待反常累积到危机，才会发生范式转换。他还指出竞争范式之间存在不可通约性。该书重要在于揭示科学进步中判断与共同体的作用，而非纯粹的逻辑验证，对应本节「历史上科学家的判断」与「科学如何进展」。
W. V. Quine (1951).「Two Dogmas of Empiricism」. The Philosophical Review, 60(1), 20-43. [③] 蒯因攻击逻辑经验主义的两条教条，即分析与综合命题的截然二分，以及每个命题可单独还原为经验。他主张信念以整体方式面对经验法庭，任何陈述都可在调整别处的前提下被保留。本文是「证据不充分决定理论」的经典论证，说明单凭观察无法唯一地裁定理论，对应本节「科学如何进展」。
P. Duhem (1954).《The Aim and Structure of Physical Theory》. Princeton University Press. [③] 迪昂论证物理学的实验从来不是对单一假说的检验，而是对整套理论与辅助假设的检验，因此一个反例无法明确指出错在何处。这就是后来与蒯因并称的「迪昂蒯因论题」的源头。该书重要在于从科学实践内部说明判决性实验的局限，是理解科学为何无法靠单点验证为真的关键，对应本节「科学如何进展」。
I. Hacking (1983).《Representing and Intervening: Introductory Topics in the Philosophy of Natural Science》. Cambridge University Press. [③] 哈金把科学哲学的重心从「表征」即理论与真理，转向「介入」即实验与操作，主张当我们能稳定地操纵某种实体去干预世界时，便有理由相信它实在，这就是著名的实验实在论。该书重要在于提示验证并不只是被动观察，而是动手介入，呼应本书把行动而非验证置于核心的视角，对应本节「科学如何进展」。

← 封面1. 验证的奢侈 →

序 没有神谕的世界

参考文献

用微信扫码打开

序　没有神谕的世界