序 没有神谕的世界
古希腊人出征、婚嫁、建城之前,会先去德尔斐求一次神谕。神谕的意义不在它有多准,而在它承诺了一件事:在你行动之前,存在一个能告诉你答案的地方。两千年后,计算机科学家借走了这个词。在他们那里,神谕(oracle)是一个黑箱,你把一个自己算不出的问题递进去,它当即吐出正确答案。两种神谕共享同一个幻想:在动手之前,先把对错验明。
这本书讲的,是这个幻想破灭之后的世界。
我们几乎从不验证,我们只是行动,然后或迟或早地知道,或者永远不知道。我们以为「凡事可检验」是常态,是因为我们最早的训练来自一类特别狭小的事:算术、给清单排序、核对一张收据。在那些事里,答案触手可及,于是我们误以为整个世界都该如此。可一旦走出这一小块,验证立刻变成奢侈品。你能验证七乘八,你无法在说「我愿意」之前验证这段婚姻会长久,无法在上线之前验证这个代码库没有 bug,无法在投身之前验证一个理论为真、一家公司是健康的、一个决定是对的。大多数重大的行动,都踩在未经验证的地面上。神谕没有回话,而你还是得迈步。
面对这个处境,常见的反应是哀叹或假装。哀叹的人说,既然什么都无法确定,那一切判断都不过是臆断;假装的人则给自己造一个假神谕,把一个测得出的数字供起来,假装它就是那个测不出的真相。这本书两样都不做。它问一个更有意思的问题:那些确实有能力的人,科学家、工程师、数学家、治理者,在神谕缺席时,究竟做了什么?
把这个问题在足够多的领域里追下去,会撞见一个出人意料的观察,它是全书的由来:尽管无法验证的来源天差地别,有能力的人的应对却反复收敛到同一小套。
这就引出本书的两层结构,请先记住,因为后面所有章节都挂在它上面。
第一层,问题是异质的。「我没法检验它」这句话底下,藏着五种结构全然不同的处境:有些原则上就没有判定程序(不可判定 undecidable),有些有程序却代价大到不可能(难解 intractable),有些是相关状态对你隐藏(部分可观测 partially observable),有些是你本可验证却没有那个时间、算力或样本(预算受限 budget-constrained),还有些是对面那个系统在主动挫败你的验证(对抗 adversarial)。把这五种等量齐观,是这个领域最常犯的错。第一部会把它们一一掰开。
第二层,应对却收敛。无论问题是哪一种处境,有能力的主体伸手去够的,反复是同样几样东西:用一个测得出的代理(proxy)替换测不出的真目标,在一个能查的切片上证一个界,把昂贵的查验花在信息量最大处,引进一个外部的判断者,缩小失败的爆炸半径,给残余的风险标定(calibration)一个概率,把检查从事前挪到事后,用多个互相独立的判断去抵消单点的失误。本书把它们归纳为八招,并论证这八招可以收进四根更基本的杠杆。第二部走进四个现场,让这些招数嵌在各自的行话里、交织地出现;第三部再把每一招单独拎出来、整理、命名,铺成一张跨领域的对照表,那是这本书真正的载荷;第四部追问,为什么偏偏是这几招。
有一句话得先撂在前头。这套收敛,究竟是一条定律(某种东西迫使任何有限的主体都必然走到这几招上),还是仅仅一个很强的经验模式(我们一再看到它,却没能证明它非如此不可)?我此刻没有证据说它是定律。这本书交付的,是一个把边界划清了的猜想,外加一套能把许多领域串起来的共同词汇,而不是一条定理。第 14 章会正面讨论这件事。
而这恰恰带来一个无法回避、也不该回避的递归:一本论述「如何在无法验证中行动」的书,自己也无法验证它的核心命题。于是它只能做它通篇所描述的那件事,陈述一个标定的信念,给主张划清边界,邀请你来反驳,然后照样把话说下去。这本书会亲自演练它所讲的那些方法。如果它讲对了,这种自我演练就不是缺陷,而是它唯一站得住的写法。
最后留一个画面,跋会回到它。一艘船在浓雾里改变航向。船长手上有海图、有罗盘、有对洋流的估算,唯独没有一双能看穿雾的眼睛。她无法在转舵之前验证前方是不是暗礁。雾不会散,神谕不会来。可航行不能因此停下。这本书想弄清楚的,不是怎样等到雾散,而是一个好船长在雾里究竟是怎样操舵的。
参考文献
落足点:① 历史上科学家的判断 ② 理论上被研究过的东西 ③ 科学如何进展 ④ 如何在无法验证的世界里生活。本节经网络逐条核实。
- H. A. Simon (1969).《The Sciences of the Artificial》. MIT Press. [②④] 西蒙在此区分自然科学与「人造物的科学」,论证设计是一门以有限理性应对复杂环境的学问,并提出近似分解、层级结构与满意化等思路。它为本书的核心立场提供了底色:行动主体并不追求验明一切,而是在算力与信息受限下设计出够用的应对,正对应本节标注的「理论上被研究过的东西」与「如何在无法验证的世界里生活」。
- F. H. Knight (1921).《Risk, Uncertainty and Profit》. Houghton Mifflin. [②] 奈特在此划出影响深远的一道界线:「风险」是概率已知、可被度量的不确定,而真正的「不确定」连概率分布都无从给定。他进而把企业利润归因于承担后一类不可度量的不确定。这条区分是本书谈论「不可验证」的概念源头之一,提醒读者把测得出概率的处境与连概率都测不出的处境分开。
- N. N. Taleb (2007).《The Black Swan: The Impact of the Highly Improbable》. Random House. [②④] 塔勒布论证,极少数难以预见、影响巨大、事后又被强行解释为可预测的「黑天鹅」事件,主导了历史与市场的走向,而常规的钟形分布统计会系统性地低估它们。本书可读其对预测局限的诊断:当尾部事件无法事先验证时,与其追求精确预报,不如调整自身对意外的暴露方式。
- W. C. Wimsatt (2007).《Re-Engineering Philosophy for Limited Beings: Piecewise Approximations to Reality》. Harvard University Press. [②③④] 维姆萨特主张,认知能力有限的存在者不可能掌握完备真理,只能借助偏倚却好用的启发式、稳健性分析与分段近似来逼近实在,而科学正是这样一种逐步生成的工程。这本书几乎是本章主旨的哲学对应物,值得读其对「稳健性」与多重独立路径相互印证的论述,呼应本节标注的三个落足点。
- J. M. Keynes (1921).《A Treatise on Probability》. Macmillan. [②] 凯恩斯把概率理解为命题之间的一种逻辑关系,即给定证据下信念的合理程度,并指出许多概率根本无法用数字精确衡量,甚至彼此不可比较。他还引入「证据权重」来刻画证据多寡本身。本书提供了一个早于现代决策论的视角:当证据稀薄时,量化的信心未必成立,正是不可验证处境的题中之义。
- L. J. Savage (1954).《The Foundations of Statistics》. Wiley. [②] 萨维奇为主观期望效用奠定公理基础:只要一个人的偏好满足若干一致性公理,他的选择就如同在按某个主观概率最大化期望效用。这是把不确定纳入理性计算的标准框架。本书是理解后续争论的基准:唯有先看清它对一致性的要求,才能看懂埃尔斯伯格等人如何指出真实判断对它的偏离。
- D. Ellsberg (1961).「Risk, Ambiguity, and the Savage Axioms」. Quarterly Journal of Economics, 75(4), 643-669. [②] 埃尔斯伯格用著名的摸球实验表明,人们普遍偏好概率已知的赌局而回避概率不明的赌局,这种「模糊厌恶」系统性地违反萨维奇公理,无法用任何单一主观概率来调和。本文是奈特式区分的实验证据,说明连概率本身都不确定时,理性主体的反应不同于面对纯粹风险,对应本节「理论上被研究过的东西」。
- H. A. Simon (1955).「A Behavioral Model of Rational Choice」. Quarterly Journal of Economics, 69(1), 99-118. [②④] 西蒙在这篇奠基性论文中提出「有限理性」与「满意化」:受认知与信息限制的主体并不穷举所有选项求最优,而是设定一个抱负水平,找到第一个达标的方案便停手。这是本书反复借用的母题,说明在无法完全验证时,「够好即止」往往是理性的形态而非失败。
- H. A. Simon (1947).《Administrative Behavior: A Study of Decision-Making Processes in Administrative Organization》. Macmillan. [②④] 西蒙在此把组织理解为放大个体有限理性的决策结构,论证组织通过设定前提、划分职责与建立惯例,使成员在不完全信息下仍能做出可接受的选择。本书把有限理性从个人推广到机构层面,对应本书第二部对「现场」中应对机制的关注:制度本身就是一种集体的应对装置。
- A. Tversky & D. Kahneman (1974).「Judgment under Uncertainty: Heuristics and Biases」. Science, 185(4157), 1124-1131. [②] 特沃斯基与卡尼曼指出,人在不确定下依赖代表性、可得性与锚定等少数启发式来估计概率,这些捷径通常有效,却会导致可预测的系统性偏差。本文开启了「启发式与偏差」研究纲领,是理解人类判断在何处可靠、何处失灵的起点,对应本节「理论上被研究过的东西」。
- D. Kahneman & A. Tversky (1979).「Prospect Theory: An Analysis of Decision under Risk」. Econometrica, 47(2), 263-291. [②④] 前景理论用一个相对参照点的价值函数与对概率的非线性加权,刻画真实选择如何偏离期望效用:人们对损失比对等量收益更敏感,并高估小概率、低估中高概率。它是对萨维奇式规范理论的描述性修正,本书可读其对「人实际如何在风险下取舍」的精细刻画。
- D. Kahneman (2011).《Thinking, Fast and Slow》. Farrar, Straus and Giroux. [②④] 卡尼曼以「系统一」(快速、直觉)与「系统二」(缓慢、费力)的双过程框架,综述了数十年关于判断偏差与决策的研究。本书是这一研究传统面向读者的总览,适合用来建立对认知局限的整体图景,理解为何即便专家也需要外部纠错机制,呼应本节「如何在无法验证的世界里生活」。
- G. Gigerenzer & D. G. Goldstein (1996).「Reasoning the Fast and Frugal Way: Models of Bounded Rationality」. Psychological Review, 103(4), 650-669. [②④] 吉仁泽与戈尔茨坦提出「快速节俭」启发式,论证只用少量线索、按序停止搜索的简单规则,在现实环境中常能逼近甚至超越复杂统计模型的表现。这与卡尼曼传统的「启发式即偏差」形成对照:本书可读其对「简单何以有效」的辩护,理解有限理性也可以是一种生态上的优势。
- G. Gigerenzer, P. M. Todd & the ABC Research Group (1999).《Simple Heuristics That Make Us Smart》. Oxford University Press. [②④] 这本论文集系统铺陈「适应性工具箱」的纲领:心智配备一组针对特定环境的简单启发式,其有效性来自与环境结构的契合,即「生态理性」。它把前一篇的单点论证扩展为完整研究计划,本书可读其大量实证案例,看简单规则如何在信息不足时稳健地做出好判断。
- F. A. Hayek (1945).「The Use of Knowledge in Society」. American Economic Review, 35(4), 519-530. [②④] 哈耶克论证,社会所需的知识本质上是分散的、与具体时空相关的,无法汇总到任何一个中央计划者手中,而价格机制恰恰是把这些分散信息协调起来的去中心装置。本文重要在于揭示一种不可验证的根源:相关信息从未被任何单一主体完整掌握,对应本书所说的「部分可观测」处境。
- M. Polanyi (1958).《Personal Knowledge: Towards a Post-Critical Philosophy》. Routledge & Kegan Paul. [①③④] 波兰尼论证,一切认识都含有不可言传的「默会知识」与认识者的个人投入,纯客观、可完全形式化的知识是一种幻象。本书重要在于解释科学家的判断为何无法被规则完全替代,对应本节三个落足点,呼应本书对专家直觉与亲历判断的关注。
- P. E. Meehl (1954).《Clinical versus Statistical Prediction: A Theoretical Analysis and a Review of the Evidence》. University of Minnesota Press. [①④] 米尔综述大量研究后得出一个令专家不安的结论:简单的统计或精算式预测,在准确度上往往不逊于甚至超过临床专家的直觉判断。本书是「把判断外包给可核查的规则」这一招的经典证据,提示读者专家的自信与其实际准确度未必相符,对应本节「历史上科学家的判断」。
- D. A. Schön (1983).《The Reflective Practitioner: How Professionals Think in Action》. Basic Books. [①④] 舍恩提出「行动中的反思」,论证专业人士面对独特而模糊的实践情境时,靠的不是套用既定理论,而是在行动中即时地与情境对话、不断重构问题。本书重要在于刻画了一种无法事先验证的专业能力,与米尔的统计预测形成张力,对应本书对实践者如何在雾中操舵的关心。
- G. A. Klein (1998).《Sources of Power: How People Make Decisions》. MIT Press. [①④] 克莱因通过对消防员、护士等真实专家的现场研究,提出「识别启动决策」模型:富有经验者在时间压力下并不比较选项,而是凭模式识别直接生成一个可行方案再做心理模拟。本书是自然主义决策的代表作,说明专家直觉在何种条件下可靠,为本书对专业判断的讨论提供经验支撑。
- P. E. Tetlock (2005).《Expert Political Judgment: How Good Is It? How Can We Know?》. Princeton University Press. [①④] 泰特洛克历经多年追踪政治与经济专家的预测,发现其平均准确度往往不如简单的外推,且认知风格比专业本身更能解释优劣:思路驳杂、自我怀疑的「狐狸」胜过执守单一大理论的「刺猬」。本书重要在于用可核查的记分把专家判断真正置于检验之下,对应本节「历史上科学家的判断」。
- P. E. Tetlock & D. Gardner (2015).《Superforecasting: The Art and Science of Prediction》. Crown. [①④] 本书是泰特洛克预测锦标赛研究的延续,刻画出一类「超级预测者」:他们把大问题拆解、给出可计分的概率、依新证据频繁微调,并以团队互校来提升准确度。它把预测从天赋还原为可习得的实践,正对应本书所倡的事后校准与多重独立判断,呼应本节「如何在无法验证的世界里生活」。
- N. N. Taleb (2001).《Fooled by Randomness: The Hidden Role of Chance in Life and in the Markets》. Texere. [②④] 塔勒布论证人们惯于把随机产生的结果误读为技能或必然,尤其在金融市场中把幸存者当成高手,从而低估了运气与噪声的作用。本书可读其对「事后归因」陷阱的剖析,提醒读者在无法验证因果时,成功的事实本身并不证明判断正确。
- N. N. Taleb (2012).《Antifragile: Things That Gain from Disorder》. Random House. [④] 塔勒布提出「反脆弱」概念:有些系统不仅能承受波动,还能从无序与冲击中获益,与之相对的是脆弱与仅仅强韧。他主张在无法预测的世界里,应通过保留可选项、限制下行风险来主动从意外中受益。本书直接关联本书所谈的「缩小失败的爆炸半径」,对应本节「如何在无法验证的世界里生活」。
- C. E. Lindblom (1959).「The Science of "Muddling Through"」. Public Administration Review, 19(2), 79-88. [④] 林德布洛姆论证现实中的公共政策并非自上而下的理性全局优化,而是「渐进主义」:在现状附近做有限的小幅调整、边走边比较、与已有手段挂钩。本文重要在于把「步步为营、随时纠偏」正名为一种应对复杂的合理策略,对应本书把检查从事前挪到事后、用小步迭代控制风险的思路。
- K. R. Popper (1959).《The Logic of Scientific Discovery》. Hutchinson. [③] 波普尔系统提出证伪主义:科学理论无法被经验证实,只能被经验否证,因此可证伪性才是划分科学与非科学的标准。本书是本书主旨的哲学源头之一,正面回应「凡事可验证」的幻想,说明即便是科学也并非靠验证为真,而是靠经得起反驳来前进,对应本节「科学如何进展」。
- T. S. Kuhn (1962).《The Structure of Scientific Revolutions》. University of Chicago Press. [①③] 库恩提出,科学并非线性累积,而是在「常规科学」与「科学革命」之间交替:研究在某一范式下解谜,待反常累积到危机,才会发生范式转换。他还指出竞争范式之间存在不可通约性。本书重要在于揭示科学进步中判断与共同体的作用,而非纯粹的逻辑验证,对应本节「历史上科学家的判断」与「科学如何进展」。
- W. V. Quine (1951).「Two Dogmas of Empiricism」. The Philosophical Review, 60(1), 20-43. [③] 蒯因攻击逻辑经验主义的两条教条,即分析与综合命题的截然二分,以及每个命题可单独还原为经验。他主张信念以整体方式面对经验法庭,任何陈述都可在调整别处的前提下被保留。本文是「证据不充分决定理论」的经典论证,说明单凭观察无法唯一地裁定理论,对应本节「科学如何进展」。
- P. Duhem (1954).《The Aim and Structure of Physical Theory》. Princeton University Press. [③] 迪昂论证物理学的实验从来不是对单一假说的检验,而是对整套理论与辅助假设的检验,因此一个反例无法明确指出错在何处。这就是后来与蒯因并称的「迪昂蒯因论题」的源头。本书重要在于从科学实践内部说明判决性实验的局限,是理解科学为何无法靠单点验证为真的关键,对应本节「科学如何进展」。
- I. Hacking (1983).《Representing and Intervening: Introductory Topics in the Philosophy of Natural Science》. Cambridge University Press. [③] 哈金把科学哲学的重心从「表征」即理论与真理,转向「介入」即实验与操作,主张当我们能稳定地操纵某种实体去干预世界时,便有理由相信它实在,这就是著名的实验实在论。本书重要在于提示验证并不只是被动观察,而是动手介入,呼应本书把行动而非验证置于核心的视角,对应本节「科学如何进展」。