科学是什么？

科学是什么？#

无论做多少次次实验都不能证明我是对的，但只要一次实验就能证明我是错误的。

—爱因斯坦

首先，我们先以一个现实之例为楔子，思索一下什么是科学。

美国麦克莱恩反对阿肯色案（进化论V.S. 创世论）#

1981年3月，美国阿肯色州通过了一项“590法案”，也称为“平衡法案”（平衡对待创世论与进化论），此法案使“创世科学”在教科书中与进化论具有同等地位。

创世论的基本主张如下：宇宙、太阳系和生命是突然创造的；现在的动物和植物从创世以来就始终存在；人和猿各有其自己的祖先；大规模突发灾难（例如大洪水）可以被用来解释地球的地质特征，而这种地质特征是所有科学假设的最有力的科学证据。很显然，这些主张本质上是源于《圣经》中的《创世纪》部分。

同年5月，为了推翻“590法案”，美国公民自由联合会(ALCU)以小石城牧师麦克莱恩的名义提出诉讼，并且当地5个教派的负责人也充当了联合原告。原告方认为，“590法案”支持和偏袒了某一宗教派别，违反了联邦宪法第一修正案中“政教分离（国家与宗教相分离）”的有关条款。而被告方认为“创世科学”并不是宗教，而是与“进化科学”一样，也是关于世界起源问题的科学模型。这便是“麦克莱恩反对阿肯色案”(McLean v. Arkansa )。

此案争论的焦点在于“创世科学”是科学还是宗教？这便涉及了什么是科学的问题：一种主张什么时候是科学？以及，如何区分科学、伪科学和非科学？

此案的法官奥弗顿概括了一些用于判定“创世科学”是否能够作为科学的标准，认为科学理论应具有如下特征：

• 遵循自然规律；

• 有根据自然规律解释现象的能力；

• 在经验世界里是可检验的；

• 它的结论是暂时性的，即不必是最终的结论；

• 它是可证伪的。

基于此，奥弗顿认为创世科学并不是真正的科学，因为它包含了超自然主义的东西，以及一些靠经验数据无法验证的理论；它主要以《创世记》为基础，其目的是宗教而非世俗。于是，第一个“平衡法案”被联邦法院推翻。

科学的含义#

https://tingwen-pic.oss-cn-beijing.aliyuncs.com/img/image-20210830232414704.png — Fig. 3 科学研究的尺度图片来源：互联网#

广义而言，科学可以划分为经验科学和非经验科学（也称为形式科学）。故名思意，经验科学与现实世界相关，依赖于经验证据，旨在揭示、描述、解释和预言世界的种种事件。经验科学的目的是发现各种规律，且规律应具有唯一性，同样的条件会出现同样的现象。非经验科学与经验的发现实质上是无关的，如，逻辑学和纯数学。狭义而言，科学特指经验科学。在此，我们所讲的科学为经验科学。

我们将科学定义为经过加工的知识。「知识」与现实相关，是关于世界的本来面目和基本规律，有助于增进对世界的认识。并且，科学知识是通过特定的方法——科学方法——获得的，这说明科学有一套寻找事实和解释或者推理（分析）的专门技巧。如“Science is actually a process used to solve problems or develop an understanding of natural events that involves testing possible events” ([], check page)。

可见，科学关注的是实证（Positive）分析，研究「是什么」和「为什么」。说经济学是科学的潜台词便是经济学是实证经济学。科学可以做描述和解释，但并不能告诉我们应该怎么做。科学本无善恶，如何使用，用于何处皆是人们的选择，与科学本身并无关联。在现实生活中，经常存在对科学含义的误用，比如，文章结构是科学的，或课程安排具有科学性，这里，科学可以理解为“好”或“合理”的意思，而非“科学”本身之意（[]）。

科学

Research is a type of systematic investigation that is empirical in nature and is designed to contribute to public knowledge.

现代科学的研究方法#

现代科学的研究方法为假说-演绎法（Hypohetico-Predictive Approach），可以简单划分为以下四个步骤：

（1）观察现实世界，提出具体的问题（这里将问题限定为因果关系的问题）

（2）针对（1）中的问题，提出解释性假说，即对问题的解释。

（3）对（2）中的假说做出推断并进行相应的实验或检验。

（4）得到实验或检验结果，判断是否与推断相一致，并得出结论。

假说-演绎法是对归纳、演绎和溯因这三种获取知识方法的综合使用。之所以将这三种方法综合使用，是因为它们都有自身的问题与缺陷。在介绍它们之前，我们先了解一下假说、理论和定律这三个概念，这三个概念是科学领域的高频词汇，可以认为是科学研究的语言。理解科学，便需要知道科学的语言。

假说 & 理论 & 定律#

假说#

Hypothesis可以翻译成假说或假设。一般而言，假说有不同的定义:

提出原因的假说或解释性假说（Causal Hypothesis）
描述性假说——描述现实中的趋势、规律或者模式
统计假说或原假说（统计学），比如，研究两个样本分布在统计意义上是否一致，或者统计模型里的参数估计是否在统计意义上显著不为0？
推测或推断（Prediction）

[]将推断定义为假说或理论检验的预期逻辑结果。比方说有一个解释植物生长的假说：向阳是山上某一侧的植被生长好的原因。那么，如何去检验这个假说呢？可以设计这样一个实验，在山朝北的一侧进行模拟太阳光的人工照射。基于植物生长假说，可以推出：在照射的地方，植被会和向阳的一侧生长的一样好，这便是推测。

Eastwell认为推测和假说需要进行区分，不应混在一起使用。统计假说或原假说属于统计检验领域，是数学术语，不是科学研究方法中的假说概念。因此，科学研究中的假说应为提出解释性假说和描述性假说。鉴于解释性假说对科学研究和发展至关重要，Eastwell将假说限定为解释性假说，并将描述性假说称为初探性（或尝试性）定律（Tentative Law or Trial Law），以使概念划分更为清晰。在后面介绍定律的概念时，大家可以体会一下作者这样建议的原因。

假说#: 基于现实中的具体问题或一系列紧密相关的问题所提出的解释或者描述。

假说可以是大胆猜测，也可以源于理论或定律。如果假说是基于理论或定律所提出的，那么，对假说的检验可以视为对相应理论或定律的检验。

假设我们想解释，为什么学校在2021年初会安排线上教学？对此，我们提出了一些假说：

假说1：新冠疫情会导致线上教学
假说2：车厘子热卖会导致线上教学
假说3：因为2020年我国GDP超过了1,000,000亿，所以学校会进行线上教学
假说4：因为学校调整教学方式，所以线上教学

我们可以提出多少个假说呢？原则上讲，可以无穷无尽，约束于自身的想象空间。比如，将不可明说的宇宙力量或者学生们都喜欢吃巧克力作为原因也是可行的假说。之后会指出，在科学研究中，为了避免假说的任意性，要求提出的原因和想解释的现象应符合演绎逻辑。也就是说，对于不合逻辑或逻辑不自洽的假说，我们可以直接否定，如假说2和3。而对于假说1和4，需要做出相应推断，并在现实中进行检验。可能的推断如，根据假说4，可以预期之后的学期也会出现相同的网上教学安排；根据假说1，当疫情减缓（严重）后，学校将不会（会）安排网上教学。

如果大家有看过《犯罪调查现场》或《犯罪心理》等刑侦类美剧，在剧中，相关人员通常都会对案件的发生原因提出一个theory，或者，对案件的发生，询问“What’s your theory?”，这里theory其实指的就是hypothesis。

一些假说的例子

波特假说 (Porter’s hypothesis): 环境与经济可以实现双赢的局面，环境规制能够促进企业创新，且创新所带来的收益大于额外的监管成本，即环境规制能够促进企业增强竞争力，提高企业绩效。（也被称为「强波特假说」）
趋同假说 (Convergence hypothesis)：不同国家和地区的经济发展水平会趋于相似，即富裕国家的经济增长率会放缓，而贫穷国家的经济增长率会加速，以达到某种均衡状态。或者说不管经济体初始的人均资本存量是高于还是低于均衡状态时的资本水平，要素间替代的可能性和报酬递减的力量都会使经济体收敛于本身的均衡状态
环境库兹涅茨曲线假说 （Environmental Kuznets Curve hypothesis ）：环境污染随着经济发展的加速而增加，但当一个国家的收入达到一定水平时，环境污染会随着经济发展的继续而减少。
管理防御假说（Managerial entrenchment hypothesis）：公司的经理人可能会优先考虑自己的利益而不是股东的利益，并利用他们的权力和影响力来维持自己的地位，阻止可能威胁到他们权威的变革。这可能导致缺乏问责制、糟糕的决策和最终的公司表现下降。
2021年11月初，日本国内新型冠状确诊人数呈断崖式下降。国立遗传学研究所和新潟大学的研究小组对此提出了病毒自毁假说: 冠状病毒进入人体后会复制自己的基因信息并不断增加，有时发生复制错误就会发生变异，如果错误复制过多，病毒自身会失去平衡无法增殖，当用于修复的nsp14酶也发生突变，病毒就会自我毁灭。

理论#

理论 (Theory) 由一系列相关命题或陈述构成，其目的是一般化地解释大量的相关现象。理论本身并不需要被大量证据支撑；不同的理论也可以对同一现象进行解释，比如自然发生论（spontaneous generation theory）和进化论都是解释物种起源的理论。

如果一个理论经受住了非常多的现实检验，成为了科学家们的共识，那么，就称该理论为embedded theory，也是我们通常所指的科学理论，比如，牛顿力学理论、板块构造理论和进化论。

科学理论 #: 由一组陈述构成，它们共同尝试解释一类相关的现象。

一些理论的例子

信息不对称理论：用于解释在信息不完全的情况下，供求双方如何做出决策。在信息不完全的情况下，市场中拥有更多或更准确的信息的一方，可以获得更多的利益。这种不对称的信息可能导致市场失灵和资源分配不公。
代理理论：用于解释代理和委托关系中的问题。代理关系是指一个人或组织（代理人）代表另一个人或组织（委托人）进行某些行动或交易。在代理关系中，委托人通常会向代理人提供一些激励，以使代理人按照委托人的利益行事。代理理论认为，代理人可能会利用自己的信息和权力，来追求自己的利益，而不是委托人的利益，从而导致代理问题的出现。代理问题可能会导致委托人的利益受损，从而影响整个经济系统的稳定性。
刘易斯拐点理论：用于解释一个国家在经济发展过程中劳动力市场的变化和发展。当一个国家的经济发展到一定水平时，劳动力市场可能会出现拐点式的变化，即劳动力市场上的工资水平开始上升，企业会因为成本的增加而减少聘用新工人，或者通过采用机械化设备等替代手段来减少劳动力使用量。这种现象可能会导致新的就业机会变少，从而影响整个国家的经济发展。
社会学习理论：是一种描述人类社会学习过程的理论，强调观察和模仿在学习过程中的重要性。社会学习理论认为，人类学习不仅仅是通过个体的试错和反馈机制，还可以通过模仿他人的行为和经验来加速学习过程。

理论与解释性假说一样，都需要具有解释力。它们的不同之处在于，假说是对一个具体的现象或联系紧密的一组相关现象的解释，所以假说是具体的，而理论更具有复杂性，抽象性和一般性，理论的提出可以是对各种不同假说的共性提炼与融合。两者的区别并不在于支撑证据的多寡。因此，假说不会因为支撑证据的增加而成为理论，而只能是被支持的假说或者事实。

定律（Law）#

定律是关于现象的一般规律或模式的陈述，描述的是不同事件或变量的联结——只要有一类详细规定的条件F发生，则另一类条件G必定会发生。很多定律会使用数学公式进行表述，比如，

自由落体定律：当一物体在接近地球表面的真空中从静止状态做自由落体时，在t秒内走过的距离为\(\frac{1}{2}gt^2\) ，\(g\)是重力加速度。
万有引力定律：引力大小与质量的乘积成正比与距离的平方成反比，\(F = G\frac{Mm}{r^2}\)， F是引力，G是万有引力常量，M和m是两物体的质量，r是物体间的距离。
需求定律（经济学中非常重要的定律，见需求部分）：在一定时期内，当其他条件不变时，商品的价格和需求量呈反向变化，如\(Q=f(P)\)，\(\frac{dQ}{dP} < 0\)。

定律 #: 关于现象的一般规律或模式的陈述。

描述性假说通过证据的积累可以成为定律。有些定律中的变量联结可以理解为因果关系，如，在需求定律中，价格变化是因，需求量的变化是果。定律可以由理论进行解释，之后我们会学习消费者理论，就是对需求定律的解释——为什么价量呈反向关系。

定律的目的是用于描述或解释现实。假设\(L_1, L_2, ..., L_r\)为一般定律，\(C_1,C_2,...,C_k\)为特定事件、环境或条件，它们为被解释事件（观察的现象）E的前提集。因为定律提供了一种联结，所以，特定的环境（由\(C_1,C_2,...,C_k\)描述）可以用来解释给定事件，E，的发生。这里使用的是演绎推理，这类解释可以称为是在一般定律下的演绎—律则解释。比如，我们希望解释某商场销售量增加的原因，研究发现当时该商场正在店庆，全部商品打折促销，依据需求定律，我们便可以用店庆促销解释这种销售量上升的现象，而不是在同一时期发生的其它事件，如商场对设备进行了检修，或者更换了广告海报等等。

总结#

假说、理论和定律的关系可以如图4 所示。

https://tingwen-pic.oss-cn-beijing.aliyuncs.com/img/image-20210823001023889.png — Fig. 4 假说、理论和定律的关系#

获得知识的方法#

归纳推理#

归纳推理(Induction)是从有限数量的特殊事实得到普遍结论的推理形式，简言之，是由“特殊”推“一般”，或由“已知”推“未知”。比如，过去每天早晨我们都看到太阳从东方升起（特殊事实），所以推断太阳永远都会从东方升起（一般结论）。基本的推理形式为：

前提：
- 金属A在时刻t1受热时膨胀
- 金属B在时刻t2受热时膨胀
- 金属B在时刻t3受热时膨胀
- ……
结论：所有金属在受热时都膨胀

归纳推理是我们日常生活中经常使用的思维方式，如果没有意识到，可能恰是因为其太过于普遍。当基于过去的经历推测还未发生的事物时，就是在进行归纳推理了，比如，之所以知道早上开车出门会遇到堵车，是因为之前每次都是如此。

因为归纳推理可以推测未知，所以归纳推理可以使我们获得知识。这是归纳推理的优势，但同时又是劣势，因为我们无法知道所获得的知识是否正确——有可能归纳的结论是错误的。「罗素的火鸡」的故事说明的便是这个问题。该故事源于英国哲学家罗素（Bertrand Russell）。故事的主角是一只火鸡，它发现饲养场每天给它喂食的时间都是上午9点，天天如此，无一天例外。这只火鸡很聪明，它由此推出了这样一个结论：我每天早上9点都会吃到早饭。显然，这是一个归纳推理的过程。然而，在感恩节那天，这只火鸡非但没吃到早饭还被送上了别人的餐桌上，这表明火鸡从正确的观察中得到了一个错误的结论。之所以火鸡会得出错误的结论，是因为使前提成立的条件发生了变化，人们在感恩节那天有着不同于日常的饮食习惯。

归纳推理成立的前提是未知事物所依赖的条件与前提一致或相似，而归纳推理本身并不能保证该前提的成立。因此，无论所观察到的事例有多少，我们都无法确保结论的正确性—— 前提为真，结论并不一定为真。

现实中使用归纳推理出现的问题

在股票市场，市场条件瞬息万变，因此，用历史数据预测未来经常会出现问题。

长期资本管理公司（LTCM）创建于1994年，是一家由诺贝尔经济学奖得主等人创立的对冲基金公司。其投资策略是基于历史数据和复杂的金融模型。然而，在1998年，公司由于投资失误和市场条件变化而倒闭，比如，LTCM认为“主权国家不会债务违约”、“核武大国不会债务违约”，从而对俄罗斯债券市场做出了误判，没有预计到俄罗斯政府会突然宣布停止支付债务，导致损失巨大。在短短百天内，LTCM资产净值暴跌90%，净亏损43亿美金。

美国田纳西州曾于1985至1989年进行了一个比较班级规模的实验，被称为“田纳西实验”（Tennessee Study of Class Size in the Early School Grades）。实验结果表明，较小班级中的学生表现更好，学习成绩更高，特别是在语言和数学方面。基于这一研究结果，加州大规模推行了小班政策，但是效果却截然不同。原因在于，加州的实践存在政策实施不均、缺乏资金支持和教师供给不足等问题。比如，在班级规模缩小后，教师严重短缺导致新招聘的教师平均素质和能力大幅下降。

为了避免归纳推理的问题，有学者提出了自然齐一性（uniformity of nature）假设：要求过去观察所依赖的各方面条件在未来保持成立。显然，自然齐一性（uniformity of nature）是归纳推理具有合理性的前提。然而，证明自然齐一性需要经验的协助，比如，我们可以这样去论证：因为自然齐一性在过去的所有观察中都被验证是可靠的，所以，自然齐一性在所有情况下都成立，可以用于预测未知的事物。这显然是一个归纳论证的过程，而该论证成立的前提是自然齐一性，而自然齐一性不能作为其存在的证明，否则，就会陷入循环论证。英国哲学家休谟指出自然齐一性不能在严格意义上被证明，应予以否定。

并且，休谟更进一步在逻辑上质疑了归纳推理的问题（被称为“休谟问题”）—— 归纳推理的理性依据是什么？休谟指出从特定实例归纳出的普遍规律超出了前提所蕴含的内容，即，从前提到结论存在一种跳跃或者间隙，换言之，归纳推理缺乏理性基础，其结论没有逻辑支撑。我们也可以这样理解，无论未来或未知的事物如何，都不会和过去的经验事实构成逻辑上的冲突，因此，以过去事实为前提，可以推出任何一种关于未知事物的结论，即，无法由前提得到确定的结论。

假定人们立即完全相信了这两个原理，即：在任何对象中都没有什么东西能为我们提供一个理由以做出超过这个对象的结论；并且，甚至在对诸对象间的经验的或者恒定的结合做出观察之后，我们也没有理由做出任何关于超出我们已试验的对象的另外一些对象的推论……

——大卫·休谟

我们常听到的「黑天鹅事件」正是归纳推理问题的体现。17世纪之前，欧洲人认为天鹅都是白色的（由归纳推理得出），因为他们从未见到过黑色的天鹅。然而，当第一只黑天鹅在澳大利亚被发现时，这个信念便土崩瓦解了（在此，前提为真，结论为假）。现今，我们常用「黑天鹅事件」指代那些不可预测，意料之外的重大稀有事件。其实，只要用过去的事实预测未来，「黑天鹅事件」便总有可能会出现，称之为意料之外只是因为我们的无知。

对于归纳推理问题，有学者建议使用概率来进行修正，即，归纳前提所蕴含的结论仅具有或高或低的概率。但是，对概率的使用也是存在问题和争议的。迄今，任何对归纳系统的辩护都无法解决归纳推理的合理性问题。这涉及到一个很重要的哲学问题，归纳推理是否真的能够使我们获取知识？在此，我们无意做过多的哲学探讨，只需要记住以下三点：

归纳推理无法确保结论的正确性，前提为真，结论不一定为真。
归纳推理成立的前提取决于其结论和前提所依赖的条件是否一致或相似。
使前提成立的条件越稳定，其结论的可信度就会越高。

虽然归纳推理存在合理性问题，但这并不代表放弃使用，只是说我们不能由其获得确定性的知识。因此，在使用归纳推理，尤其是用数据(数据本身是历史)推断未来的时候1（条件不稳定时），我们需要对结论谨慎对待。

演绎推理#

与归纳推理相反，演绎推理 (Deduction)是从已知命题推导出结论，即，从「一般」推「特殊」。其基本推理形式可以由三段论（syllogism）表示：

前提1：所有经济学的书籍都是乏味的
前提2：《微观经济学》是关于经济学的书籍
结论：《微观经济学》是乏味的

与归纳推理不同，演绎推理建立在严格的推理之上，不依赖经验或观察，当前提为真，且推理正确时，结论必然为真。如果推理过程中存在逻辑谬误，那么，即使前提为真，结论也有可能为假。比如，

前提1：所有《微观经济学》的书籍是乏味的
前提2：《微观经济学》关于经济学的书籍
结论：经济学的书籍都是乏味的

这便是错误的推理，经济学中有关于非《微观经济学》内容的书籍，它们是否乏味并不能由前提推出。

演绎推理也是我们日常生活中经常使用的思维方式，比如，我养了鸡，就会有鸡蛋，这个陈述的隐含前提是鸡会下蛋，基于这个前提和我养了鸡，就可以推出我会有鸡蛋这个结论。有一个关于演绎推理的著名例子：有一天，诗人约翰.歌德在公园里散步，在一条小道上，他遇到了一位自负傲慢的文艺批评家。两人越走越近。“我从来不给傻子让路！” 批评家先开口道。“我却正好相反！”歌德说完，笑着退到了路旁。这里，歌德和批评家都在演绎推理，对歌德而言，他的推理是这样的：

前提1：我却正好相反（含义我给傻子让路）
前提2：批评家是傻子（暗含的前提）
结论：我退到路旁（行动表明）

虽然演绎推理可以得到「看起来」不同于前提的结论，但是，因其结论蕴含于前提之中，所以，我们其实并未获得关于未知事物的认知（这并不代表结论是显而易见的）。为了可以对未知事物进行推测，我们需要使用一般性的前提，如，所有的A都具有性质B，如此，对于A的每一个实例，即使没有观察到，都可以进行演绎。换言之，基于一般性前提，可以推出一般性结论，实现对未知事物的推断。

在演绎体系中，我们将一般性前提（如基本假设或公理）视为一种构建性的约定，是不证自明的。这说明，任何一套命题都可以作为推理的一般性前提，只要相互一致，不会演绎出相互矛盾的命题即可。

例如，数学是典型的演绎体系——以公理为基础，通过严密的逻辑推导，推出整套理论及其推论。例如，在欧式几何中，有五条公理，这是研究欧式几何的基础；在罗式几何中，平行公理与欧式不同，它要求过直线外一点，至少可以做两条直线与已知直线平行（马鞍面），那么在罗式分析中，就需要基于此假设进行推理；黎曼几何也修改了欧式的平行公理，其分析建立在球面上，在这个体系中，直线被定义为通过球心的平面在球面上截得的大圆（球面上半径最大的圆），因此，任意两条直线都会相交，且三角形的内角和大于180度。可见，公理可以大幅改变，每一套公理都含义着一个不同的数学体系。

虽然获取知识需要一般性前提，但是将前提视为构建性的约定，并不意味着我们就可以获得对未知事物的正确结论。因为一般性前提需要源于归纳——我们不可能不通过观察，而获得一个一般性的结论，所以，归纳推理的问题决定了我们无法确定一般性前提是否为真。而当前提不为真时，无论推理过程多么的严密，结论的真假在逻辑上都是无法判定的，比如，

前提1：所有人都喜欢微观经济学这门课。
前提2：A是人。
结论：A喜欢微观经济学这门课。

即使前提1为假，A仍可能喜欢微观经济学这门课——假命题可以推出一切命题。因此，不证自明的一般性前提不能代表结论的正确性，逻辑自洽也是如此。这说明（1）当前提为假时，结论可能为真；（2）当结论为真时，前提可能为假。因此，我们不能通过否定前提来否定结论（\(A\rightarrow B \nRightarrow \lnot A \rightarrow \lnot B\)），也不能以结论来肯定前提。

现代科学理论的构建都是基于演绎推理，因此，做哪一方面的研究，就需要接受相关学科的一般性前提或基本假设，而又因为基本假设是构建性的约定，所以其结论不一定为真——理论不具有天然的正确性。如果我们不认同理论的基本假设，如前所述，也不能认为理论是无效的，而应建立一个新的理论体系进行研究。那我们如何否定理论呢？当结论为假时，前提为假（\(A \rightarrow B \Leftrightarrow \lnot B \rightarrow \lnot A\)），因此，对结论的判定需要在现实中进行检验：若结论没有经受住检验，则说明前提有可能2是不恰当的，理论需要修正或否定。

麦克斯韦方程组

麦克斯韦方程组，是英国物理学家詹姆斯·克拉克·麦克斯韦在19世纪建立的一组描述电场、磁场与电荷密度、电流密度之间关系的偏微分方程，被认为是世界上最美的物理公式。麦克斯韦方程组对于电磁学的发展和应用具有非常重要的意义，可以用于解释和预测电磁现象的行为和特性，如电磁波和电磁感应等。然而，麦克斯韦方程组一开始使用的证明假设——空间中不存在电荷——是错误的，这个假设在后来的实验中被证明是不正确的。

与归纳推理一样，演绎推理也存在获得知识的有效性问题。演绎推理的特征是前提为真且推理正确，则结论必为真。如果想使用演绎推理获得知识（对未知事物进行推断），则需要使用一般性前提。在演绎体系中，假设一般性前提不证自明，但是一般性前提的成立无法被证明（归纳推理的问题）。因此，无法确保结论的正确定。

溯因推理#

溯因推理（Retroduction or Abduction）也可以称为回溯推理或逆推法，是指对观察到的现象或结果，猜测原因或获取合理解释的过程。解释性假说的提出便是基于溯因推理，可以说，溯因推理是一个形成解释性假说的过程。

在日常生活中，我们经常会由果溯因，比如，早上出门看到地上是湿的，便猜测是夜里下雨的缘故；今天学习效率很低，可能是因为昨晚失眠；汽车显示胎压报警，可能是车胎被扎了钉子；今年气候异常，可能是由全球气候变暖所致。丰田汽车有「5个为什么」分析法——对发现的问题要连续问5次为什么，问「为什么」正是溯因推理的体现。与归纳和演绎推理一样，溯因推理也是我们惯常的思维方式。

溯因推理与归纳推理的思考方向是相反的，溯因不是通过观察而得出一般性的结论，不是对未知或未经历的事物进行推断，而是猜测一个过去（retro）发生的事物，该事物会导致所观察现象的出现。恰当的溯因推理应确保猜测的原因与观察到的现象具有逻辑自洽性，即符合演绎推理。如果回溯的原因不能演绎出相应的结果，则是不恰当的溯因。比如，如果认为吃早点是胎压报警的原因，那么这个溯因就是不恰当的，因为两者并不存在逻辑关系。需要注意的是，如果回溯的原因是还未被观察到的事物，比如，一种不可见的暗物质是车胎报警的原因，这在逻辑上是无法被排除的。因为我们无从得知未观察到的事物特征，所以可以任意构建逻辑自洽的推理，这类似于，假命题可以推出一切可能。比如，一个可能的推理可以是，因为这种暗物质会选择车进入，导致胎压报警，我的车被暗物质选择了，所以胎压会出现报警。

溯因推理对因果关系的建立具有重要意义，科学家“所致力的工作便是从被解释项到解释项”的追溯([], pp.85-89)。比如，牛顿对「为什么苹果会落到地上」的思考，提出了万有引力，进而建立了牛顿力学。皮尔斯认为只有通过溯因的方式才能完全认识和理解现象，溯因推理会带来新的概念、新观念与创新。

虽然溯因推理是重要的思维方式，但是，回溯的思维过程是存在逻辑漏洞的——被称为肯定后项谬误（The fallacy of affirming the consequent）。试思考如下命题，如果A发生，B会发生（\(A\rightarrow B\)）。我们可以认为A是B发生的原因，但是如果在现实中观察到了B的发生，其原因一定会是A吗？在逻辑上，我们是无法由B推出A的发生的，即，A推出B不等价于B推出A，

\[A\rightarrow B \nLeftrightarrow B\rightarrow A\]

这是因为除了A之外，可能还有很多其它原因也会导致B的发生，如图5所示，比如，除了轮胎扎入了钉子会导致胎压报警外，气温低，汽车系统故障，以及前面所说的暗物质都可能会导致胎压报警。这说明，对于每一个回溯的原因，都会找到其它与所观察现象一致的解释，或者说，我们可以提出无数个恰当的假说。而到底哪个猜测的原因是正确的呢？仅基于所观察到的现象本身，我们是无从判断的。这并不意味着我们不会找到正确的原因，而是说我们无法确定回溯的原因是否正确。

https://tingwen-pic.oss-cn-beijing.aliyuncs.com/img/image-20210831230537483.png — Fig. 5 溯因推理的问题#

综上，虽然归纳、演绎和溯因推理有各自的问题与缺陷，但仍是我们获得知识的重要方法。在现代科学研究中，并不是单独使用它们进行研究，而是将三者综合运用，构成一个获取知识的方法体系，称为假说-演绎法（Hypothetico-deductive Approach）。

假说-演绎法（Hypothetico-deductive Approach）#

假说-演绎法是归纳、演绎和溯因推理的综合使用，可以理解为是一个如何思考问题的模型。图6展示了假说-演绎法的思维过程，基本步骤如下：

观察现象，提出问题（归纳推理），比如，从观察到某地区感染流感的病人数量众多，总结出这个地区流感发病率上升的结论，进而提出问题。
猜测原因，提出假说（溯因推理），猜测原因能够推出观察的结果（演绎推理）
基于假说做出新的推断（prediction）（演绎推理），这一步的出发点是解决溯因推理中的肯定后项谬误。虽然提出的假说都与观察到的结论相一致，但是不同的假说总是可以推出一些不同的推断，这是因为如果两个假说的所有推断都相同，那么，从本质上说，可以认为它们没有任何区别。如图7所示，3个假说推出了3个不同的推测，如果推断1没有被观察到，则说明假说1不是一个恰当的溯因。如是，通过提出新的推断和检验，缩小假说范围，溯因推理的有效性得以建立。对推断的检验可以通过观察或者实验。

https://tingwen-pic.oss-cn-beijing.aliyuncs.com/img/1646643537(1).png — Fig. 6 假说-演绎法的基本步骤#

https://tingwen-pic.oss-cn-beijing.aliyuncs.com/img/20220307170244.png — Fig. 7 假说与推断#

假说-演绎法并不是科学研究的专用方法，我们在日常生活中也会经常使用。仍以汽车胎压报警为例，假设溯因为车胎被扎。基于该原因可以推断出车胎上会有钉子，或者被扎的痕迹，于是我们开车去维修店检查，结果发现轮胎完好，没有被扎的痕迹，这说明车胎被扎不是胎压报警的原因，还需要继续思考其它可能的原因。因此，使用假说-演绎法进行分析并不是区分科学与非科学的标准（除非认为使用假说-演绎法分析问题都是在进行科学研究）；假说-演绎法是定义科学的必要条件，但不是充分条件。显然，机械修理师傅查找和修理设备或者程序员在de-bug的时候，思考方式也是假说-演绎法，但却不会被认为是在进行科学研究。

假说-演绎法的问题在于如果从假说推出的推断与现实观察一致，我们是不能认为假说是正确的，即无法获得确定性的结论。即使在车胎上发现了钉子，并且在更换轮胎后，不再出现胎压报警，我们也不能排除真正原因不是轮胎被扎的可能，比如真实的情况是：轮胎老化是原因，而钉子是在进维修店的时候恰好扎上去的。这里与在演绎部分所说的「不能以结论来肯定前提」是一致的：假说是推断的前提，推断为真不能推出假说为真。因此，科学研究并不是完美的，是有可能存在错误的，其结论也不是天然正确的。如果我们接受科学研究的不完美——科学研究可以接近「真理」但不能认识「真理」，即从实用主义的角度理解科学，那么，无法获得确定性的结论便不是一个问题。

另一个潜在问题是，如果溯因于未观察到的事物，比如，前面提到的暗物质，那么，我们便无法做出确定性的推断，所以假说永远不会与现实相冲突。比如，若暗物质是胎压报警的原因，在尝试更换轮胎后胎压报警并未消失，这可能是因为暗物质除了进入轮胎外，还进入了其它地方导致了胎压报警，与假说并无冲突。或者，也可以修正假说的演绎逻辑，使假说与检验的结果相一致。简言之，若溯因于观察不到的事物，在逻辑上，我们可以推出一切可能。英国哲学家卡尔\(\cdot\)波普认为永远不会出错的理论不具有科学性——与现实毫无冲突不是理论的优点而是缺陷。因此，他主张（具有科学性的）理论或假说应具有「可证伪性」，并将其作为科学与非科学（知识）的判断标准。虽然假说-演绎法本身不是科学与非科学的划界标准，但是，在科学研究中，如何使用假说-演绎法或对其附加的要求是科学研究的特征。

证伪主义 (Falsificationism)#

证伪主义认为「可证伪性」是科学与非科学（知识）的划界标准，代表人物是卡尔.波普（Karl Popper）。可证伪性是指在逻辑上（不要求在现实中一定可以观察到）存在一个可能的观察命题或一组观察命题与原命题不一致，即，原命题至少在逻辑上存在一个出错的可能，比如：

星期四从不下雪（逻辑上，星期四可能会下雪）
苹果离开树枝，会落到地上（逻辑上，苹果可以飞到天上去）
所有行星都沿着椭圆形轨道围绕太阳做运动（逻辑上，行星轨道可能不是椭圆形）
在温度变化明显的情况下（假定为电热水壶煮水的速度），被水煮的青蛙会从水中跳出（逻辑上，存在青蛙不跳出来的可能性）

相应的，那些在逻辑上永远不会与现实相冲突的命题则不可被证伪，如，

一张全白的纸是白色的
两只脚的动物有两只脚
天或者下雨或者不下雨

可证伪性并不是说理论是错误的，而是可以由它们推出一些确定的、能够被现实检验的推断。如果推断是错误的，则称理论被证伪。做出确定性的推断是可证伪性的关键，如此，认知才会随着理论的不断试错而加深，进而认识和改变世界。而永远不会错——与世界的任何属性都不相冲突——的理论却不会带来认知的加深。我们可以提出无数不可证伪的理论，但仍旧对现实一无所知。

波普曾指出阿德勒（奥地利心理学家）以自卑感解释人类行为的理论不具有可证伪性，因为该理论可以解释人们的一切行为。假设有一个小孩儿落入水中，岸边的人救或不救都可以用自卑感进行解释。如果有人跳入水中救人，阿德勒学派对此的解释为：这个人要表明他很勇敢，完全可以不顾危险跳入河中，他显然需要克服他的自卑感。而如果不救呢？他们的解释为：当那个孩子溺水身亡时，这个人想通过他有意志力泰然自若地留在岸上来证明，他正在克服他的自卑感。这好比是事后诸葛亮，怎么说都有理。救与不救都可以被解释，显然无法对人们未来的行为选择做出确定性的推测，因此不具有科学性。

这也说明，若想理论具有可证伪性，则不能用观察不到或想象的事物来解释现象，如心理意图、偏好、国民性和素质等具有主观价值判断的因素。不是说它们不能用于解释，或是错误的，而是说它们无法被现实检验，使用它们做解释不符合科学精神，或者说，不具有科学性。简言之，理论的科学性寓存于取消、反驳或检测的可能性之中。

不可证伪的命题也可称为套套逻辑（Tautology）。与之相对的是特殊理论，特殊理论的解释力有限，只能解释一个现象而不能伸展至其它，不具有普适性，无法用其它现象进行验证。因此，同套套逻辑一样，特殊理论也不能帮助我们增进对世界的认识。我们可以将特殊理论和套套逻辑作为可取理论的两个边界。一个理论要具有增进知识的内容，就必须承受被证伪的危险。

因此，在科学研究中，对假说-演绎法使用的要求在于提出的假说具有可证伪性。在前部分已经说明，即使由假说推出的结论没有被证伪，我们也不能认为假说是正确的，无论经受住了多少严格的检验也是如此——现在未被推翻的假说（或理论），不代表以后不会被推翻。因此，理论只能被证伪，永远不能被证实。

“道可道，非常道”，从本质上讲，任何理论都只是真理/规律或道在一定局限或环境条件下的表现形式。若条件改变，理论也会随之而变。一旦我们将理论奉为一成不变的真理，那么随之而来的必定是愚蠢（“前识者，道之华，而愚之始”）。

“科学不是求对，也不是求错；而是求可能被事实推翻。”

———张五常

波普曾言：“我们一无所知——这是第一点。因此我们应该非常谦逊——这是第二点。在不知道的时候我们不应该声称知道——这是第三点。”任何知识的学习最后都应受用于自身，证伪主义于我们为人的最大要义便是永远不要自满于自己的所知所得，世事无常，我们从来不知道什么是必然的。承认自己的无知，便是最基本的科学精神。

证伪的问题——我们能否相信自己的观察？#

基于假说-演绎法，我们需要检验由假说演绎的推断，如果推断与现实观察或实验数据不一致，则拒绝或证伪假说。然而，我们真的可以毫不犹豫地直接否定假说或相关理论吗？

早时，科学家发现天王星的运行轨道违背了牛顿万有引力理论的预测，结果后来发现错误的不是牛顿理论，而是对初始条件的描述——没有把待发现的海王星考虑在内。再如，有关地心说和日心说的争论，如果地球围绕太阳运动，那么一些恒星的位置会出现视差，然而用肉眼或当时的望远镜观察时，却没有发现位移。后来我们知道之所以没有视差是因为望远镜的精度不够。因此，有时候，过早的将假说或理论否定，可能会阻碍或推迟科学的进步。

此外，事物都是相联系的，每个假说都暗含着一些需要满足的背景条件，也即观察到推断所需要满足的前提条件，我们可以将这些条件称为辅助性假说（Auxiliary Hypothesis）。当假说被证伪时，有可能是辅助性假说没有满足（如上段中的两个例子），而非假说本身。比如，在我们否定车胎被扎是胎压报警的原因前，需要考虑的辅助性假说可能有：

修车师傅对车胎的检查没有疏漏
检查设备没有问题
检查的是有问题的车胎

如果发现师傅检查的是未报警的车胎，那么，显然，车胎被扎假说并没有被证伪。再如，如果我们发现某种商品的价量并不是负向关系（违背了需求定律），首先需要考虑的是需求定律成立的前提条件是否满足，而非直接将需求定律证伪。这说明，当假说被证伪时，我们可以通过辅助性假说对假说进行挽救。

因此，孤立的考虑假说本身，并不是对推断的恰当检验3。与假说一样，我们也可以提出无穷个辅助性假说，然而，问题在于，如果我们想确定假说被证伪，则需要对它们全部进行控制，这显然是不可能的，因此，通过观察或检验，我们其实不能对假说有一个明确或定论性的否定。

这里的意义在于，在证伪假说或理论前，我们需要思考（1）检验时的观察或数据是否正确？（2）分析模型是否得当？（3）辅助性假说是否满足？在实际检验时，我们只需要把握住关键的辅助性假说即可。（4）是否可以通过修正假说或辅助性假说，使假说或理论与观察相一致。

辅助性假说

辅助性假说需要有真实的含义，如果没有真实的含义，则无法被检验，我们便总可以通过辅助性假说来挽救被证伪的假说。

check add csdid?

塞美尔怀斯对产褥热的研究#

在本部分，我们将通过一个实例加深对假说-演绎法的理解。

在1844年至1848年间，匈牙利医生塞美尔怀斯（Ignaz Semmelweis）发现，在其工作的医院，第一妇产区有很多产妇患上产褥热。1844、1845和1846年产褥热的死亡率分别为8.2%、6.8%和11.4%。但是，在第二妇产区，同时期的死亡率却是2.3%、2.0%和2.7%。为什么两个产区的死亡率会有所不同呢？（观察、归纳提出问题）

为此，塞美尔怀斯先后对产褥热的病因（充分因）提出了六个假说，并一一进行了检验。

假说1：瘟疫感染引起产褥热

演绎推理：逻辑上，瘟疫对地区无选择性，如果发生瘟疫，第一和第二妇产区会有相似的感染率，所以，第一和第二妇产区产褥热的死亡率不会差异很大。然而，在现实中，产褥热却只多发于第一妇产区。
结论：提出的原因不能演绎出观察到的现象，可以直接否掉。

假说2：过分拥挤导致产褥热

推断：在同样拥挤的地方，应有相似产褥热的死亡率。
检验：塞美尔怀斯发现第二妇产区也非常拥挤，但产褥热死亡率却很低。
结论：假说2被证伪

这里的分析逻辑是寻找反例法，其它条件不变，当原因发生的时候，如果结果没有出现，则说明原因被证伪。

假说3：医科学生对产妇的粗暴检查伤害导致产褥热

推断：
- （1）自然分娩造成的伤害大于粗暴检查造成的伤害，所以自然分娩产妇的产褥热死亡率会较高；
- （2）同样的粗暴检查条件下，产褥热死亡率会较高；
- （3）若改变粗暴检查，产褥热死亡率会降低。
检验：
- 推断（1），发现自然分娩产妇没有同样的病情效果；
- 推断（2），第二妇产区助产士以同样方式检查但无同样的病情效果；
- 推断（3），在第一妇产区，当医科学生数目减少后，检查的粗暴程度降低到了最小量，死亡率短期下降后，却上升到比以前更高的程度。
结论：假说3被证伪

推断（3）的提出逻辑是反事实的思考方式。基于反事实定义因果关系的思路是：如果A是B的原因，那么，当A发生时，B会发生；其它条件不变，当A没有发生，B不会发生。因为原因发生与没有发生的结果只能观察其一，所以其中一种情况是反事实。参见附录：对因果关系的探寻。

假说4：教士对临终产妇的关怀因长时间的摇铃声引起其她产妇心理恐惧导致死亡率很高（在此，恐惧是心理，我们需判断的是摇铃和死亡率的关系）

推断：如果没有长时间的摇铃声，产褥热死亡率会降低。
- 反事实的思考方式
检验：塞美尔怀斯说服教士绕道进入产区且不再摇铃，产褥热死亡率没有降低。
结论：假说4被证伪。

假说5：仰卧分娩是导致死亡率较高的原因

推断：如果采用像第二妇产区一样的侧卧分娩，产褥热死亡率会降低。
检验：在第一妇产区采用侧卧分娩，产褥热死亡率没有降低。
结论：假说5被证伪。

假说6：手术刀上的“尸体物质” 是导致死亡的原因

该假说的提出源于一起意外事故：塞美尔怀斯的一位同事在进行尸体解剖时被手术刀刺伤，之后生病而死亡。塞美尔怀斯发现其症状与产褥热症状相同，实践中他的同事和医科学生都是简单洗手后，从尸体解剖房直接进入病房，手上常保留着尸体腐败气味。

推断：如果没有携带“尸体物质”检查产妇，产褥热死亡率会降低。
检验：塞美尔怀斯让所有对产妇检查的医生和医科学生于检查前在漂白粉溶液中洗手，产褥热的死亡率也相应地迅速下降。为了进一步确证结论，塞美尔怀斯指出第二病区助产士没有进行解剖尸体的工作，并且在街上分娩的产妇（不会有“尸体物质”的接触）死亡率也低。
结论：假说6未被证伪

之后，塞美尔怀斯又有了新发现：来自活机体的腐败物质也能导致产褥热。更近一步，基于这些没有被证伪的假说，我们可以提炼出一个有关产褥热的一般化理论。

1: 例如，股票交易的量化策略模型，经济预测模型等等。
2: 之所以使用“可能”，是因为可能有其它原因使结论为假，而非前提存在问题。
3: 这也被称为Duhem-Quine问题，最早由Willard van Orman Quine 和Duhem提出。