前一篇文章说到如何从现象中科学地进行归纳,但留了一个很大的问题没有触及,那就是“理论”究竟是怎么建立的,这一点对于物理竞赛同学来讲是值得注意的。诚然,化学、生物等众多学科几乎都是直接从实验结果进行归纳,更甚者生物学的很多传统领域还在做着以单纯描述现象为主的工作,这些学科建立的逻辑基本都采用了科学归纳法的方式。然而,很多读过某些“科普”著作的人,会有一种错觉,即物理学的理论是从形而上学或者说纯粹哲学的角度出发建立起来的,和实验没什么关系。更甚者,他们看到了有人这样做成功了,于是觉得似乎物理理论是如此容易,以至于自己随便想想就可以拿出个猜想,得到真理。这真是错得很离谱。
一、历史
我们先来回顾一下历史。一般认为,物理学真正的开始,是牛顿出版了著名的《自然哲学的数学原理》一书,正式确立了牛顿力学的框架。然而,他的力学理论是源自伽利略对惯性的诸多研究,他的引力理论是源自开普勒三定律。而开普勒三定律,正是开普勒在大量艰苦的天文观测中总结归纳出来的。
随后到十九世纪,经过库伦、毕奥、萨法尔、法拉第等人的大量实验总结,人们对电与磁的认识几乎完全。最终,麦克斯韦将前人的所有工作整合起来,又加入了自己对位移电流的一个假设,形成了电磁学的基本理论:麦克斯韦方程组。随后,麦克斯韦方程组所预言的电磁波被赫兹发现,再后来人们发现光实质上也是一种电磁波。
热学早期一直在讨论功与热的关系。随着热功当量的测定,人们终于意识到热无非是也是一种能量形式。对于气体的描述,人们建立起一系列实验定律,如玻意尔定律、亨利定律,最后被克拉伯龙总结形成理想气体状态方程。另一方面,玻尔兹曼从概率统计的角度出发,建立了统计力学。而统计力学给出了更为完备的热学理论。
人们常常津津乐道的19世纪的两朵乌云,即是两个实验的不吻合:黑体辐射实验与迈克尔逊莫雷实验。基于经典的牛顿物理和统计力学所给出的黑体辐射能谱全部与实验相差很远,此时普朗克无奈之下引入量子的概念,得到了完美吻合的黑体辐射能谱,开始了量子力学发展的进程。而麦克斯韦方程给出的真空光速,是一个不与参考系有关的常数,而MM实验验证了这一点,这有违牛顿力学中关于参考系变换的部分。以此为出发点,爱因斯坦建立了狭义相对论。
此后随着原子实验以至高能物理的发展,人们发现越来越多的新现象。随着早期量子论给出各种错误的结果,薛定谔、海森堡等人终于构建出完善的非相对论性量子力学的框架,但此时以Klein-Gordon方程为代表的相对论性量子力学还有着深刻的问题。随着狄拉克方程的提出,正则量子化的提出,重整化的使用,完美兼容狭义相对论的量子场论框架终于成熟。至此,我们有了描述物理世界的基本理论方法。而费曼提出路径积分使人们理解了量子物理是如何与经典物理相联系的。
自麦克斯韦方程之后,电磁理论就没有多少需要修改的地方了。将电磁场量子化,得到的量子电动力学可以精确计算出和实验高度吻合的电子反常磁矩。后来随着高能实验的发展,人们终于得以对弱力和强力进行系统的研究,经过四费米子理论和汤川理论,弱电统一理论和夸克模型,最后发展成为标准模型。而这些理论所预测的各种夸克、W波色子和Z波色子,以及最后最重要的Higgs波色子,最终都相继被高能实验发现。
另一方面,关于引力理论,爱因斯坦从等效原理的考虑出发,建立了广义相对论。随后广义相对论在水星进动、引力红移、引力波的直接观测等实验中得到证据支持。但是当人们发现无法基于广义相对论构建一个描述微观引力作用的量子场论时,便开始了量子引力的研究。虽然爱因斯坦本人也有尝试,但并不成功。经过几十年的发展,人们找到了几种候选理论,大众听得最多的便是弦论,此外还有圈量子引力、声学度规、熵力等等五花八门的理论。但因为引力过于弱小,难以在微观世界体现出作用,以至于实验难以实施,人们现在还没有办法特定出某个理论。
说到这里我想已经很清楚了,物理学的历史发展中无时无刻都离不开实验的影子。而且,事实上,实验和理论的突破总是难以分割的。
二、理论
不过说到底,物理理论指的是什么?
它是指一种基于数学的理论系统,通过对描述对象的适当抽象,建立起的一套数学化的系统。它用数学来表述所要研究的对象之间的关系,并对这些方程与现实观测的联系进行简单的诠释。
比如说,你如果可以用一堆数字来标记一个系统的状态,比如用x,y,z来标记一个质点的位置,用一个被称为拉格朗日量的函数来抓住这个系统运动的特征,你就可以通过解欧拉-拉格朗日方程极小化一个叫做作用量的东西,来描述这个系统的运动轨迹。这个被成为最小作用量原理的定理,便是理论物理实质上的根基。如果那个函数采用不同的形式,我们便得到了牛顿力学、狭义相对论。
如果你需要的数字数目(自由度)是无穷的,这时就过渡到场论来描述。麦克斯韦方程、爱因斯坦方程无非都是采用不同的作用量得出来的。如果我们考虑费曼路径积分,以作用量为权重,把所有这些运动路径的贡献都算进去,我们就得到了量子力学。而最终标准模型给出的,也正是这样一个长长的作用量,它包括了三项:弱电相互作用、量子色动力学以及Higgs机制。而大家总以为弦论如何如何,其实也是用同样的框架,给出了一个更复杂的作用量。
这套框架,自从被拉格朗日和哈密顿奠定一来,就没怎么变过。听起来有点奇葩,因为这个框架本身见不到任何实验的影子,似乎真的是神来的。但其实请仔细想,这个框架本身并没有告诉你任何信息,这只是一种表述。当然,这个框架是有用的,它给了我们一个通过对称性找守恒量(诸如能量、动量、角动量、电荷等等)的办法,从这个意义上它的结论仍然是可验证的。蕴含了全部物理信息的,正是那个被成为作用量的泛函,或者说那个拉格朗日量。而这个东西的来源,说不定可能真的是靠猜的。
然而我们并不认为随便一个拉格朗日量给出的动力学,就一定是真的。理论的可靠性还是必须建立在证伪风险之上,这依然是毫无疑问的。实验仍然是物理学的基石。正如前述,每一个理论都仍然将它能给出的预测,当做自己的成功。
三、预测和解释
正确与实验相符当然是物理理论必然的要求,但我在前一篇文章中提到过物理理论必须有用。一个理论要有用,意味着它必须做出有信息量的论断。比如这个论断是典型的没有信息量的:
- 明天或者下雨,或者不下雨。
这句话总是正确的,但你却仍然不知道明天的天气是什么。而一个有信息量的论断,应该是这样的:
- 明天下雨。
正因为它不一定正确,所以它将未来天气的可能性缩窄了,而不是呈现给人一句废话。而这样的一句话也正是提供了一个预测。
而物理学的威力,就在于它可以提供预测,比如:
- 如果你从10m高的真空中放下一个小球,它会在1.4秒后落地。
- 如果你用长1m的金属棒以1m/s的速度垂直地划过1T的磁场,你会在金属棒两段得到1V的电势差。
- 如果你测到一堆粒子的自旋朝向正z方向,你接下来会测到它们有一半的自旋朝向正x方向而另一半朝向负x方向。
- …………………………
每一个论断都提供了足够多的信息,从而让人们在实验中进行对比。虽然实验总会有误差而不精确,但考虑了误差范围之后,我们总可以去检查这些论断,比如:
- 实验发现小球落地的时间大概在1.2-1.5秒之间。
- 实验发现电势差大概在0.995-1.003伏特之间。
- 实验发现正x方向的粒子数目和负x方向的比大概是1:0.99-1:1.01之间。
所以我们总可以很自信地拿着这些数据,去设计飞机,设计火箭,设计半导体,设计计算机。但如果有一天,经过细心的实验我们发现:
- 月球上小球落地的时间在3.3-3.7秒之间,离1.4秒差了很远。
我们会明白,之前的理论可能出了问题,这时我们不得不回过头检查,是不是有必要修改它,来符合新的实验事实,从而让它有能力预测新的实验。
所以可以想见,预测对于物理是如此重要,以至于它是保证物理的正确性和有用性的基础。而解释呢?说实话,解释并不是那么重要。
首先,要“解释”什么事情,其实是非常容易的。比如关于小球在1.4秒后落地的问题的解释:
- 小球受到重力做匀加速运动。
- 小球被10个掐着秒表的天使拉着掉下来。
- 一个挥着魔法棒的家伙用超能力控制着小球在1.4秒的时候落下来。
- 因为虚空和宇宙之间的万能场的作用,小球做超级测地线运动,于是1.4秒后落地了。
- …………………………………………
当然,除了第一个,其他全是我编的。或许看到那些奇奇怪怪的解释,会有人觉得滑稽,但其实即使是第一种“正统”解释,不也是老师教你的么?那么你怎么知道这个解释是对的其他的都是错的呢?更隐蔽的情况就是神创论:
- 上帝是万能的,一切都是他创造的。
用这一条假设,你可以解释任何事物而不露出任何破绽:
- 为什么我们看不见上帝?因为他是万能的,他可以让我们看不见他。
- 为什么地球年龄有几十亿年可是上帝创世才是几千年前的事?因为上帝是万能的他可以创造任何年龄的物体。
- 上帝能不能创造一块他举不起来的石头?你预设有“上帝举不起来的石头”的存在是不对的。
- ……………………………………………………
这些解释很完美,但是毫无用途。它不会告诉你任何有信息量的论断,你依然无法从中知道诸如明天的天气、火箭升空需要的燃料、飞机最适合飞行的形状等事情。再比如很多人以为量子引力的困难在于人不够聪明掌握不了那么高深的东西。真的是这样么?我曾与一位做理论物理的大牛同学做过一次简单的讨论,得到的回答差不多是这样的:
你以为这很难吗?这在理论上一点都不难。理论总有办法来解释东西的。
事实上也确实如此。处理量子引力我们并不是没有理论,弦论、圈量子等等都是可能的理论。但这个境地说白了,是因为我们还无法在实验室里在量子的尺度下让引力现象凸显出来,所以没办法验证这些理论。相应的,高温超导真的是没有理论吗?不,恰恰相反。高温超导理论太多了,这几百种互不相同的理论且不说能不能符合所有的实验结果,即使有50个符合现有所有实验的理论,一个个设计实验验证去区别它们也几乎不可能。
更极端的情况,就是量子力学的诠释问题。众所周知量子力学的解释实际上是个悬而未决的问题,自它诞生以来,从哥本哈根诠释到多重宇宙诠释,我们已经有十多种诠释量子力学的方法。具体可以参见wiki条目:Interpretations of quantum mechanics。这些诠释,除了个别的(比如局域隐变量理论)会给出可测量的差别以外,在公式上没有任何差别,差别只在于如何解释这些公式。但是,除了作为茶余饭后的谈资和刷牙洗脸时的随想,这个问题并不被物理学家关心。因为尽管解释不确定,如果我们没法在实验中分别它们,就没有任何作用,并不影响我们的使用。
所以,解释真的不是一件重要的事情。
当然,我也曾听过不同观点,比如UCI做Systems Biology的Arthur D. Lander教授,他在讲课时说起这样一个观点,他认为对于模型而言,预测也并不一定是最重要的,比如:
- 如果给你一个黑盒子,里面装着一台超级电脑。你想知道什么,你只需要问它,它就会告诉你正确答案。于是你得到你想要的预测了,但你明白了什么?什么也不明白。所以,尽管没有预测,能提供解释,也是模型的价值所在。
我不知道他说这样的观点是不是为了让自己更容易发表理论文章,但我想他的观点还是隐含了一个前提:
- 你的模型是基于已经验证成熟的理论建立起来的。
或者
- 你的方法论是可以验证的。
否则,还是避不开那个老问题:你的模型和上帝是万能的针尖上有10个天使在跳舞有什么区别呢?
何况我想,如果真有那样一个黑盒子,说不定我们真的能理解些什么呢。
文章来源于网络,如有侵权请联系管理员删除
***
更迅速的高校招生信息,
更全面的竞赛及自招试题讲解,
更专业的清华北大自招趋势分析,
更有蔡神、俏哥、P鹏、萌鹏,以及往届金牌大神为你答疑解惑!扫描上方二维码
关注物理竞赛微信平台
这些,近在咫尺
下面还有更多物理竞赛党关注的前沿物理:
扫一扫关注公众号,看更多物理竞赛干货
复制 wulijingsai 微信公众号搜索关注