Archive for category 科研精神

人海战术的数学原理及其与高科技强军的关系

【这篇文章大概写于2004年,当时以Wally的名字贴于“世界军事论坛”,然后有人告诉我这就是兰切斯特方程的平方率。也有人说是我早知道这个方程,又故意说是自己独立推导的,令我有口难辩。今天在看到一篇果壳网的文章,又想起了此文。现在过去这么多年,我又写过不少文章,可是从原创技术含量角度,大概没有一篇能比得上这篇。】

【我认为根据这个理论,以M*Sqrt(p)来计算兵力的话,双倍于敌军兵力应该是最有效率的打法。另外,后面关于F-22和J8-II的比方是错误的,远程攻击不适合平方率,而且如果别人能打到你而你根本打不到别人,那就再多人数也没用。】

人海战术是我军作战常用打法。经常有人对这个打法持不屑的态度,认为难道就因为中国人多,中国人命就不值钱么,认为我们应该把主要精力用在提高单兵战斗力上面,而不应该总是靠人多取胜胜之不武。其实毛泽东军事思想一直都是强调以多打少,集中优势兵力歼灭敌人。即使在全局我军兵力不如敌军,我们在局部战斗,即使是游击战的时候,仍然是强调要以多于敌军的兵力来作战,伤其十指不如断其一指。

我最近几天因为老板出去度假,自己在家偷懒玩游戏打魔兽争霸,对人海战术有了一些新的理解。以下本文试图从数学角度研究人海战术的优势所在。我对军事属于完全业余水平,不知道是不是早就有人做过类似的计算,也许我做的这个计算早就是军事教科书的常识了。我将会用到微分方程,但是如果你不懂微分方程也能理解我的结论。

最初我思考的是这个问题:假定我军士兵比敌军士兵能打。如果双方各出兵100人的话,最后战斗结束的时候敌军全死(即完全丧失战斗力),我军伤亡80人,还剩下20人。现在假定敌军仍然出兵100人,但我军采用人海战术,出兵200人,那么战斗结束的时候我军情况如何?我军是不是伤亡80人,最后剩下120人呢?

不是!我军伤亡人数要少于80人。为什么呢?假设第一次双方各出100人的时候,战斗进行了一个小时,最后我军伤亡80人,这就是说,100敌军用一个小时可以打死打伤我军80人。但是现在我军出兵200人,200人打敌军100人,战斗时间根本用不了一个小时,比如说半个小时就结束了战斗,那么敌军根本来不及使我军伤亡80人,也许只能使我伤亡40人。也就是说如果这么算的话,200人打一百人的话,我军伤亡人数将大大下降。因此即使我军单兵战斗力高于敌军,使用人海战术仍然可以起到使我军减少伤亡的巨大作用。

但是以上这个推理是建立在敌军杀伤我军的速度不变的假设之上的,实际情况是随着敌军被我军不断杀伤,其总的战斗力不断下降,杀伤我军的速度也在下降,并不是一个线性的关系。为了精确计算双方伤亡,我建立如下数学模型:

假定开战的时候我军投入的人数是 M 人,敌军 N 人。并假定我军平均每个士兵在单位时间内可以使敌军 p 人丧失战斗力,敌军平均每个士兵在单位时间内可以使我军 q 人丧失战斗力。注意要从平均角度和概率角度去思考 p 和 q,这两个数字并不一定是整数,而且可以小于1。p 和 q 实际上就是双方的“单兵战斗力”,和士兵素质,指挥水平,装备水平,地形等等都有关系。

假定在 t 时刻,我军剩下的人数是 m(t) 人,敌军剩下 n(t) 人,那么在这个时刻,敌军被我军杀伤的人数必定是我军此时的总人数乘以其我单兵作战能力,即
  dn(t)/dt = – p m(t),
类似地,
  dm(t)/dt = – q n(t).

这个微分方程组很容易求解,考虑到初始值 m(0) = M, n(0) = N,方程组的解是
  m(t) = ( M – N Sqrt(q/p) ) e^(Sqrt(pq) t) /2 + ( M + N Sqr(q/p) ) e^(-Sqrt(pq) t) /2,
  n(t) = ( N – M Sqrt(p/q) ) e^(Sqrt(pq) t) /2 + ( N + M Sqrt(p/q) ) e^(-Sqrt(pq) t) /2.
其中的“Sqrt”表示开根号。

其实如果考虑到士气等等的因素,p 和 q 同样应该是是时间的函数,但为简单起见本文假定 p 和 q 都是常数。根据这个结果,我有如下两个定理:

定理一:我军战斗取胜的条件是 M Sqrt(p) N Sqrt(q).

这个定理非常容易证明,只要让 n(t) = 0 有 t 0 的实数解就知道。这个结论说明,如果你的单兵作战能力低,你就必须多带点人,当然这个道理不用微分方程也能看出来。注意这里比较有意思的一点是我们在决定带多少人够用的时候不是看 m*p,而是计算 m*Sqrt(p),这一点如果不用微分方程你就看不出来了。

定理二:假定我军与敌军的单兵作战能力一样,即 p = q 的情况下,如果 m n,那么到战斗结束,敌军一个不剩的情况下,我军还剩下 Sqrt(M^2 – N^2) 人,我军总共伤亡 M – Sqrt(M^2 – N^2) 人。

这个也非常容易证明,只要让 p = q, n(t) = 0,就可以计算得到那时的 m (t) = Sqrt(M^2 – N^2)。

这个定理说明了以多打少的优势所在!
  
很容易证明只要 m n, 则 Sqrt(M^2 – N^2) 必定大于 m – n,这就是说即使双方的单兵作战能力相等,我军最后剩下的人数也绝对比双方开始的人数之差要多,也就是说这不是敌人一个换我们一个。只要我们人多,就算双方士兵素质相等,敌人一个也换不了我们一个。这个道理本文一开始的时候已经论证过了。其实我军参战的人数越多,我军牺牲的人数就越少。比如说双方战斗力一样,如果各出100人,最后结果必定是两败俱伤,双方一个不剩。但是如果我军多带20人,我军120人打敌军100,则根据上面的计算,敌军全死的情况下我军还剩 Sqrt(120^2-100^2) = 66 人!你多带20个人,可以少死66个人。实际上在完全理想的情况下,我军即使只比敌军多带一个人,最后战斗结束也是我军获胜,并且幸存14人!

假定敌军100人,两军单兵作战能力相等的情况下,x 轴是我军出兵人数,从100到500之间变化,y 轴是最后我军伤亡人数。
其结果如下:

我军出兵人数:100,110,150,200,300,400,500
我军伤亡人数:100, 64, 38, 27, 17, 12, 10
  
可以看出,如果我军也是100人,则全军覆没,但是我军只要人数稍微多一点,伤亡就会大大下降。同时我们也可以看出来并不是人越多就越好,如果带200人就已经可以做到伤亡很小了,这时候带300人所起到的作用根200人相比并不时特别显著。双倍于敌军人数应该是一个比较理想的数字。

其实从定理一我们还可以看出另一个结论。最终决定战争胜负的因素有两个方面:一个是人数,一个是单兵作战能力,也就是士兵素质,武器装备等等。现在的人一般比较迷信武器装备,认为提高 p 值最重要。但是我们看到,最后决定战争胜负的是M*Sqrt(p)。如果你把参战人数提高到原来的两倍,你的总战斗力就提高到两倍。但是如果你不提高人数,而是选择提高武器装备,提高士兵素质,那么为了达到同样的效果你必须把单兵作战能力提高到原来的四倍!

美军的选择是提高 p 值,毛泽东的选择是提高 M 值。到底是把 M 值乘以2容易,还是把p 值乘以 4 容易,对不同的国家,不同的经济条件,有不同的结论。问题在于用同样多的钱,如何提高M*Sqrt(p)。另外根据定理二我画的图,并不是说兵力越多就越好,一般来说单兵战力相同的情况下,两倍于敌人的兵力是最理想的。根据这个理论,我们可以思考一下我国需要多少常备军队合适。

这个数学理论有很多应用。比如说美军 F-22 好是好,但是价格狂贵,他的作战能力是不是一架就能打过 10 架 J8-II? 我军在武器配备方面应该好好参考这个理论。…

第四个科学发现范式

在你的第十二条染色体上有个叫做 LRRK2 的基因。我们假设,仅仅是假设,这个基因有一个小小的变异。这个变异的结果是使你有30%到75%的可能性在未来患上帕金森综合症。

帕金森综合症的原理大约是大脑出于某种原因降低了对多巴胺神经元的生产,而这些多巴胺神经元对控制身体运动至关重要,结果就是逐渐失去行动能力。很多名人,包括一些特别有学问的人得这个病。大脑为什么会出这种问题,怎么治疗,科学家并不知道。

不用说治疗,甚至连 LRRK2 基因与帕金森症的关系,都是直到2004年才被发现,此前人们甚至认为帕金森症不会遗传。

你怎么办呢?

好消息是并非所有LRRK2基因变异的人都会得帕金森症。这个事实暗示了一种思路。这个思路并不奇特甚至司空见惯,但由于当前技术的进步,它正在变成一个了不起的思路。微软公司对这个思路非常兴奋,称之为 “the fourth paradigm of science”,第四个科研范式。

这个思路是,那些同样有LRRK2基因变异的人,他们到底做了什么,以至于没有得病?也许我们不会知道其中的原理,但只要能找到这么一件事,做了这件事就不怕LRRK2基因变异,那就已经足够好了。就好像《午夜凶铃》中死的人多了以后,人们发现只要做把录像带传给别人看这件事就不会死一样。

这就是 Google 创始人之一,LRRK2基因变异者,Sergey Brin 要做的事。他的爸爸是数学家,他的妈妈是应用数学家,他自己本科在是数学系念的,所以他治病的办法是玩数据。

Brin 的老婆搞了个个人基因服务公司,23andMe。据最新一期《连线》杂志报道,借助这个公司,Brin 有一个系统的,或者说暴力的,解决帕金森综合症的办法。我理解这个办法是这样的:

1. 召集一万名帕金森症患者,彻查他们的基因,问卷调查他们的既往病史,生活环境和所有生活习惯,从中发现共性。这些共性可能就是帕金森症的病因。

2. 再去找那些也有这些共性的人但是没有得帕金森症的人,看看他们做了什么,其中有什么共性。这个共性就是防治办法。

这的确是非常简单的思路,但是要做的话却是相当的难。一个显而易见的难点是数据量实在太大。进行这样海量的数据分析,非得有今天最强的计算机,尤其是极高的数据存储能力不可。这就是微软对此兴奋的原因。想法是容易的,技术条件是困难的。搞这样的科研对微软来说是非常好的机会(至少可以提升公司形象),以至于微软找了一帮人,整了一本书,The Fourth Paradigm: Data-Intensive Scientific Discovery,并大力推广。(微软提供全文免费下载)。

下面我来谈谈我的看法。

所谓科学发现的前三个范式,是第一,实验;第二,理论;第三,模拟。我认为从“硬度”角度讲,这三个范式的重要性一个比一个低。实验是最硬的科学发现,你理论说得再漂亮,宇宙加速膨胀就是加速膨胀,Higgs 粒子万一找不到就是找不到,这是实打实的东西。

而模拟则是实验不好做,理论计算又没法算的情况下一个没有办法的办法。如果你承认我用的方程都是对的,你大约也会承认我模拟的结果,但这个结果永远都需要实验的检验。

与这三个范式相比,这个“第四范式”的硬度更低一些。它既不能像理论和模拟那样在一定程度上告诉你“为什么”,更不能像实验那样明确地告诉你“是什么”。海量数据分析,只能告诉你“大概是什么”。比如数据分析可以告诉你喝咖啡对降低帕金森症发病率有好处,但是说不清到底是咖啡因的作用还是别的作用。它甚至说不清这种好处到底有多大。

历史上阿司匹林对很多病症有疗效,而科学家并不知道为什么会有这种疗效。这些疗效都是“统计”发现的。

实际上,科学家一直都在从以往数据中寻找规律,提出猜想,再做验证。这就是所谓 “empirical study”,或者物理学家有时候使用的“经验公式”。《连线》这篇文章提供的那个图示的证明 Gaucher’s disease 患者得帕金森症的可能性高五倍的例子,并没有说明白现在这个“第四范式”与此有什么不同,无非是海量数据分析的数据库更大而已。

我认为,其实“第四范式”的真正了不起之处在于“客观”这两个字。此前,模式识别主要是主观的。是人在经验中发现规律,提出一个主观的假设,再去搜集更多案例来验证这个假设。而现在这个第四范式,则是让计算机自己从海量的数据发现模式,也就是共性,是客观的。这样就允许我们有一些惊喜。

但是很多人并不看好这个做法,因为数据的噪音太大。

还有一个更根本的困难。以帕金森症为例,也许发病的原因和不发病的原因都是不可观测的,比如说纯粹的偶然因素,或者说是问卷调查问不出来的因素。一个人的基因和生活自由度实在是太多,程序永远都不可能确保把所有的变量都考察到。纯粹的客观其实是做不到的,在你设定问卷内容的同时,你已经主观地设定了你想要考察的范围。第四范式要想有所发现,还是需要一点运气的。

不过 Brin 显然有理由看好这个做法。从海量数据中发现趋势是 google 一直都在做的,比如说通过搜索关键词的趋势判断流感,google 比CDC要快得多。假设 google 有一个机制自动发现任何被突然大量搜索的词,这种模式识别显然就是真正客观而不是主观的。人的生活自由度几乎是无限的,但所有词汇的组合是有限的,可是我怀疑这种组合的数字之大,就连 google 也做不到实时监控每一个可能的搜索组合。更实际的做法也许还是大量地预先设定一些可能有意义的关键词。

所以我认为“客观的模式识别”,是第四范例的关键。

(此文昨天发出之后今日略作补充)…

真理追求者

我们这帮人都有个可爱的毛病。我们往往会为一些跟自身利益比较远的事情,比如说美式民主制度是否适合中国,超弦是不是一个好的物理理论,或者阿根廷队是否能获得本届世界杯冠军这类问题争论。这种争论的结果往往是不欢而散,大家各持立场,很少妥协。

每个人都认为自己是对事不对人。每个人都认为自己在争论过程中是真诚的。是么?

诺贝尔奖得主 Robert Aumann 在 1976 年发表了一篇论文 “Agreeing to Disagree”,这篇论文影响深远堪称是传世之作,它说的是,这是不可能的。如果是两个理性而真诚的真理追求者争论问题,争论的结果必然是二人达成一致。换句话说如果争论不欢而散,那么其中必然有一方是虚伪的。

这是一个有点令人吃惊的结论。我先把 Aumann 的原话抄下:

If two people have the same priors, and their posteriors for an event A are common knowledge, then these posteriors are equal.

这段话中有很多专业术语,比如什么叫 priors, 什么叫 posteriors,什么叫 common knowledge,都需要外行学习一番。Aumann 在文中非常谦虚地说,我发表这篇文章感到有点不好意思(diffidence),因为其中用到的数学实在太不值一提了。我从来没在任何一篇其他的学术论文中看到有人使用 diffidence 来形容自己的工作,大家都是猛吹我的工作多么重要。实际情况是,没有一定的数学基础很难看懂此文。

借助于一篇后来人写的综述,我大概可以解释一下 Aumann 的意思。如果你跟我对于一般足球理论的认识一致,换句话说,也就是说如果你认为梅西对阿根廷队很重要,我也这样认为,这就可以说我们的“priors” 是一致的。也就是说我们两个理性的人就好比两台计算机,如果给我们完全相同的输入,我们可以计算出相同的结果来。

下面为简单起见,假设世界杯决赛是阿根廷对意大利。在决赛前夜,如果我向你宣布,我认为阿根廷队将获得世界杯冠军。而你向我宣布,你认为意大利队将获得世界杯冠军。这样一来我们两人的观点就被亮出来了,也就是说不但你知道我的观点,而且我知道你知道我的观点,而其你知道我知道你知道我的观点…. 这叫我们的观点是 “common knowledge”。

Aumann 的数学定理的伟大之处在于,我不必告诉你我为什么相信阿根廷队夺冠,你也不必告诉我你为什么相信意大利队夺冠,我们两人就可以最终就谁夺冠这个问题达成一致!

我们的争论过程大约是这样的:

我:我认为明天决赛阿根廷队将夺冠。
你:了解。但我认为意大利队将夺冠。
我:收到。但我仍然认为阿根廷队夺冠。
你:意大利队。
我:阿根廷队。
你:意大利队。
我:好吧,意大利队。

我们就这样达成了一致。

这个争论过程有点像古龙小说的情节,但并不好笑。当我第一次说我认为阿根廷队夺冠的时候,你应该了解,我一定是掌握了某些赛前信息才敢这样说,比如我深入研究过双方的实力对比。而当你听到我的观点之后却反对我的观点的时候,我就知道,你一定掌握了更强的信息。也许你有内幕消息知道梅西伤情严重上不了场。我不知道具体是什么信息,但我可以从你此时的态度判断这个信息一定很强。而我如果在这个情况下仍然坚持认为阿根廷队夺冠,你就得进一步了解我一定掌握更强的信息,比如我知道裁判向着阿根廷。以此类推,直到几次往返之后我发现你仍然坚持意大利队,那我只好认为你刚刚从未来穿越回来,于是我决定赞同你的意见。

所以两个理性的人只要进行古龙式对话就可以达成一致。据我最近看 The Big Questions 这本书介绍,更进一步,经济学家 John Geanakoplos 和 Herakles Polemarchakis 证明这个对话不可能永远继续下去 — 也就是说最后一定会达成一致。再进一步,计算机科学家 Scott Aaronson 证明,如果对话双方都是诚实的,那么这种对话可以在不太多的几步内结束。

有人可能会提出,前面说的一致的“priors” ,是一个特别强的条件。毕竟生活中的理性人并非都学习过足球理论。也许两个人对梅西的重要性有不同看法。但是这个“不同看法”也是可以通过古龙式争论达成一致的!所以我们可以说,两个真诚而理性的人应该对事情有相同的看法。如果争论不欢而散,一定是有人不诚实!

我做了一点小调研,这个理论有很多推论。比如说一个真正理性的人,如果他认为其他人也是理性的,那么他不应该买股票。为什么?如果他买股票,就必然有人卖这支股票 — 这就意味着两人对这只股票的升值前景(不一定是确切的预测,可以是一个概率)有不同看法。可是 Aumann 已经证明理性的人不应该有这种不同看法。

这个定理中所假设的理性的人,被学者成为“truthseekers”,真理追求者。如果我们是诚实的真理追求者,我们终将能够达成一致。

***

最后一点题外话。很多人认为搞科研主要是人跟自然的斗争,但真正的科研工作也包括人跟人干 — 不是说官僚主义或办公室政治,而是科学家跟科学家因为学术观点不同开打。从某种意义上讲,往顶级学术期刊投稿跟打仗差不多。所谓“Peer review”,也就是编辑找几个跟你同一领域也是搞科研的人来审查你的文章。一个最可怕的消息是,这帮人有时候跟你一样,常常以为只有自己才有资格在这个期刊上发文章。如果他们直接说你的结果不够重要所以不适合发表,那你基本完了。但如果他们说你的文章错了,则是一个比较好的消息,因为很可能他们错了。

你要做的是写一个答辩状,证明是审稿人错了。然后有可能会发生一件也许只有在学术界才能发生的奇迹:审稿人将承认错误,改变想法,允许你的文章发表。

生活中的成年人如果不被双规,很少承认自己的错误。一场日常争论之后没人会说“我以前想错了,原来是这样”。但是科学家可以。科学家也会拉帮结派,也会有各种偏见,也会以证明别人错了为乐,但是所有科学家有一个共同优点:他允许你改变他的想法。这种允许别人改变思想的氛围可以刺激人在审稿的时候采取更为大胆的态度。

为什么?因为科学家是真理追求者。实际上,搞科研的一大乐趣就是被别人改变想法!…

这个宇宙不是 Matrix

我们生活的这个宇宙,它是真实的么?

怀疑客观世界的真实性,是一个老生常谈。最早可能是庄子,说有一次梦见蝴蝶,当他醒来的时候,不知道是梦见蝴蝶的庄子醒过来了,还是一只蝴蝶正在做梦梦见自己变成庄子。在《楚门的世界》中,主人公一直到长大成人才发现自己周围的一切原来都是别人安排的戏剧。卫斯理有个小说《玩具》,最后结局是说人可能只不过是外星人的玩具而人不自知。一直到《Matrix》,这个思想变成我们可能生活在一个巨大的计算机程序之中,就好像在玩网络游戏。

你怎么知道你不是生活在 Matrix 之中正在打一个大网游呢?

从逻辑角度,唯一的正确答案是你永远都无法知道。不管你看到什么,不管你用什么方法,你都无法证明自己实际上不是正躺在一个充满液体的大缸之中,脑子被接上各种信号线,而你看到感受到的一切都只不过是幻觉。这个理论被称为哲学家称为“缸中之脑”。也许对大多数专业哲学家来说,“永远无法知道”就是这个问题的最终答案。

但是有两种人不满足于这个答案。第一种人是宗教人士,他们认为我们一定就是生活在一个神创造的大 Matrix 之中。第二种人是科学家,他们相信我们一定不是生活在一个大 Matrix 之中。我来介绍一下两派的论点,重点谈为什么一个真正的科学家应该持第二种观点。

有这么一帮人,他们并不宣称自己信教,不愿意拿上帝说事儿,但是他们认为我们这个世界是被“智能设计”出来的,这就是当今著名的“Intelligent Design”派。智能设计派之所以故意不提上帝,是因为美国禁止在学校里传教。这派人物说,“智能设计”,也许不是上帝而是外星人设计的,所以是个科学理论 — 既然你学校允许教进化论,就应该允许教智能设计论。

智能设计论有一个在我看来相当有力的论据:我们的这个世界是如此的复杂,而且是 “不可约的复杂”(irreducibly complex)。所谓“irreducibly complex”,是说一个复杂系统中拿掉任何一个东西,整个系统都毫无意义,所以这个系统必然是一下子同时出来的。比如说生命就特别复杂。一个简单例子是眼睛的视网膜和晶体。这两个东西谁离开谁都会变得毫无意义,所以谁先进化都没意义,所以他们必然是同时出现的。这就有一个问题了,如果世界是天然的,怎么可能一下子出现这么复杂的东西呢?所以这个复杂的世界必然是智能设计的。

进化生物学名著《自私的基因》的作者 Richard Dawkins,写了一本书,The God Delusion,对智能设计的这个论点做出了批驳。Dawkins 说,如果我们这个如此复杂的世界是被智能设计的,那么这位设计者必然比我们这个世界还要复杂。那么请问这位设计者本身是从哪里来的?他是更复杂的东西设计的么?你不能用一个更复杂的东西来解释复杂,因为复杂只能来自于简单,比如进化。

我最近看的这本 The Big Questions,作者 Steven Landsburg 是个热爱数学和物理的经济学学家,他则认为以上两个论点都错了。这两个论点都是基于同样的假设:复杂的东西不会一下子自动出现。 Landsburg 说,数学就是复杂的,而且数学就是一直都有,不需要进化也不需要被人发明的。

这里需要稍微解释一下。数学家一贯认为所有的数学理论都是客观存在,跟有没有人有没有数学家没关系。比如说费马大定理,在数学家没有证明这个定理,甚至没有提出这个定理之前,这个定理一直就在那里。数学家的任务不是“构建”数学,而是“发现”数学。这就好比说一座没有人探索过的山峰也是存在的山峰一样。

Landsburg 说,你智能设计能“设计”数学么?2+2=4是个逻辑问题,你外星人再怎么设计,也不能让2+2=5啊 — 除非是“无所不能”的上帝,但规则是不能说上帝,一说上帝你就输了。

而且数学还是 irreducibly complex 的,比如你把数字 3 拿掉,整个数学体系就完了。如果数学这么复杂的东西不需要智能设计,宇宙为什么需要智能设计?

我们可以看到,Landsburg 并没有证明“宇宙一定是天然的”,他只不过说智能设计者的论点错误而已。

其实 “宇宙到底是不是 Matrix” 这个问题本质上无法证伪,根本就不是一个科学理论。但我认为,宇宙“更可能”不是一个 Matrix。因为我有以下证据:

第一,Matrix 需要系统维护,而我们这个宇宙不需要。《魔兽世界》每星期二维护六个小时。他们要不停地发现错误,打补丁,升级,不停地完善。我们这个宇宙从来没发生过停摆维护的事情。

第二,宇宙实在太大了。设想如果你是一个“外星人”,你创造一个世界,然后在这个世界里放入一些生物作为“玩具”,你打算做多大的世界呢?宇宙之大,大到完全超出人类所有可能的需求的程度。

第三,宇宙的分辨率是无限的。假设你打网游,你在地上看到一棵草,你会发现你没有办法把这颗草一刀砍成两半。而在真实世界中,你可以把这可草分解成分子,原子,夸克。

第四,宇宙完全自洽地符合物理定律。网游的规则可以变来变去,物理定律从来没变过。不管是谁做实验,物理定律都让他做出来了。

如果我做了一个梦,我发现我在梦中可以做以上四件事,我就知道我其实不是在做梦。我在魔兽世界里做不到以上四件事,我就知道那个世界不是真的。如果某一天我看到在地铁站看到有人打电话打着打着突然消失了,那么这个明显的能量不守恒事件足以让我相信我正生活在一个 Matrix 之中。当然,我也仅仅是“相信”而已,我永远也无法证明,也许宇宙曾经系统维护过,只不过人类文明太短没赶上而已。

但我们这个宇宙最不可思议的一点还不是上面这四件事。它最不可思议的是,它居然是可以“思议”的。我们居然可以用数学方程来无比精确地描述物理定律。同样的方程,今天算对,明天算也对;在中国算对,在美国算也对。这个世界从来没辜负过物理学家的学说。不但如此,而且物理定律是一环套一环层层递进的,就好像几何学一样可以用更少的定律去解释更多的现象。宇宙凭什么这么精确地按照定律行事?宇宙的定律凭什么允许你“发现”它的定律?

正因为这个世界太精确了,我们知道假设真是上帝“创造”了宇宙的话,他在创造的时候其实手里没有多少自由。他不可能像暴雪创造魔兽世界一样今天这么干明天那么干。这种不自由的创造,还能叫创造么?

科学家为什么必须相信宇宙不是智能设计的?因为他必须相信宇宙是讲理的。他还必须相信他可以跟宇宙讲理。…

科研的格调

The Big Bang Theory (《生活大爆炸》)是个很有意思的美剧,它说的是四个年轻物理学家的故事 — 或者说是他们的泡妞故事,如果你乐意的话。不知怎么,现在物理学家似乎正在变成令人感兴趣的人群,套用剧中 Leonard 的话,简直是 we are the new alpha males. 在四位男主角中,最有意思的是 Sheldon Cooper,我猜别人也会这么想。

Sheldon 非常聪明,而且他处处要告诉别人他非常聪明。物理学家聪明很正常,但 Sheldon 还非常博学甚至无所不知,他号称对世界上所有重要的事情都有一个 working knowledge. 这种人存在么?《新京报》曾经就这个问题采访过该剧的物理负责人。答案是有些物理学家就是这么博学。

比如说因为夸克理论获得诺贝尔物理奖的盖尔曼(Murray Gell-Mann)就是这样的人。我认为盖尔曼是 Sheldon 的原型。第一,盖尔曼曾长期呆在加州理工,只不过他的职位是教授而 Sheldon 是博士后。第二,盖尔曼非常聪明,而且处处要告诉别人他很聪明。比如他喜欢用外国当地的标准发音来读一个外国人命或地名(好吧,我承认这一点似乎更像剧中的 Howard )。这个逼着别人承认不如自己聪明的毛病使得盖尔曼和 Sheldon 一样不受周围人的欢迎。第三,盖尔曼非常博学。比如说,所有物理学家都知道彩虹是怎么回事;很多物理学家知道是笛卡尔第一个科学地解释了彩虹;但如果你想知道古人怎么看彩虹,你得问盖尔曼。盖尔曼会告诉你各个古文明对彩虹的解释。

我甚至觉得 Sheldon 的长相也有点盖尔曼的意思。我还真找到一张盖尔曼年轻时的照片。

上边是盖尔曼,下边是 Sheldon.

但本文真正要说的是盖尔曼和 Sheldon 的第四个共同点:两人都看不上,甚至可以说看不起,理论物理之外的任何科学。

Sheldon 的姐姐有一次说,她很自豪 Sheldon 是个 “rocket scientist”。注意这里面有个典故,英文中 “rocket science” 是个成语,指任何特别复杂的东西。比如你想说什么东西很简单,就说这个东西不是 rocket science.

但 Sheldon 认为被当成 “rocket scientist” 是一种侮辱。他说你还不如说我是金门大桥上的收费员。在 Sheldon 看来,理论物理学家比火箭科学家要高级得多。

盖尔曼也是这么想的。在盖尔曼看来,纯粹的理论物理,也就是说专门研究基本粒子相互作用,超弦理论这种理论物理,是最高级的科学。因为这种科学研究的是世界的最基本定律,而其他所有学科只不过是应用这些定律而已。

《费慢的彩虹》这本书生动地形容道,盖尔曼这种纯理论物理学家看其他学科,就如同站在曼哈顿往西看整个美国。新泽西地区相当于其他的理论物理工作,中部相当于实验,而再往西一直到加州,则到处都是中国城之类完全没格调的东西,相当于各种应用科学,比如说半导体之类。

物理学的格调比化学高,就如同福赛尔《格调》说网球的格调比足球高一样。盖尔曼就是这种人。《费慢的彩虹》的作者当初也在加州理工当 faculty,本来是想做超弦的,办公室就在盖尔曼隔壁。结果他后来改做量子光学,盖尔曼立即打发他去别的楼层办公,把办公室腾出来给自己的研究生用。此书作者还曾经尝试写剧本,立即被自己的研究生导师鄙视,因为他认为好莱坞都是垃圾。剧本的格调还不如小说。

我想看到这里,很多读者要愤怒了。(Disclaimer: 我是做物理的。但我并不是做理论物理的,所以我也不在曼哈顿 — 如果这可以让你好受一点的话。)

其实这种格调也许并不存在。盖尔曼在加州理工的对头,费曼,就不赞成这个态度。费曼对所有物理领域都感兴趣,他从来不认为量子光学是比量子色动力学低一等的科学。

其实盖尔曼和费曼对其他学科态度的不同,一个原因是二人的科学理念有不同。盖尔曼这一派的物理学家追求逻辑和数学的完美,在他们眼中所有学科是以理论物理为核心的金字塔型。而费曼则有一点实用主义,他最关心的是怎么解释自然现象,而不怎么追求数学上的完美。实际上,费曼说,为什么非得追求一个统一理论?也许自然就是给四种力四个理论。我想费曼眼中的科学世界不是金字塔,而是是一个互相平等的网络结构。

但费曼的确认为物理学比小说要难。因为小说的想象不需要负责,而物理的想象有一个实验判决。不管你多么喜欢你的理论,跟实验不符就是不行。

实际上,费曼鄙视很多东西。费曼极度鄙视哲学,连他的秘书都知道千万别跟费曼谈哲学。费曼还一度强烈鄙视超弦(但在最后时刻还是跟盖尔曼学了一点超弦)。另外,我们已知的还有费曼鄙视心理学,认为心理学全是扯淡。

我的问题是,既然所有学科中都有“道”,盖尔曼的格调论,和费曼的鄙视,是合理的么?

我认为它们是不客观的,但是是有道理的。因为一个人如果对所有东西都感兴趣,他将无所适从。也许要想干好一行,就必须爱这一行。而爱这一行,就意味着“不爱”其他的行。所以一个科学家应该学会从心理上“鄙视”自己专业以外其他学科。

科学本身是客观的,但科学家都是主观的。最好的科学家甚至可能是极度主观的。有爱恨,才是真正的科学家。敢说不,才是真正的科学家

所以欢迎化学家们给自己找一个充分的理由来鄙视物理学。

祝大家新年快乐:)…

笔记本就是力量

这几天我在参加一个物理会议,说了听了想了很多物理问题。这个状态下好像不太适合写博客,但我有一个非写出来不可的重大发现。我通过仔细观察,发现所有顶尖物理学家的一个共同特点:他们都有笔记本电脑。

以上是一个可能开的不怎么样的玩笑。本文想说的其实不是笔记本电脑,而是笔记本。达芬奇,钱钟书,和费米,他们的共同点是什么?他们都有一大堆笔记本。

做笔记,似乎不是一个特别酷的行为艺术。学校里一般只有女生才老老实实地记笔记。我的高中物理老师有一次说,他希望得到的最佳毕业礼物是我们工整的课堂笔记 — 这句话降低了他在我心中的形象。本文不研究课堂笔记。我们关心的是那种能让人获得无上智慧和力量的笔记本。科学家试炼这种笔记本,就如同魔兽世界里的猎人培养自己的宠物一样重要。

达芬奇的笔记本就杂乱无章,上面全是各种看上去互不相干的心得,想法,实验记录和设计。钱钟书不藏书,再好的书也是看完就顺手送人。但他读书几乎必做笔记,读书笔记永远保留,随时拿出来用。费米的笔记本简直是一个传说。传说中,费米喜欢每周跟一大帮学生聚会,一般是让一个学生提出某一方向的物理问题。然后费米就会找出自己在这方面的笔记。一直到临终之前,他仍然在试图整理笔记本。

如果他们都是最聪明的人,为什么要下这种“笨功夫”?在回答这个问题之前,我们先思考一个新问题:在搜索引擎时代,知识还是力量么?

可能有人认为知识不是力量,“获得知识的能力才是力量”。我对此的回答是,这种人一点知识没有。

有人错误的认为人脑就如同计算机的 CPU 和内存,讲究越快越好,而硬盘的大小对于计算性能来说无关紧要。这种人需要想想为什么计算机下围棋赢不了人。

早先的计算机下国际象棋程序是这么设计的:我遍历所有可能的走法,然后对每一种走法我再遍历所有你可能的应对,然后我再遍历对你的每一种应对的所有可能的应对….. 期间我对每一个局面判断优劣。人无法做到这一点,这样一来计算机就可以凭借其计算速度取胜。但事实结果是这样的计算机根本不是人类棋手的对手,因为这种算法发散的太厉害。也许一台超级计算机能这样算出去十几步,可是最后还是人类取胜。

因为职业棋手不是这么下棋的。在职业棋手眼中,象棋是一门语言,定势就如同诗句。象棋大师的计算并不比一般选手多,他们只是象棋知识多。为什么高手可以跟几十个人下“盲棋”而不必担心记不住局面?因为在普通人(和早年的计算机下棋程序)看来,棋盘上的棋子是一个一个的;而在大师看来,棋子是一块一块的。事实上,有实验证明,如果是实战残局,大师的记忆力比普通人高得多;而如果是随机摆放的棋子,大师的记忆力与普通人一样。普通人记的是字母,大师记的是词汇和段落。现在的下象棋程序,比如“深蓝”用的,其之所以成功,就在于它也学会用定势来思考了。为什么再牛的大师也要每天打谱?因为下棋比的不是计算速度,而是棋的知识。

真正的专家,都有自己的一整套知识体系。这套体系就如同他们心中的一棵不断生枝长叶的树,又如同一张随时变大变复杂的网。每当有新的知识进来,他们都知道该把这个知识放到体系的什么位置上去。有人管这套体系叫做 mental model, 有人管它叫 matrix。有了这套体系,你才可能对相关事务作出出神入化的“眨眼判断”,而不是靠什么“灵感”或者“女人的直觉”。

普通人把鱼按形状分类,而一个有知识体系的渔民则把鱼按巡游习惯和商业价值分类。真正懂音乐的人听同一首贝多芬要听很多种不同版本,有知识体系的油漆工可以识别十六种不同的白色。新手消防队员只看到火,而有知识体系的老消防队员看到的是一个有起因有发展有结局的故事。有知识体系的科学家,一眼就能看出什么方向重要,什么不重要。

怎样建立自己的知识体系?第一要主动学习。现用现学是一个巨大的能力,但是是不够的。要为完善自己的知识体系而学。做笔记是个好办法。我们看杨绛怎么描写钱钟书做读书笔记

他做笔记的习惯是在牛津大学图书馆(Bodleian——他译为饱蠹楼)读书时养成的。因为饱蠹楼的图书向例不外借。到那里去读书,只准携带笔记本和铅笔,书上不准留下任何痕迹,只能边读边记。

这段话充分说明为什么钱钟书以大师身份进入历史,而杨绛则以大师的老婆留名。钱钟书是在完善自己的知识体系,她却反复强调什么因为图书馆向例不外借!

我读到好书,也会做点读书笔记。如果你没做过,你不会有我的感受:写读书笔记太累了。正如钱钟书说的那样,到写读书笔记的时候,才发现很多读第一遍没有读出来的意思。在写笔记的时候要把一本书融会贯通,要记下自己的感想,甚至要跟作者对话。读各种闲书是我的业余爱好,只能使用零散的时间。在读闲书时间里我有三件事可以选择:读一本新书,写篇博客,或者写读书笔记。其中我最不愿意做的事情就是写读书笔记。实在是最高强度的脑力劳动。相比之下,反倒是科研笔记更容易写。

建立知识体系的第二要点,是要把新的知识跟自己已有的知识联系起来。一般人善于发现新事物的不同点,而真正的高手则善于发现共同点。所谓消化吸收的本质,正在于此。有些读书太多的人之所以死板,就是因为他机械地读,而没有建立一个体系。

把一本书买回来放在书架上,不等于拥有这本书。把 pdf 文件放在硬盘上并却确保能够全文搜索,不等于拥有这个文件。藏书是一个很迂腐的行为。我虽然没有修炼到钱钟书看完随手送人的境界,但我能够做到追求看过,而不追求书架或硬盘上有。

刚开始念研究生的时候,我把看过的物理论文按内容加标签,而现在我一律按照作者名字加标签。你跟我提一篇物理论文,我不记得这篇文章的标题是什么,但我记得它的作者是谁,哪年发表的。所有的物理学家都是如此。当你对一个领域足够了解,你就会构建一个知识体系,在这个体系里,谁做的什么工作一目了然。…