​载人航天的确是形象工程

关于载人航天,我想说两个一般人可能不太知道,或者不太愿意承认的事实。

第一,载人航天主要是个形象工程

航天很有用,但真正有用,能带来大规模经济效益和科研应用的航天活动,是卫星、太空望远镜和深空探测器,这些都是不需要载人的。

有人可能说宇航员可以在太空修复望远镜,NASA可能对外也会这么说。但有科学家(比如 Richard Muller)认为,这种行为的实际意义并不大。望远镜坏了怎么办?最好的办法是直接发射一个新的。载人航天,是一个非常贵而且也非常危险的活动。

有人可能认为航天员可以做实验。但事实是并没有多少实验非得让人上去做不可。Freeman Dyson 在一次演讲中说,他曾经加入一个政府委员会,审查48个要在空间站上做的实验,来证明发射空间站的必要性。结果他们发现其中46个实验在实验室或者卫星上做更好,根本不许要空间站。剩下的两个的确不得不在空间站上做,因为它们是关于“空间站中宇航员的生存问题”。

中国神舟九号上做的实验,大部分,如果不是全部的话,也是为了“空间站中宇航员的生存问题”。换句话说搞载人航天做实验的主要目的是……继续搞载人航天。

实际上,如果不是关于宇航员生存的实验,那么即使不考虑载人的成本和风险,不载人也比载人好。宇航员的存在会产生热辐射等噪音,对太空实验来说是一个干扰。不但如此,很多科学家抱怨为了等载人任务,实验或者被延误,或者成本变高。

有人说登月可以开采核聚变原料氦3,这个借口找的,就如同一个小学生说他看《黑客帝国》是为了将来学习编程一样。要知道我们现有的技术连最简单的氘氚聚变都遥遥无期!而氦3聚变要困难得多,而且就算100年后真实现了,也未必值得开采的成本。

所以不管是中国,美国,还是前苏联,载人航天的都是形象工程。这三个国家的区别是前苏联理直气壮地就要搞形象工程,而中美两国政府总觉得搞形象工程很不好意思。

其实形象工程也有很多实际的利益,比如可以带动相关领域科研的进步,培养一大批人才等等。这还不算美国的“星球大战计划”这个形象工程拖垮了苏联。

但我要说的是,就算没有这些“实际利益”,也应该搞形象工程。

第二,搞形象工程就是搞民生

有人认为任何一个花了很多钱活动,如果最后一算投入产出比没赚到钱,那么就是形象工程,就是不应该搞的。比如中国举办个奥运会,就必须想尽一切办法证明最后赚钱了,否则公知们就会骂。

但事实是,在绝大多数情况下,举办奥运会也好,建个体育场也好,投资足球俱乐部也好,就算你把所有直接和间接的经济效益全算上,本来就不赚钱。每一个申办国和投资者心里都明白这一点。Soccernomics 这本书,就引用了一些经济学家的研究来说明这一点。

干这些事情的最主要好处是让人民(包括纳税人)高兴。更多的金钱并不意味着更多的幸福。越是发达国家,金钱跟幸福之间的关系越不明显。但是经济学家调查发现,举办世界杯却可以显著提高一个国家的幸福度。我们的确会看到有人抱怨说这比赛使我们城市交通不变了等等,但大多数人的情绪是高兴的。向荷兰和法国这样的国家,想让国民获得跟举办世界杯同样大的幸福度提升,需要让他们每月收入增加数百美元才行。

为什么要搞载人航天?因为老百姓喜欢看载人航天。

有人一谈论自己,就说对我来说金钱不是一切,精神生活比金钱重要,这就是为什么我宁可花那么多钱出国去看演唱会。可是一谈到别人,就成了只认钱的底层。如果中国政府说这次神州九不发射了,把省下来的钱平均分给全国每个人 — 你怎么就知道人们就会更高兴?

假设上世纪九十年代,有两个都不怎么富裕的家庭。一个家庭有点钱就吃喝了,另一个家庭却省吃俭用,买了一台通常只有富人才会买的电脑。我觉得这第二个家庭才是真有出息的家庭。…

工作输给机器人以后……

(《东方早报·上海书评》,2012年3月25日)

在《超级魔鬼经济学》这本畅销书中,作者非常庆幸,同时又非常得意地讲了一个关于马车的故事。今天反感汽车尾气的人可能会认为马车这种纯天然的交通工具更环保一点,但历史上马车其实是个环境灾难。在没有汽车的时代,马车是城市交通的主力,越是发达的城市就越需要马车。然而跟机器相比,马是有自己的想法的,所以马车其实很容易失控。不但如此,如果一匹马垮倒在街头,通常你唯一的办法就是把它当场杀死,然后要等它的尸体腐烂以后才能被切块清除。这一切都使得马车造成的交通堵塞比今天汽车要严重得多。这还不算马粪!纽约市曾在1898年召开国际会议研究马粪问题,结论是根本没办法。

故事的结局皆大欢喜。当所有人都束手无策的时候,汽车和电车出来彻底解决了马车带来的所有问题。所以魔鬼经济学家乐观地告诉我们,也许将来会有新的技术出来,以意想不到的方式解决我们今天面临的诸多危机。

他们说的一点不错。在这本书出版不到三年之后,我们可以非常自信地说,至少城市交通堵塞问题,将会再一次被新技术解决。然而这并不是本文想说的重点。

我想说的是,品味马车故事还有另外一个角度。20世纪初那个马车时代,纽约市大约有20万匹马,相当于每17个人一匹马。这些马后来都哪里去了?

被淘汰了。马,是汽车这种新技术的牺牲品。现在又有一种新技术,叫做自动行驶汽车。而司机,将是这种新技术的牺牲品。

2009年之前,像电影《我,机器人》里那样会完全自动行驶的汽车还是科幻范畴。那时候最先进的智能汽车或者需要在路边安装特定的感应器,或者只能愚蠢地以车队的形式跟随前面一辆有人驾驶的车。然而2010年,纽约时报突然报道说 Google 正在测试一种真正的自动驾驶系统,这套系统被安装在普通的丰田Prius上,使用摄像头探测周围环境,在加州的大街小巷行走自如。这样的进步几乎让人不敢相信,然而根据《连线》的最新报道,这套系统已经做成了。

这些车可以在任何路况行驶,可以达到120公里的时速,可以识别交通信号,智能跟踪判断路上其它车辆和想要穿越马路的行人,并以每秒20次的频率预测这些物体未来的位置。如果临道有辆车开得不好,智能车甚至知道怎么躲避它。《连线》说,跟人类司机相比,智能车”能注意到更多信息,能对紧急情况做出更快反应,能对付更复杂的路线。它从不惊慌。它从不愤怒。它甚至从不眨眼。”我记得之前曾有报道,在整个超过20万公里的测试中,这些智能车只出过一次轻微事故,而且还是人类司机代驾造成的。

一言以蔽之,自动驾驶系统不但能够取代人类司机,而且应该取代人类司机。鉴于高达93%的碰撞事故都是人的原因导致,采用智能车可以大大减少交通事故。不但如此,既然人工智能可以更精确地控制汽车,公路上两辆车之间的距离就可以在高速状态下保持得更近,从而大大缓解交通拥挤。也许十年之后人们会发现让人开车是一件非常不可理喻的事情 — 用Google自动驾驶项目的负责人话说,”The fact that you are still driving is a bug, not a feature.(你仍在开车这件事是个错误,而不是功能)”

我们可以设想一下这意味着什么。这远远不仅仅是我们可以在路上睡觉或者发短信的问题。更重要的是,出租车将会大行其道。结合手机应用和定位系统,每个人都可以随时随地打到车。而且更智能化的打车系统还允许乘客顺路的情况下拼车。这样的效果就是车的”空载率”(也就是无效驾驶的比例,比如说把车开会家或者开到停车场)将会下降。这样完成同样的运载,公路上将会有更少的汽车。私家车有可能会大大减少。

但这还意味着而出租车司机将会成为历史。作为消费者,我们欢迎这个变化,因为打车贵就贵在司机,想想租车有多便宜就知道。可是那些出租车司机,那些公共汽车司机,那些跑长途运输的卡车司机,他们又该怎么办呢?

他们的职业将会像马一样被技术进步所淘汰。当然这也不是什么新思想。十多年前我们发个传呼,得打电话到寻呼台,然后会有一个真人接听你的电话并帮你发。而现在我们直接发手机短信,那么寻呼员就被淘汰。我们曾经必须去银行取钱,而现在满大街都是ATM,银行就不再需要那么多窗口服务员。这些事情并没有那么可怕,因为技术进步淘汰旧职业的同时也在创造新职业。比如说,30年前中国根本就没有”程序员”这个现在相当普遍的职业。

但是这一轮进步和淘汰不像以往那么简单。在MIT的两个经济学家Erik Brynjolfsson和Andrew McAfee的新书《与机器竞赛》(Race Against the Machine)中,作者提出,以人工智能为代表的技术进步不但即将,而且正在导致大规模失业。

人们曾经认为开车是一个不可能被计算机掌握的技能,然而现在Google证明人工智能可以开得更好。翻译将是另一个濒危职业,因为2011年Lionbridge和IBM联合推出的一个叫做 GeoFluent 的技术已经可以对网络聊天信息进行非常准确的实时翻译(包括中文!),至少对商业应用来说,自动翻译已经成熟了。与此同时,IBM的超级计算机Watson,对人类语言知识的分析已经到了可以在传统提问游戏电视节目Jeopardy!中击败人类选手的程度。所有这些进步都是基于模式识别和复杂信息交流这两个基本技术的突破。如果你用过新iPhone中的Siri,你应该对这种技术已经有所体会。

所以现在就不仅仅是司机和接线员的问题了,传统上的”高端”职业也会被淘汰。美国一个放射科医师需要十三年的专业训练,他可以拿到超过30万美元的高年薪,可是现在最新的模式识别软件可以做绝大多数他能做的事情,所需花费不到百分之一。打大的商业官司,往往需要雇佣一整个团队的律师去分析有时候高达上百万份相关文件,花费上百万美元。而2011年纽约时报报道,现在这些事情都可以让一个叫做Blackstone Discovery的软件去做,它使得一个律师可以完成以前500个律师的工作,而且对比表明人类律师的准确率只有它的60%。

使用美国的经济数据,技术进步减少就业这个事实是可以观测到的。最明显的事实就是经济在增长,而就业机会和工资收入却在不增反退。如果只看GDP的话,甚至可以说经济衰退早在2009年6月就结束了,此后连续7个季度的GDP增长率是2.6%,这已经达到过去30年平均增长率的75%。现在美国公司利润是在历史最高水平。到2010年,公司在设备和软件上的投资水平已经恢复到了历史顶点的95%。可是现在美国失业率却仍然保持在9.1%。可以说与二十世纪初经济大萧条后的恢复相比,现在的经济恢复唯一欠缺的就是就业。

经济增长的真正驱动是提高生产率,也就是每个工人每小时能够创造的产值,而不是就业人数的增加。一个越来越明显的状况就是,财富是被少数人通过操纵资本、机器设备和软件创造出来。十九世纪大部分时间内生产率的增长速度是每年1%,而过去十年则是2.5%,2010年更达到了4%。为什么现在生产率提高这么快?经济学家们的意见相当一致:这是因为IT。是自动化在提高生产率。

而以技术为驱动的经济增长,受益者不是普通人。按经济学家Ed Woff的计算,美国从1983年到2009年所增加的全部财富,都被只占人口比例20%的富人拿走了。而且这还不够,富人顺便还拿走了一部分原本普通人的财富,以至于剩下这80%的人的总财富是减少的。过去十年美国工作年龄家庭的收入中位数,从六万多美元下降到了五万五千美元。富人并没有使用什么阴谋诡计进行强行掠夺,他们的方法甚至可能是不自觉的:现在生产率提高了,根本不需要花钱请那么多人来工作,机器就可以干这些事情 — 而机器在我手里。

IT是一个只需要很少的人就能创造很大财富的技术。现在人人都在谈论Facebook上市,有人对它估值一千亿美元,可是这个公司总只有3000个员工。Twitter只有300人。维基百科只有57人。这些人可能还没有垄断全球信息市场,比如中国就需要有自己的Facebook,有自己的微博,有自己的百科。我不知道这些中国公司能多雇佣多少人,但是不管怎么算,我们都不需要一百个能贴大头贴的社交网站。可以说,这些加起来最多几万人已经解决了大部分人的上网需求。也许有成百上千倍的家长希望自己的孩子将来能去Facebook工作,但这个世界可能根本不需要把程序员总数再增加十倍。

《与机器竞赛》这本书指出,在于机器进行的这场比赛中,有三类赢家和三类输家。高技术工人将是赢家,而低学历者将是输家,因为机器人将会迅速取代他们的工作。但是这里的”高技术”其实已经不好定义,传统上我们认为律师和放射科医生属于高技术,而现在他们也将被取代。在这个问题上诺贝尔奖得主Paul Krugman有一个更悲观的看法,他在一篇博客中写到,在IT技术的冲击下,也许更多的高等教育已经意义不大 — 统计表明过去十几年大学学位给人带来的工资附加值已经不增长了。

超级明星是赢家,第二名及其他所有人都是输家。刘翔最火的时候,所有要用到体育明星的广告都想找刘翔。对比之下,也许史冬鹏的速度可以达到刘翔的99%,但他能接到的广告个数?0。这是因为信息技术可以把超级明星生产的产品无限放大,把普通市场变成胜者通吃的市场。

资本是赢家,劳动者是输家。在劳资市场上,资方的议价能力被显著增强。统计表明经济衰退以来企业用于购买软硬件设备的投资增长了26%,而人力成本却根本没有增长。美国商务部统计,现在企业利润占GDP比重正处在五十年来最高点,而与此同时劳动者获得的工资和各种补贴则是五十年来最低点。

此书两位作者很想给读者许诺一个光明的未来,所以他们提出了一点建议。首先,现在人工智能的长项是模式识别这样相对比较重复的工作,而机器还不擅长的则是解决问题的能力、灵感和创造性。对此作者建议我们应该学点艺术,学点创新,学点领导力,学点企业家精神。其次,与其跟机器竞争,不如带着机器一起跟别人竞争,未来属于那些善于利用机器的人。最后,既然第二名没有意义,我们可以开辟各种细分市场,在一个新的小领域内当第一名。这其实是个”不占一帅就占一怪”的策略,也许足球踢不好的人应该改踢室内足球?

Thomas Friedman显然特别支持这些建议。他在今年一月份的一篇专栏中说,Average is Over,普通已经没戏了。在人工智能的代,那些拥有普通的技能,做着普通的工作,拿着普通的工资,过着普通的生活的普通人,必将被自动化淘汰 — 就算人工智能还不能淘汰你,中国工人也会淘汰你。可是怎么才能让一个普通人变得不普通?Friedman肯定没读过前面Krugman的博客,因为他给的答案是上大学。

其实以上这些建议根本解决不了就业危机。世界任何时候都不需要一亿个电影演员,或者三亿个科学家,或者十五亿个企业家。每次我去剃头,遇到的理发师都爱调侃我头发怎么这么密。我经常对自己说好好享受理发师的抱怨吧,也许将来她们都会被不说话的机器人取代。可是到时候这些理发师怎么办呢?也许其中有人会成为专门为我这种头大加头发密集者的细分市场设计发型的艺术家?这样的艺术家能赚到钱么?

就算是对那些排在社会前面20%的人,那些跑赢了机器的人来说,高失业率也是个坏消息。有一个著名的故事说,亨利福特二世领着汽车公会主席参观一个现代化的汽车厂。福特自得地跟工会主席开玩笑:”你打算怎么让这些机器人给你交会费呢?”是啊,你们不是罢工么,你们不是要高工资高福利么?这回我全换机器人你还能怎么办?但工会主席毫不迟疑:”你打算怎么让它们买汽车呢?”如果80%的人都没钱,你们20%的生产力再强也没用。

有一种说法认为中国过去三十年的经济增长主要靠的就是廉价劳动力。这种说法等于说中国在跟人工智能竞争。如果这就是中国的经济模式,那么本文要说的就是中国即将输给机器人。事实上,富士康正在用机器人取代工人。现在富士康已经有一万个机器人,明年将增加到三十万个,三年内将增加到一百万个。这些机器人每台的成本是14万元,它们24小时不间断工作,而且绝对不会自杀。郭台铭说:”富士康的年轻人将重新学习操控机器人软件、应用和维修,变为机器人的应用工程师和软件工程师,通过操作机器人的手和关节来完成生产。”他没说到底有百分之几的工人可以变成工程师。其实富士康的工会主席 — 如果富士康真有工会的话 — 也可以问问郭台铭他打算把机器人生产出来的iPhone卖给谁。

有句谚语说如果马有投票权,世界上不会有汽车。而事实是就算马有投票权,它们还是会被汽车淘汰。生产力进步不可违。现在这个过程中的大失业,已经成为一个明显的威胁。纵观最近西方对这个问题的讨论,不管是本书,Krugman,Friedman还是《经济学人》的评论,结论基本上都可以用”此题无解”来概括。也许这就是市场经济的本质缺陷。也许马克思说的是对的:世界上的总工资买不起世界上的总产品。也许只有共产主义才是人工智能的朋友。…

科学新闻没告诉你的那些事儿 4

怎样才算主流科学?

(果壳网)

“主流科学”在很多情况下并不是一个好词儿。科学记者眼中的主流科学界也许是一座可以威慑众生的殿堂,而对那些敢想敢干的年轻人来说,你跟他说主流科学认为怎么怎么样,他的第一反应是怎么证明这是错的。“主流科学”,在某种意义上是固步自封甚至以权压人的代名词。比如2011年诺贝尔化学奖得主谢赫特曼,在做出其获奖工作(发现准晶体)后相当长的一段时间内,就曾经饱受“主流科学”的打击。据新华社一篇文章报道,

他面对的是来自主流科学界、权威人物的质疑和嘲笑,因为当时大多数人都认为,“准晶体”违背科学界常识。“当我告诉人们,我发现了准晶体的时候,所有人都取笑我。”谢赫特曼在一份声明中说。

这个报道不能算说错。谢赫特曼本人的一个采访视频说的可能没有这么夸张,但仍然有点悲愤的情绪。准晶体被发现了,主流科学界却没有接受。既然如此,那么现在主流科学界拒绝接受的很多东西,将来是否也都有可能被证明是正确的呢?“主流科学”到底是不是一个贬义词呢?

本文试图通过仔细分析这个事件,来说明一个关于科学进步的道理。当然根据孤证不举的精神,你不能讲一个故事就说明一个道理 — 所以我们讲三个故事。

在谈论诺贝尔奖之前,我们先看主流科学是怎么让一个著名理论得不了奖的。

大陆漂移学说的故事

在《难以忽视的真相》纪录片的一开头,戈尔说了一件相当令人感叹的事。他说他六年级时候的一位同学,曾经在课堂上面对世界地图当场指出南美洲大陆似乎曾经跟非洲大陆是一体的。这其实就是大陆漂移学说,现在已经成了科学常识。然而戈尔上小学的那个年代这个学说还没有被“主流科学”接受,以至于他的老师立即告诉学生这纯属无稽之谈 — 根据戈尔说的戏剧性结局,后来这位具有非凡眼光的学生成了一事无成的毒瘾者,而老师却成了布什政府的科学顾问。

也许某些教育专家会痛心疾首地说“你看,天才就这么被扼杀了”。可是如果你是一个科学老师,你会怎么样呢?不管别人提出什么新奇的想法,你都鼓励“是啊,这真是个有意思的想法,我认为它有可能是对的”么?可是这样一来你所能提供的有效信息其实等于零。“一切皆有可能”,就是一切都不太可能。真正的科学家应该敢于直接了当地告诉别人哪些想法不可能正确 – 总统科学顾问更得有这个气质。哪怕最粗暴的判断,也比廉价的鼓励值钱。

早在1912年,也就是戈尔的小学同学出生之前,魏格纳(Alfred Wegener)就提出了大陆漂移假设,认为地球大陆最早是连成一片的。传说他也是看地图得到的灵感,但魏格纳并不是用小学生思维搞科研。除了各个大陆的形状看上去似乎能合在一起,他还有其它证据。一个很有说服力的论点是各大陆发现的古生物化石惊人地相似,乃至一些现代生物也是如此。鉴于这些生物不太可能渡海走那么远,唯一的解释似乎就是原始地球上这些大陆本是连在一起的。更进一步,人们发现几个不同大陆上有相同的岩石构造。不但如此,漂移学说还可以解释一些此前人们想不通的问题,比如说南极大陆上为什么会有煤 – 要知道煤是古代植物累积形成的,南极那么冷怎么会有这么多植物?

面对这么多证据,一般人也许会认为大陆漂移是显然的。但科学家不是一般人。卡尔萨跟说,“Extraordinary claims require extraordinary evidence”。超乎寻常的论断需要超乎寻常的证据。生物化石最多只能算间接证据。而一个论断想要被科学全面接受,除了要求超乎寻常的证据,还必须有一个机制。

关键是,科学家想不通为大陆怎么能漂移。比如,分裂大陆需要极大的能量,这些能量从哪里来?魏格纳曾经提出几个假说,都被一一否决了。结果大陆漂移学说在半个世纪内都是被主流所否定的。一直到后来人们发现地质板块边缘火山喷发和地震可以提供能量,并且的确发现了火山曾经在不同时期喷发的证据。再加上其它证据,比如发现海底岩石比陆地岩石年轻,才以“板块构造理论”承认了大陆漂移。这时候魏格纳已经死了。如果今天论功行赏,魏格纳提出的东西只能叫做“假说”,甚至连科学理论都不算。

这还是听起来合理的理论。而那些听起来不合理的理论,则就算你有证据也不太容易被接受。当然好消息是这样的理论一旦被接受,没准就是诺贝尔奖。

诺贝尔化学奖的故事

历史就好像非诚勿扰舞台上的女嘉宾。你离着很远看,和把她领回家细看,看到的东西都是真实的,但你可能会有不一样的人生感悟。新华社的报道相当简略。我们如果把谢赫特曼的讲话视频、一篇被广泛转载的英文报道、一个背景知识的介绍、以及以色列某杂志的一篇写得非常牛的长篇报道放在一起看,就会看到一个更有意思的故事。这个故事的每一步都值得深思。

谢赫特曼1982年在国家标准局的本职工作并不是去探索晶体科学的新突破,而仅仅是为航空工业寻找合金材料。不但如此,当时晶体理论已经相当成熟,什么样的原子对称结构能形成晶体是明明白白写在教科书上的。人们根本没指望发现新的晶体形态,就算发现也轮不到谢赫特曼。

某天上午,谢赫特曼用电子显微镜测定了他自己合成的一块铝锰合金的衍射图像,发现是一个正十边形的对称结构 — 对寻常晶体来说这是一个不可能的对称性,因为从数学上很容易证明你不可能用正十边形(或者简化到正五边形)去周期性地铺满平面。谢赫特曼认为这是一种全新的晶体,它的特点就是只具有准周期性,也就是“准晶”。

如果我们只看简单的新闻报道,下面的故事就是谢赫特曼跟每一个同事通报这个新发现,但是没人相信他,人们都认为晶体就应该是周期性结构,实验组领导指着教科书说他胡扯,然后把他赶走了。但这里有一个问题:衍射图像是明摆着的,难道他的同事们连十都不会数么?

事实上,同事们对他的这个衍射图像有一个解释:孪晶。人们早就知道孪晶可以出现类似正五边形旋转对称的衍射图像,但并不是一种新晶体。谢赫特曼进一步观察,他找不到孪晶,坚持说这是新晶体。现在的局面是同事们相信这种衍射图像有一个解释,谢赫特曼不接受这个解释。但不利的是,他也不能提供别的解释。

科学要求解释。你不能说“我看到这个现象,而你们解释的不对,所以它一定是个新东西”。全世界的实验室中可能每天都会产生一些看上去不太对的实验结果,它们中的绝大多数是……不对的。一个有个人荣誉感的科学家不会看到什么都发文章。你得给一个理论。1983年,Ilan Blech 帮谢赫特曼搞出了一个数学模型,二人这才决定发表论文,结果被APL编辑据稿。接下来谢赫特曼回到国家标准局,在John Cahn帮助下进一步完善了数学,然后找到一位真正的晶体学家Denis Gratias入伙,最后文章被PRL发表。

到这一步,“准晶”这个发现才算被正式的提了出来。谢赫特曼在论文中详细说明了这个特殊合金的制备过程,使得很多实验组重复验证了他的发现。然而一直到这一步,仍然只有少数科学家接受这是一种新晶体。

关键在于,谢赫特曼实验使用的是电子显微镜,而晶体学界的标准实验工具是更为精确的X射线,他们不太信任电子显微镜的结果。不能用X射线的原因是生长出来的晶体太小。一直到1987年终于有人生长出来足够大的准晶体,用X射线拍摄了更好的图像,科学家中的“主流”才接受了准晶的发现。这才是真正的转折点。等到人们在实验室中又发现各种别的准晶体,乃至于再自然界又发现天然准晶,准晶就已经是绝对的主流科学,谢赫特曼也开始什么奖都能拿了。

回顾整个过程,我们并没有看到所谓“学术权威”在其中能起到什么打压的作用。的确有个两届诺贝尔奖得主至死都反对准晶,但并没有听说他有什么徒子徒孙为其马首是瞻。搞科研不是两个门派打群架。科学家之所以从一开始就质疑,恰恰是因为证据还没有达到“超乎寻常”的地步。而当X射线图像一出来,不管那个诺奖大牛怎么说,“主流”立即就接受了。

我们看被主流科学“打压”,一般不会上升到人身攻击的地步……除非你的理论侮辱了“主流科学家”。比如说要求他们洗手。

洗手的故事

1840年代欧洲医院受到产褥热的困扰。1841到1846年,维也纳最好的一家医院里,产妇死亡率居然达到十分之一,到1847年甚至是六分之一。青年医生 Ignatz Semmelweis决心找到解决办法。他判断,当前这帮所谓“主流医生”根本不知道是什么导致产褥热。有些医生声称他们知道,而且还头头是道地列举原理,但他们就是解决不了问题。

Semmelweis的办法是索性抛开主流医学,干脆直接上数据分析。通过大量统计,他发现一个最不可思议的事实:如果产妇在家里生产,她的死亡概率比去医院至少低60倍!哪怕最穷的女人,在街上生了孩子再被送到医院的,也没有得产褥热。这使Semmelweis怀疑导致产褥热的不是别的,正是医院。

Semmelweis所在的医院有两个分开的病房,其中一个主要由医生负责,另一个则是助产士负责,产妇则被几乎随机地分配到这两个病房。Semmelweis暗中统计,发现医生负责的病房,产妇死亡率是助产士负责病房的两倍。难道是医生让产妇得病的么?他对这个问题百思不得其解。直到一个教授在指导学生解剖尸体的时候被学生的手术刀划到,然后患病死了,症状与产褥热相似,Semmelweis才获得灵感。他推测,是医生们离开解剖室直接进病房把什么能致病的“尸体颗粒(cadaverous particles)”带给了产妇。

而当时医院无比热衷于解剖,病人死了之后立即送解剖室。这可能就是为什么之前的时代为什么没有这么流行产褥热。

于是Semmelweis要求医生解剖后必须洗手,结果产妇死亡率马上降到了百分之一。

如果现在哪个医生能有这样的成就,说他是华佗在世也不为过,但Semmelweis结局是直接被主流医生“逼”疯了。Semmelweis不能解释“尸体颗粒”是什么东西,当时医学并没有微生物传播疾病这个概念。Semmelweis摆平了自己的医院,但其他医院的医生根本不买账,尤其反感他把病因归罪于医生。在Semmelweis看来这些医生是在迫害自己,他甚至自诩弥赛亚,最有居然得了精神病,死的很惨。

一直到一二十年以后,医学界才接受“微生物能传播疾病”这个理论。而Semmelweis?没人拿他当科学家,科学史只记载了发现微生物的人。顺便指出,一直到现在,医生仍然不怎么爱洗手,至少不如护士洗得多。

一个道理

在以上三个故事中,主流科学到底做错了什么?我的答案是什么都没做错。谁说对的理论一出来别人就得马上承认?

如果“主流科学”是一个人,他既不是仙风道骨的中国世外高人,也不是充满圣洁光辉的西方牧师,更不是温柔妩媚的小姑娘。他是一个淳朴实在的中年汉子。他认为任何事情背后都必须有明确的答案,明确到他可以把这答案原原本本地写在纸上让你看懂。他从来不让你“顿悟”,他从来不让你“信则灵”,他从来不让你“猜”。他有什么说什么,不跟你打机锋,不跟你玩隐喻,不跟你玩暗示。他不敢肯定自己的答案一定正确,但他敢用最明白的语言跟你辩论,一只说到你服为止。

或者你把他说服为止。科学研究是一个充满争论的过程。科学家要是不争论,科学就死了。比如现在超光速中微子,就远远没有被接受为主流科学。统计出来的东西尤其不能作为成熟理论,而只能作为科学研究的缘起。科学研究就是这么一个把新思想逐渐变成主流的过程。从这个意义上讲也许真正活跃的科学根本就没主流,或者说主流科学都是死的科学,更严格的说是凝固了的科学。

怎样才算主流科学?你必须得能用现有的理论去解释你的新理论。如果主流科学是一棵大树,你的新理论不能独立于这棵树之外。你必须告诉别人这棵树的这几个位置可以长出这么几个树枝来,而这些树枝可以连接到我的新理论上去 — 这样你的理论就成了这树的一部分。有时候你甚至可以宣布某个树干的真实形态其实不是人们之前想的那样,但你不可能宣布这棵树整个长错了。

Kevin Kelly 在 What Technology Wants 这本书里提到,早在哥伦布去美洲之前,美洲大陆就已经有人了,可是为什么我们说是哥伦布“发现”了美洲呢?因为是哥伦布把美洲大陆这个知识和人类科学的“主流知识”联系在了一起。“孤岛式知识”是不行的。

只此一家,别无分店。什么新东西都得从我这儿长出去,这就是科学的态度。这种态度干掉的错误想法比正确想法多得多,比如“水变油”、永动机、黑洞发电之类。只有这样的态度才能建立一个高效而严谨的学术体系。也只有这个体系才能确保一个实验结果可以经得起在任何时间任何地点重复,一个技术可以随便复制使用,既不要求使用者道德高尚人格完美,也不要求他掌握什么不可言传的心法。

如果经络和“气”能用实验证明,诊脉能机械化,阴阳运行能用数学方程描写,一直到《伤寒论》能出一个基于现代医学的解释版,那么中医就可以成为主流科学。将来谁能做到这些,谁就“发现”了中医。也只有这样,中医才能抛开掌握绝学的少数老师傅,变成像青霉素那样任何一个医院都能随便使用的有效技术。

如果“主流科学”真是小姑娘的话,向她求婚并得到许可并不容易。有时候可能你是对的,但她就是不理解,你悲愤也没用 — 可是你也不能因此就说她不是女人啊。

——

洗手的故事来自 Super Freakonomics 一书。…

中国传统文化是怎么做上等人的文化

现在很多人呼吁要重建中国道德文化,建议把中国传统文化作为现代的主流,但是人们似乎忽略了中国传统文化的一个重要性质。中国传统文化其实是一个上等人的文化,或者说,是一个关于怎么做上等人的文化。

这个文化的重要前提,是认为世界上有下等人。而要想在当今重建这种文化,就必须承认世界上有下等人。

孔子春秋时期的儒学,上等人就是“君子”,下等人就是“小人”。注意这里的君子和小人不是道德意义上的,而是社会阶层等级意义上的。有爵位的,有社会地位的人,死了要发讣告,不出卖自己劳动力的人,叫做君子。反之,每天忙忙活活挣钱供房养家的,所谓“升斗小民”,则是小人。

孔子说,上等人得比下等人有更高的追求,这就是精神追求。君子喻于义,小人喻于利。今天我们看到很多人一聊天就是房价多少钱,这样的人不是上等人。辛弃疾说“求田问舍,怕应羞见,刘郎才气”,就是说像刘备这样的贵族是不会研究房地产的。哪怕自己穷困潦倒了不得已卖点草鞋糊口,他的心思也在国家大事上,而绝不会真费脑筋去研究怎么赚钱。

那么既然上等人是讲究精神追求的文艺青年,你就不能用对待普通青年的那一套去对待他们。威逼利诱啊,刑讯逼供啊这一套都不能用。有问题最好直接问他,反正上等人一般不会说谎。而下等人是会说谎的,所以得威逼利诱。这就是所谓刑不上大夫,礼不下庶人。

最初,上等人和下等人的划分是以经济和政治地位为标准的。但孔子这么一整,大家发现上等人的判断标准变成精神生活了。于是很多没有经济地位的读书人,认为自己只要精神上满足上等人的这些规范,那么就可以认为是个自己是个上等人。事实上随着科举制度的兴起,这个标准也得到了政府和民间的认可。

这就给读书人带来了一种自豪感。自豪感,是比较出来的。古代社会的特点是满大街都是文盲。为什么读书人如果骂另一个读书人,喜欢说“有辱斯文”啊,“斯文扫地”啊这些词,因为“斯文”是把一个读过书的上等人和没读过书的下等人区分开来的标志。“腹有诗书气自华”,这是一种骄傲的气度。读过书的人会立即发现自己在升斗小民之中脱颖而出,而且是鹤立鸡群。在读书人看来,你们上市场买点菜讨价还价甚至吵得头破血流,而我从来都是直接交钱走人,连挑都不挑,宁可受骗都无所谓。事实上在市场上被小人骗我还觉得挺光荣,这说明我根本不屑于跟他们在同一个层次争论。

整个中国儒学文化的要义,就是我是上等人,你们是下等人。读书人上学的时候会逐渐判断周围不读书的老百姓是下等人;等他长大做官之后就会判断朝廷里那些只知道逐利的同僚是下等人;而当他处理对外关系的时候,第一原则则是“华夷之辨”:我们中国人是上等人,你们外国人都是下等人。为什么?因为我们学过上等人的文化。

所以中国儒家文化存在的基础,是下等人的广泛存在。如果一个社会没有下等人来当陪衬,那么做上等人就没有自豪感了。而自豪感是人们愿意实践这一套上等人精神标准的根本动力。

欧洲贵族也是讲究上等人要有精神追求的。据说二战中贵族参战死亡率远远高于平民士兵,这就是一种上等人的精神。这种精神的背后正是“我是上等人,其他士兵都是下等人,所以最危险的任务我必须上”,这种自豪感。但是欧洲由于没有科举制度,这种上等人的文化并没有像中国儒学一样普及,没有成为他们的“国学”。而中国历史上没有发生欧洲这样的技术革命和资本主义,很可能就是因为中国这个上等人文化不屑于研究怎么赚更多的钱。

关键一点是,儒家文化跟人人平等是矛盾的。你不能既告诉读书人“你们要向劳动人民学习”,又告诉读书人“你们要做上等人”。这就是为什么儒学已经完全不适合现代中国,而且现代中国似乎也越来越没有道德追求了。

当今中国搞道德教化,从一开始的“三好学生”到近年的“八荣八耻”,别的不说,就从这些教条的语言上看,就没有任何贵族气质,非常粗俗。当年我上大学,有一天一进教室,发现黑板上方墙上被贴了一张A4纸,上写“请注意保持教室卫生–XX系宣”。我一看这到底是大学还是火车站啊?简直是斯文扫地。

就算不论文字,读书人对这种关于“底线”的道德也不感兴趣。就算做到了每次上完公共厕所都冲水过马路看灯,又有什么了不起的?没准敢于超速驾驶反而更能彰显一个人的身份和个性。

法律才应该是关于底线的。道德应该是关于怎么获得自豪感的。我们看任何一个国家的电影,从来没有哪个影片把遵守交通规则当成模范事迹去拍。人们更喜欢拿海盗和黑社会这种敢于挑战底线得人当英雄。所以道德教化的关键,不是不让人做坏事,而是教别人怎么做好事,做又酷又好的事。

而这一切的前提,是必须找到大量下等人来作为陪衬和鄙视的对象。得有靶子。一方面说每一个小人物都值得理解和赞赏,甚至把斤斤计较和投机钻营都当成光辉形象宣传,一方面却大声疾呼重建传统文化,这肯定不行。如果你不敢鄙视下等人,你就不是合格的上等人。

本文只是说中国儒家文化有这么一个性质,你要想推广就得尊重这个性质。至于这个性质好不好,我就不知道了。其实我觉得一个人人平等的社会比一个由很多小人和少数君子组成的社会更好。

而我们这个时代是一个连参与南京大屠杀的日军身上都能发掘出来人性的时代,所以我想中国传统文化肯定是一去不复返了。…

别用“常识”理解复杂世界

(《东方早报·上海书评》,2011年10月29日)

如果一个物理学家谈物理,哪怕他只是用大家都能听懂的语言做科普,外行一般也不太敢提出质疑。人们知道物理学是一个非常专业的尖端科学,没经过多年训练的人胡乱说话只能闹笑话。可是当一个社会学家谈论社会问题的时候,哪怕他旁征博引了好多东西方先贤的经典理论,别人还是可以毫无压力地批评他。不管专家怎么说,每一个出租车司机都认为自己知道汽油涨价是怎么回事,每一个网友都认为反腐败的出路是明摆着的,每一个球迷都认为如果从来没搞过足球的韦迪能当足协主席,那么我也能当。

这也许怪不得大众。实践表明,像政治学这样的软科学,其“专家”的实用程度很可能并不显著高于“砖家”。1984年,伯克利的心理学家Philip Tetlock做了一个影响深远的研究。他调查284个专门以预测政治经济趋势为职业的政治学家、智囊和外交官,向他们提出各种预测问题,比如说戈尔巴乔夫有没有可能被政变搞下台。Tetlock要求专家们对其中大多数问题,比如某个国家的未来政治自由状况,提供出现三种可能性(保持现状,加强或者减弱)的大致概率。这个研究做了二十年,一直等到当年预测的事情全部水落石出。到2003年,Tetlock总结了这些专家给的答案,发现他们的总成绩还不如索性把每个问题的三种可能性都均等的设为33%。也就是说,专家的预测水平还比不上直接抛硬币。更有讽刺意味的是,这些专家对自己专业领域的预测得分居然比在自己专业外领域更差。

所以《纽约人》杂志在评论Tetlock描写自己此项研究的《政治专家可靠么?》( Expert Political Judgement: How Good Is It? How Can We Know? )这本书的时候对专家相当悲观,最后得出的结论居然是我们还是自己思考算了 – 尽管Tetlock的研究显示专家的得分其实还是比普通人略高一点。

但社会科学并非无路可走,它可能正处在一个大发展的前夜。哥伦比亚大学Duncan Watts的新书《什么都是显然的–如果你知道答案的话》(Everything Is Obvious* Once You Know the Answer)提出,社会科学的发展方向应该是像硬科学一样,依靠实验和数据。传统专家的预测之所以不行,是因为他们依赖的很多直观“常识”,其实是一厢情愿的想当然。事实上,哪怕一个最简陋的统计模型,也能比专家预测得更好。Watts 这个说法当然并不新,已经有越来越多的人呼吁把数理方法作为社会科学研究的主要方法,而且这个方法也的确正在成为主流,现在大概已经很少有人在论文里拿一百年前的所谓经典说事了。此书的最大新意在于,因为Watts同时在Yahoo!研究院研究社交网络,他在书中描述了几个其本人参与的有趣研究。

谈起社交网络,中国读者会立即想到格拉德维尔(Malcolm Gladwell)的《引爆流行》(The Tipping Point)。这本书提出,一件东西要想在人群中流行开来,需要某些特别有影响力的关键人物在其中推波助澜。这些关键人物是社交网络中的节点,是普罗大众中的意见领袖,正是因为他们的存在我们才可能实现把地球上任意两个人用不多于六个人相互联系起来,也就是所谓“六度分隔”。根据这个理论,扩大知名度的最好办法是找名人做广告。名人在微博上说一句话,应该比普通人的“口碑”重要得多。有传闻说现在中国有百万粉丝的名人发一条营销微博可以获得一千元,其实这个数字还算是少的。美国女星Kim Kardashian一条tweet的价格是一万美元。

“关键人物”理论完美符合人们的思维常识。我们总是强调伟人对历史的推动,强调“一小撮”坏分子对社会秩序的破坏,强调明星对时尚潮流的引领。问题是,这个理论没有获得大规模统计实验的支持。

在现实生活中统计影响力非常困难,因为我们很难测量一个人是被谁影响的。现在微博客Twitter的出现给这种测量提供了可能。Twitter的一个特别有利于研究的特点是,如果用户分享一个网址,这个网址的URL会被缩短,自动形成一个唯一的代码。通过跟踪这些短代码,Watts与合作者就可以分析信息如何在Twitter上扩散传播。具体说来,就是如果有人发布了这么一条代码,而他的一个“粉丝”如果转发这条代码的话,那么这次转发就可以被视为一次可观测的影响。广告商的愿望,是希望信息能够这样被一层接一层的转发传播开来,形成所谓“Twitter瀑布”。然而通过分析2009年两个月之内160万用户的七千四百万条信息链,研究人员发现98%的信息根本就没有被推广传播。在这千万条信息中只有几十条被转发超过千次,而转发次数达到万次以上的只有一两条!我们平时看到的那些被反复转发的消息其实是特例中的特例。由此可见想要通过微博成名,就好像买彩票中头奖一样困难。

那么名人的影响力到底怎么样呢?Watts等人使用了一个巧妙办法。他们使用统计模型根据第一个月的数据把那些粉丝众多,并且成功引发了Twitter瀑布的“关键人物”挑出来,然后看他们在第二个月中的表现。结果相当出人意料:这些人在第二个月再次引发瀑布的可能性相当的随机。平均而言,“名人”的确比一般人更容易导致一条消息被广泛传播,但这个能力的实际效果起伏极大,一点都不可靠。也许最好的营销方式不是拿大价钱请少数名人,而是批量雇佣有一般影响力的人。

如果一个东西突然流行开来,我们的常识思维总是以为这个东西一定有特别出类拔萃之处,或者就是其幕后一定有推手。但Twitter上的研究表明所谓幕后推手其实并没有那么厉害。那么为什么某些书能够畅销,某些电影能够卖座,某些音乐能够上榜呢?完全是因为它们出类拔萃么?Watts参与的另一项研究表明,成功很可能主要是因为……运气。

这是一个相当有名的实验。实验者创办了一个叫做Music Lab的网站,在几周之内招募到一万四千名受试者来给48首歌曲评分,如果他们愿意,也可以下载其中的歌曲。有些受试者的评分是完全独立的,他们只能看到歌曲的名字。而其余受试者则被分为八个组,他们可以看到每首歌被自己所在组的其他受试者下载的次数 – 他们可能会设想被下载次数越多的歌曲越好听,这样一来他们打分就会受到社会影响的左右。

实验表明那些好歌,也就是在独立组获得高分的歌曲,在社会影响组也是好歌,而且其流行程度比在独立组更高;而坏歌在社会影响组的表现也更差。所以当听众能够被彼此的选择影响的时候,流行的东西就会变得更加流行,出现胜者通吃的局面。然而这个实验最重要的结果是,具体哪首歌能够登上排行榜的最前列,则是非常偶然的事件。有些歌曲可能会因为实验初期纯粹偶然地获得更多下载次数,后来的受试者受这个影响就会以为这首歌好听,以至于给予它更多的关注,形成正反馈。最初的运气很大程度上决定了最后谁能脱颖而出。独立组仅获第26名的一首歌,在一个社会影响组居然排第一,而在另一个社会影响组则排第14名。尽管特别不好的歌肯定不能流行,但好歌想要流行还是需要很大的运气成分。总体来说,独立组排名前五的歌曲只有50%的可能性在社会影响组也进前五。

对能够互相影响的一群人,不能以常理度之。撒切尔夫人曾经说,“根本就没有社会这种东西。只有作为个人的男人和女人,以及他们的家庭。”可是你不能用研究一个人的办法来研究一群人。就算你能理解这群人中的每个人,你也未必能理解把这群人放在一起会发生什么。他们之间的社交网络结构,会导致一些非常偶然的事情发生,这些事情无法用任何常识去预测。一般人的历史观总是有意无意的把一个集团,比如说清廷,想象成一个有思想有行动的个人,好像辛亥革命就是清廷,孙中山和袁世凯三个人之间的事一样。这样的理论无法解释为什么孙黄数次起义数次失败,最后居然在一个完全想不到的时机成功了。

我们生活在一个彼此互相影响的社会。我们想起来去听一首歌,也许只不过因为朋友的推荐。我们想起来去看某个电影,也许只不过因为我们恰好在微博上跟随某人。旭日阳刚可能的确唱的不错,但在某个平行宇宙里他们将不会登上春晚舞台。如果历史重演一遍,芙蓉姐姐、周迅甚至李谷一都未必能成名,《哈利波特》的第一集未必能获得出版。我们总是习惯于把事情的成败归结为人的素质,归结为领袖人物,甚至归结为阴谋论,好像什么都是注定的一样,而事实却是很多事情只不过是偶然而已。

常识只是特别善于在事后“解释”事件,这种解释根本谈不上真正的理解。十月革命爆发了,我们就说俄国局势导致革命必然要爆发,可是革命之前有谁能这么肯定呢?中国女篮以三分优势击败韩国取得奥运参赛权,赛后总结自然全是成功经验,可是如果中国队最后几个球偶然没投进,媒体上必然又全是失败的反思。我们看这些事后的经验总结或者反思,总是觉得它们说的都挺有道理,简直是常识。专家们也正是根据这些道理去预测未来。可是事先你怎么就不知道这些完全相反的道理哪个会起作用呢?

比如如果有人说来自农村的士兵会比城市士兵更适合部队生活,读者很可能会认为这是显然的 – 农村本来条件就比较艰苦,需要更多的体力劳动,所以农村士兵肯定更能适应部队。然而据社会学家Paul Lazarsfeld对二战期间美军的调查,事实恰恰相反。其实是城市士兵更适应部队生活,因为他们更习惯于拥挤、合作、命令、严格的衣着规定和社会礼仪。这两方面的常识看上去都有道理,在没有统计的情况下我们根本不知道哪个更重要。这就是为什么不做调查研究就没有发言权。

要想从复杂的随机事件中看到真正的规律,最好的办法是像搞自然科学一样进行大规模的重复实验。如果中国女篮跟韩国队在同样的条件下打100次能赢95次,我们就可以确信中国队强于韩国队。如果一首歌能在每一个社会影响组都进前五名,我们就可以确信这首歌的素质的确出众。然而历史不能重复,我们不知道最后发生的结局是不是一个小概率事件,但我们却总能用“常识”给这个结局一个解释!像这样的解释如果用于预测未来,甚至制定计划,怎么可能不失败呢?一个更实用的历史观是放弃“一切都是注定的”这个思想,把历史事件当成众多可能性中的一种,把未来当成一个概率分布,然后尽可能地使用统计方法,通过历史数据去计算未来事件的概率。与其追求用各种想当然的常识指导未来,不如把历史当做一个数据库,从中发掘统计规律。

搞自然科学的科学家经常认为社会科学更简单。如果你看那些社会科学的论文,会发现其中逻辑通俗易懂,结论往往也是显然的。物理学经常能得出一些违反直觉而又绝对正确的结论,然而社会科学中常识却总能大行其道。现在这种局面正在改观,自然科学的方法正在被引进到社会科学中去。但这个过程并不容易。亨廷顿曾经在某项研究中颇有科学精神地写道“62个国家的社会挫折和不稳定之间的相关系数是0.5”,然后一个数学教授跳出来说这纯属胡扯,“亨廷顿是怎么测量社会挫折的?难道他有一个社会挫折表么?”其实像这样的批评也许只不过说明社会科学比自然科学更难做。

在没有互联网的年代想要找几万人做歌曲评分实验,或者分析成百上千万的社交网络和信息传播,都是根本不可能的事情。现在有了互联网,社会科学终于可以带给我们一些“不显然”的研究结果了。所以社会学家已经在使用新方法搞科研,遗憾的是实用专家们仍然停留在过去的理论上。一个原因也许是统计方法还没有来得及作出更多有实用价值的判断。但不论如何,正如Watts所说,现在社会科学已经有了自己的天文望远镜,就等开普勒出来总结行星运动三大定律了。

————

几点说明:

1. 此文中关键事实,凡是没有直接标明出处或给出链接的,一律来自这本书。以后写书评也是如此,不再注明。

2. 我曾经在《分析 Facebook 上的两场捐款战》一文中使用过“关键人物理论”,并且以此对比中国用户的捐款数据,得出结论是中国用户对网络的使用习惯还停留在论坛时代。而当时数据的确显示有些人是有一定的影响力的。现在看来这两篇文章似乎有点矛盾,但数据也许并不矛盾。“影响力”肯定是存在的,但也许并没有人们事先设想的那么强。另一方面,这个捐款“实验”也可以作为对本文提到的url转发统计的一个很好的补充。

3. 我觉得新浪微博可能比 Twitter 更容易用来进行社交网络研究。首先转发次数是明摆着的,其次也许用户量更大,另外新浪这种明星体制也许会导致整个网络结构跟 Twitter 很不同。不论如何,希望能看到有人对新浪微博进行类似的大规模统计分析!…

人海战术的数学原理及其与高科技强军的关系

【这篇文章大概写于2004年,当时以Wally的名字贴于“世界军事论坛”,然后有人告诉我这就是兰切斯特方程的平方率。也有人说是我早知道这个方程,又故意说是自己独立推导的,令我有口难辩。今天在看到一篇果壳网的文章,又想起了此文。现在过去这么多年,我又写过不少文章,可是从原创技术含量角度,大概没有一篇能比得上这篇。】

【我认为根据这个理论,以M*Sqrt(p)来计算兵力的话,双倍于敌军兵力应该是最有效率的打法。另外,后面关于F-22和J8-II的比方是错误的,远程攻击不适合平方率,而且如果别人能打到你而你根本打不到别人,那就再多人数也没用。】

人海战术是我军作战常用打法。经常有人对这个打法持不屑的态度,认为难道就因为中国人多,中国人命就不值钱么,认为我们应该把主要精力用在提高单兵战斗力上面,而不应该总是靠人多取胜胜之不武。其实毛泽东军事思想一直都是强调以多打少,集中优势兵力歼灭敌人。即使在全局我军兵力不如敌军,我们在局部战斗,即使是游击战的时候,仍然是强调要以多于敌军的兵力来作战,伤其十指不如断其一指。

我最近几天因为老板出去度假,自己在家偷懒玩游戏打魔兽争霸,对人海战术有了一些新的理解。以下本文试图从数学角度研究人海战术的优势所在。我对军事属于完全业余水平,不知道是不是早就有人做过类似的计算,也许我做的这个计算早就是军事教科书的常识了。我将会用到微分方程,但是如果你不懂微分方程也能理解我的结论。

最初我思考的是这个问题:假定我军士兵比敌军士兵能打。如果双方各出兵100人的话,最后战斗结束的时候敌军全死(即完全丧失战斗力),我军伤亡80人,还剩下20人。现在假定敌军仍然出兵100人,但我军采用人海战术,出兵200人,那么战斗结束的时候我军情况如何?我军是不是伤亡80人,最后剩下120人呢?

不是!我军伤亡人数要少于80人。为什么呢?假设第一次双方各出100人的时候,战斗进行了一个小时,最后我军伤亡80人,这就是说,100敌军用一个小时可以打死打伤我军80人。但是现在我军出兵200人,200人打敌军100人,战斗时间根本用不了一个小时,比如说半个小时就结束了战斗,那么敌军根本来不及使我军伤亡80人,也许只能使我伤亡40人。也就是说如果这么算的话,200人打一百人的话,我军伤亡人数将大大下降。因此即使我军单兵战斗力高于敌军,使用人海战术仍然可以起到使我军减少伤亡的巨大作用。

但是以上这个推理是建立在敌军杀伤我军的速度不变的假设之上的,实际情况是随着敌军被我军不断杀伤,其总的战斗力不断下降,杀伤我军的速度也在下降,并不是一个线性的关系。为了精确计算双方伤亡,我建立如下数学模型:

假定开战的时候我军投入的人数是 M 人,敌军 N 人。并假定我军平均每个士兵在单位时间内可以使敌军 p 人丧失战斗力,敌军平均每个士兵在单位时间内可以使我军 q 人丧失战斗力。注意要从平均角度和概率角度去思考 p 和 q,这两个数字并不一定是整数,而且可以小于1。p 和 q 实际上就是双方的“单兵战斗力”,和士兵素质,指挥水平,装备水平,地形等等都有关系。

假定在 t 时刻,我军剩下的人数是 m(t) 人,敌军剩下 n(t) 人,那么在这个时刻,敌军被我军杀伤的人数必定是我军此时的总人数乘以其我单兵作战能力,即
  dn(t)/dt = – p m(t),
类似地,
  dm(t)/dt = – q n(t).

这个微分方程组很容易求解,考虑到初始值 m(0) = M, n(0) = N,方程组的解是
  m(t) = ( M – N Sqrt(q/p) ) e^(Sqrt(pq) t) /2 + ( M + N Sqr(q/p) ) e^(-Sqrt(pq) t) /2,
  n(t) = ( N – M Sqrt(p/q) ) e^(Sqrt(pq) t) /2 + ( N + M Sqrt(p/q) ) e^(-Sqrt(pq) t) /2.
其中的“Sqrt”表示开根号。

其实如果考虑到士气等等的因素,p 和 q 同样应该是是时间的函数,但为简单起见本文假定 p 和 q 都是常数。根据这个结果,我有如下两个定理:

定理一:我军战斗取胜的条件是 M Sqrt(p) N Sqrt(q).

这个定理非常容易证明,只要让 n(t) = 0 有 t 0 的实数解就知道。这个结论说明,如果你的单兵作战能力低,你就必须多带点人,当然这个道理不用微分方程也能看出来。注意这里比较有意思的一点是我们在决定带多少人够用的时候不是看 m*p,而是计算 m*Sqrt(p),这一点如果不用微分方程你就看不出来了。

定理二:假定我军与敌军的单兵作战能力一样,即 p = q 的情况下,如果 m n,那么到战斗结束,敌军一个不剩的情况下,我军还剩下 Sqrt(M^2 – N^2) 人,我军总共伤亡 M – Sqrt(M^2 – N^2) 人。

这个也非常容易证明,只要让 p = q, n(t) = 0,就可以计算得到那时的 m (t) = Sqrt(M^2 – N^2)。

这个定理说明了以多打少的优势所在!
  
很容易证明只要 m n, 则 Sqrt(M^2 – N^2) 必定大于 m – n,这就是说即使双方的单兵作战能力相等,我军最后剩下的人数也绝对比双方开始的人数之差要多,也就是说这不是敌人一个换我们一个。只要我们人多,就算双方士兵素质相等,敌人一个也换不了我们一个。这个道理本文一开始的时候已经论证过了。其实我军参战的人数越多,我军牺牲的人数就越少。比如说双方战斗力一样,如果各出100人,最后结果必定是两败俱伤,双方一个不剩。但是如果我军多带20人,我军120人打敌军100,则根据上面的计算,敌军全死的情况下我军还剩 Sqrt(120^2-100^2) = 66 人!你多带20个人,可以少死66个人。实际上在完全理想的情况下,我军即使只比敌军多带一个人,最后战斗结束也是我军获胜,并且幸存14人!

假定敌军100人,两军单兵作战能力相等的情况下,x 轴是我军出兵人数,从100到500之间变化,y 轴是最后我军伤亡人数。
其结果如下:

我军出兵人数:100,110,150,200,300,400,500
我军伤亡人数:100, 64, 38, 27, 17, 12, 10
  
可以看出,如果我军也是100人,则全军覆没,但是我军只要人数稍微多一点,伤亡就会大大下降。同时我们也可以看出来并不是人越多就越好,如果带200人就已经可以做到伤亡很小了,这时候带300人所起到的作用根200人相比并不时特别显著。双倍于敌军人数应该是一个比较理想的数字。

其实从定理一我们还可以看出另一个结论。最终决定战争胜负的因素有两个方面:一个是人数,一个是单兵作战能力,也就是士兵素质,武器装备等等。现在的人一般比较迷信武器装备,认为提高 p 值最重要。但是我们看到,最后决定战争胜负的是M*Sqrt(p)。如果你把参战人数提高到原来的两倍,你的总战斗力就提高到两倍。但是如果你不提高人数,而是选择提高武器装备,提高士兵素质,那么为了达到同样的效果你必须把单兵作战能力提高到原来的四倍!

美军的选择是提高 p 值,毛泽东的选择是提高 M 值。到底是把 M 值乘以2容易,还是把p 值乘以 4 容易,对不同的国家,不同的经济条件,有不同的结论。问题在于用同样多的钱,如何提高M*Sqrt(p)。另外根据定理二我画的图,并不是说兵力越多就越好,一般来说单兵战力相同的情况下,两倍于敌人的兵力是最理想的。根据这个理论,我们可以思考一下我国需要多少常备军队合适。

这个数学理论有很多应用。比如说美军 F-22 好是好,但是价格狂贵,他的作战能力是不是一架就能打过 10 æž¶ J8-II? 我军在武器配备方面应该好好参考这个理论。…