选民的大脑想要什么

(《东方早报 – 上海书评》,2011å¹´3月6日,报纸版标题是《西方选民太不“自私”了》)

美式民主的反对者常常以为资本主义制度下的选民都是自私的,他们从个人利益出发投票从而会伤害国家的整体利益;而政客们则说一套做一套,竞选的时候空许诺,最后出台的政策必然背离民意。这两个批评都是错的。

事实上,大量的研究表明,选民在投票的时候是非常无私的。大多数选民考虑的不是自己能从候选人身上得到什么好处,而恰恰是出于爱国之类的高尚情操去投票。美国政客的大多数政策不但是符合民意的,而且是越来越符合民意 — 随着近年以来各种民意测验越来越频繁,政客们发现自己可以发挥的政策空间已经越来越有限了。现在的美式民主其实是一个选民很无私,政客很贴心的制度,是一个选民说话真的好使的制度。

可惜这正是民主失灵的原因。

2008年金融风暴以来,美国的贸易保护主义趋势越来越严重,钢铁工业方面就先是在09年初通过的经济刺激计划中规定政府基建项目中只能使用美国产钢铁,而今年二月更是对部分中国钢材加征430%的反倾销税。中国学者发表文章论证这种贸易保护其实对美国经济有害,伤害的是美国自己的消费者,而且从历史角度来看,1930年代类似的贸易保护政策恰恰加剧了大萧条的深度和范围。

中国经济学家希望美国政府能够理性行事,不要搞贸易保护。但美国经济学家也反对贸易保护。全世界的经济学家都反对贸易保护。如果经济政策完全由经济学家说了算,那么世界上根本就不会有贸易保护。然而美国政治的现状是经济学家说的不算,选民说的算。美国乔治·梅森大学经济系教授布赖恩·卡普兰(Bryan Caplan)在2007年出了一本书,The Myth of the Rational Voter(中译本《理性选民的神话》)对选民与经济学家意见相左的现状做了一番相当精彩的描述和分析。

很多人心目中最理想的民主选举制度,是假设每个选民都能清晰理解候选人许诺的各项政策,并且能理智地对候选人能力和这些政策的好坏作出判断,在这种情况下大多数人的意见很可能就是最好的意见,民主就是有效的。比如我们看观众拿短信投票选超级女声,网上的人给电影打分,只要参与的人足够多,最后获得高分的往往的确就是很好的歌手和作品,“民主”有效,堪称是“群体的智慧”。

然而政治选举跟选超女是两码事。超女的能力就是她的演唱,每一个观众都能直接了解她的演唱;政客的能力很大程度上在于他的政策,可是事实证明,大多数选民根本无意去深入了解这些政策。1992年美国总统选举,有高达86%的选民知道老布什家的狗叫Millie,却只有15%的选民知道老布什和克林顿都支持死刑。大多数选民对具体政策基本没什么兴趣。任何一个严肃的政治学者都了解这一点:大多数选民是无知的。

但选举制度的妙处在于,如果选民仅仅是无知的,民主并不会失灵。在媒体的狂轰乱炸下每个候选人都有优点和缺点。有些人喜欢克林顿年轻,有些人喜欢老布什经验丰富,有些人喜欢奥巴马能说会道长得帅,有些人喜欢麦卡恩上过战场靠得住。这些无知的选民投票都没投到点子上,但只要他们的意见是随机分布的,那么他们的选票就会互相抵消 — 最后哪怕只有1%的选民精心研究过候选人的政策和执政能力,这1%的选票仍能决定选举的结局。

可是卡普兰指出,选民的无知不是随机分布的,他们的整体意见存在系统偏见。在四个关键问题上,一般公众与经济学家的意见相反,真理不幸掌握在少数人手中。

第一,经济学家非常相信市场,相信看不见的手;而一般公众很难理解纵容私人公司的贪婪怎么能给社会带来整体利益。公众只看到公司赚钱了,却看不到利润对公司提高效率和服务的激励作用。相对于经济学家,公众普遍认为公司的利润太高。比如汽油涨价,经济学家认为是市场供求关系决定的,而公众则认为是因为石油公司想多赚钱。

第二,经济学家支持自由贸易,而公众则本能地反感外国货,支持本国货。公众总是低估对外贸易的好处,总是认为外国在抢夺本国的就业机会。公众常常强烈相信商业公司把工作转移到国外去是造成本国失业率上升的主要原因,而经济学家则认为其连次要原因都算不上。

第三,公众过分害怕裁员。如果一项新技术可以节省人力,公众的态度往往会认为这个技术不但不是进步,而且还是个危险。而在经济学家看来,一个人的工作只有在他生产的产品能卖出去的情况下才有意义。更何况允许公司自由裁员未必会降低社会整体就业率,因为只有当公司知道自己有权裁员,它才敢于在形势好的情况下多雇人。

第四,公众往往过高估计当前社会问题的严重性,过低估计经济的表现。不好的东西总是比好的东西更能给人留下深刻印象。看到青少年中有吸毒的,公众就认为社会一代不如一代时代不行了。看到华尔街金融欺诈,公众就会认为整个富裕阶层完全腐败堕落了,甚至整个经济体系都没救了。公众对未来生活标准的预期总是比经济学家悲观。基于这种认识,选民往往比经济学家更希望政府干预市场。

而政客们不但了解选民的这些偏见,还特别善于迎合这些偏见。在反对自由贸易活动中闹得最欢,动不动就要对中国的“不公平贸易”实施打击的正是最直接代表民意的众议员,因为他们的任期只有两年,时刻面临选举压力。卡普兰在书中引用统计报告,说70%的美国总统副总统和内阁成员,50%以上的两院议员都曾经有过律师经历。而受过专业经济学训练的政客则几乎可以忽略不计。选民不喜欢经济学家。

一个显然的问题是你凭什么说经济学家就是对的?也许经济学家的看法才是偏见。经济学家的理论来自理性的分析,经历过历史实践的考验,而公众的喜好则完全来自直觉和感情。一个政策的好坏,往往与人的直觉相反。很多人既认为给弱势群体增加福利是好事,又认为政府减税是好事,但他们看不到这两件事其实是矛盾的。公众认为政府强制规定一个高工资是对劳动力的保障,殊不知这样的劳动力价格会人为地产生过剩。被这种情绪左右,欧洲几十年来一直对劳动力市场实行管制,结果就是长期的高失业率。

选民在投票的时候比他购物的时候要无私得多。真正因为自由贸易而丢了工作的人只是少数,物美价廉的外国货对大多数人的生活来说是个好事。事实也是如此,选民们正是一边高喊让人民币升值,一方面看到中国产品还是照买不误。那么他们为什么还要投票支持贸易保护呢?根本原因在于谁都没拿自己手里这区区一票当回事。卡普兰把选民的这种投票态度称为“理性的无知”,因为无知的确是一个理性的选择:既然自己这一票根本不能左右大局,何必专门为了投好这一票而研究候选人的政策对比、苦读经济学呢?

《理性选民的神话》这本书的结论,就是理性的无知加上公众对经济问题的系统偏见,势必造成民主失灵。卡普兰说,人们对民主的信仰几乎是一种宗教。经济学家非常非常相信市场,但经济学家也非常非常小心地研究了种种可能造成市场失灵的情况,他们从来都不认为市场是万能的。相比之下,信仰民主的人却往往认为民主制度是万能的,如果你告诉他们在这里民主会失灵,他们的解决方案是更多的民主!

一个人想要什么,和他作为选民投票的时候想要什么往往是两个不同的东西。卡普兰没有回答的一个重要问题是如果选民不是为了自己的利益而投票,那么他们是为了什么投票呢?选民到底想要什么呢?仅仅用一句“非理性”去批评,甚至直接说选民很愚蠢,是过分简单的答案。事实上选民的投票心理有非常明显的规律,一个政客要想当选,甚至一个政权要想稳固,必须深刻理解这种规律。

从《理性选民的神话》这本很有学术味道的书考证看来,主流政治学者们对选举的认识还停留在无知选民的意见会互相抵消这个错误看法上。反倒是那些直接参与操作竞选的人对选民的心理有更多的了解,而且他们还能主动利用这些心理。可惜政客们并没有把竞选攻略写成教材让我们学习。

好在有个认知语言学家似乎是把“选民想要什么”这个问题给研究清楚了。这就是加州大学伯克利分校教授 George Lakoff,他在2008年出的这本The Political Mind (《政治之脑》),给我们描绘了一个非常有意思的政治思维模式。

选民想要的东西,叫做“小故事”。

认知学家发现,人脑认识复杂的外部世界,是通过“小故事”(narrative)去解读的。比如第一次海湾战争是伊拉克先打了科威特,然后美国率领联军打伊拉克。战争背后可能有非常复杂的政治经济背景,但在一般公众看来,这就是一个“有坏人欺负良善,于是英雄出手相救”这么一个小故事。

大脑喜欢小故事。我们把自己看成什么样的人,也取决于我们认为自己正在实现一个什么小故事。比如当我们努力工作的时候,我们可能认为自己正在实现“通过奋斗获得美好生活”这个小故事。我们对公众人物的理解,就是把他们往我们脑子里的小故事里面套。而这一切可以是无意识的。

小故事的重要特点是它能调动人的感情,在一个小故事过程中,人脑的两个感情区域(一个正面感情,一个是负面感情,在不同区域)被随时激活。我们总是会对故事中的人和事有一个好坏评价。比如当初克林顿偷情,希拉里没有跟他离婚,有些人会把这件事解读为“受害妻子宽容了”这个小故事,那么希拉里的形象就是正面的。而有些人把这件事解读为“有些机关算尽的人为了得到权势什么都能忍”这个小故事,希拉里的形象就是负面的。2008年总统初选的时候一个大学女生表示她会给除了希拉里之外的任何民主党人投票,显然就是用后一个小故事去解读希拉里了。

政客和政治经济议题都是相当复杂的东西,需要考虑很多方面的因素,甚至还要做一番计算才能评估出好坏,大多数人根本没有时间和能力去做这种计算。但是选民也不愿意听专家瞎忽悠,他们喜欢自己做判断,而他们做判断的依据,就是小故事。所以懂行的政客从来不给选民上经济课,他们专门给选民讲故事。

第一次海湾战争,老布什首先使用了一个”自卫”小故事,说伊拉克威胁美国石油供给,选民不买账。于是老布什改讲一个”英雄救助良善”小故事,选民认同了。小布什爱讲的故事则是反恐。2004年小布什在经济相当糟糕的情况下仍然成功连任,靠的就是这个小故事。竞选经理Karl Rove给小布什制定的策略非常清楚:不要谈经济,谈恐惧!实际上小布什的反恐故事讲得相当成功。早在2004年春天,官方的9/11调查委员会就已经宣布萨达姆没有给基地组织提供过帮助,然而当年8月,仍然有50%的人认为伊拉克与9/11事件有关;甚至一直到2006年,还有46%的这么认为。

选民最喜欢的两个小故事,一个是“不怕敌人的勇敢故事”,另一个是“自我救赎的奋斗故事”。哪个候选人会讲这两个故事,哪个候选人就当选。小布什的反恐故事就是第一个故事,而他特别喜欢谈论自己年轻时代的酗酒等荒唐行为,就是为了衬托第二个故事。事实证明英雄何止不怕出身太单薄,简直是早年越差越好。奥巴马能当选也与这个故事有关,更何况这还是一个黑人的奋斗!当然奥巴马也讲了第一个故事,这就是华盛顿政客一片黑暗,一个年轻人敢想敢干来“change”。选民对这两个故事都买账了。

胡适先生在1921年提出“好人政府”的命题,希望民主制度能把一班好人选出来送进政府。但“好人”其实是个故事。选民通过各种小故事来判断谁是好人。与胡适不同,经济学家更希望选民能自私一点,能从自己的利益出发去投票,只有在这种情况下“看不见的手”才能让民主有效。

而事实证明当一个选民投票,他根本不是在选择自己的未来利益,他是在根据自己大脑中的小故事来宣泄自己的感情。廉价的中国货是不错,但支持国货是个爱国故事。陈水扁作为一个台湾土生土长的穷人家孩子努力奋斗,天生符合选民最爱的故事。他经济搞得那么差居然都能连任,一个很大因素是他讲了一个小岛不怕打压的故事。选民不关心台独是否符合台湾人的利益,他们关心的是通过敢于投出这一票来证明自己很酷。

卡普兰对民主失灵给出了三个策略。第一个策略,我相信是作者心目中的上策,就是用市场取代民主,也就是说在一些经济领域取消政府监管,让公众自己选择。最好的例子是电视台,有线电视网没有公共电视网那么多内容限制,结果HBO台生产了很多非常好的作品。作者提出的中策,是限制只会听故事的一般公众的投票权,给那些能理解复杂事物的人更多的投票权。而下策则几乎是一个没有办法的办法:加强教育,希望能让公众提高一点经济学常识。

可惜经济学没法用小故事讲述。…

上网能避免浅薄么?

(《东方早报·上海书评》,2010年12月19日)

我国成年人平均每天读书的时间越来越短,去年只有14.7分钟,而上网的时间越来越长,超过34分钟。如果你认为上网也是一种阅读,我们总的阅读时间是逐年增加的。但上网是一种非常特殊的阅读。

一个典型的上网者通常同时打开好几个窗口,开着聊天工具,每隔一小段时间就查查电子邮件。他很少在任何一个网页停留过多时间,页面随着鼠标滚轮上下翻飞。相对于长篇大论,他更倾向于微博客之类短小的信息。据说曾经有一个资深网民教一个新手怎么使用浏览器,发现那个新手居然在读一篇文章,把他激怒了:网页是读的么?是让你点击的!

现在已经没人能看完《战争与和平》了。高质量的读书要把自己沉浸在书中,有的地方反复看,甚至还要记笔记。这种读法似乎有点丧失自我,好像成了书本的奴隶。而上网则是一个居高临下的姿态,我们游离在内容之外,面对众多等着被临幸的超链接想点哪篇从心所欲。可是在Nicholas Carrçš„The Shallows(《浅薄》)这本书看来,上网者才是真正的奴隶。相对于读书,网络阅读使我们能记住的信息更少,理解力和创造力下降,形成不了知识体系–互联网把我们的大脑变浅薄了。

网络文本的特征是有超链接。本来设计超链接是让读者可以随时点击相关内容,是更主动的阅读,然而多个实验发现效果恰恰相反。读者倾向于毫无目的地点来点去,不但没有加深理解,甚至记不住读了什么。一个实验中受试者被分为两个组,一组读纯文本,一组读有超链接的“超文本”。然后用所读内容测试,超文本读者的得分显著低于纯文本读者,而且文章中超链接越多,他们的得分就越差。这还不算在真实的上网中,一个人还要面对大量无关的链接,更不用说各种广告都在争夺他的注意力。

为什么超链接使阅读效果变差?因为我们必须随时对点与不点一个链接做决定。一个人读书的时候调动的是大脑中负责语言、记忆力和视觉处理的区域;而对链接做决定则要时刻调动大脑的额前叶区,这是两种完全不同的思维方式。实验表明,网上冲浪可以增进做决策和解决问题的能力,这对老年人保持头脑年轻有好处,但坏处则是牺牲了深度理解。神经科学家发现,网上阅读从硬件层面改变了人的大脑。一个没上过网的新手只要每天上网一小时,五天之后他的大脑结构就会发生可观测的改变!

多媒体内容也未必是好事。在一个实验中受试者被要求阅读一份关于马里的资料。其中一组读的是纯文本,另一组则在文本之外还有一份配合的声像资料,可以随意选择播放还是停止。在随后的测试中,文本组在10道题中平均答对了7.04道,多媒体组只答对了5.98道。而且与直觉相反,文本组的人认为这份资料更有意思,更有教育意义,更容易理解,他们更喜欢这个资料。

多媒体,超链接,时不时蹦出来的聊天信息和新邮件通知,还严重干扰记忆力。只有有意识的短期记忆,称为工作记忆,才有可能被转化为长期记忆。过去心理学家曾经认为人的工作记忆只能同时容纳7条信息,而最新的研究结果是最多只有2到4条。这样有限的容量非常容易被无关信息干扰导致过载。上网时分散的注意力,不停地为点还是不点做决定,都在阻碍我们把短期记忆升级为知识。

网上有些人只看标题就敢评论,根本还不知道文章说的是什么。逐字逐句的读书已经被快速扫描式的读网取代。用小型摄像机跟踪上网者的眼球运动表明,网上阅读模式是个 “F” 形轨迹:他们会快速读一下文章的前面两三行,然后把网页下拉,跳到文章中间再扫几眼,然后就立即跑到结尾把目光停留在屏幕的左下角。大多数网页被读的时间不超过十秒,只有不到十分之一的网页被读超过两分钟。

既然是扫读,深刻的内容就很难有竞争力。点击排行榜上的文章大多是短小精悍的,配有精彩插图,让人会心一笑,有机智而无智慧。很多流行文章都是相同的几个套路,没有真正的新意。与书相比,网上的文章是肤浅的。

为什么会出现这样的局面?Carr认为根源在于互联网这个技术。考察地图、钟表和书籍技术对人类思维方式的影响,会发现技术并不仅仅为思维服务,技术能改变思维。比如地图就加强了人们抽象思维的能力。而互联网这个技术是用各种小信息去干扰人的思考。神经科学家Michael Merzenich说,多任务的阅读方式是“训练我们的大脑去给废物注意力”。

更进一步,Carr认为Google正在把互联网向更肤浅推动。YouTube这样的业务对Google来说只是为了给搜索引擎带来流量,收集信息,以及排挤潜在的竞争对手,对公司利润几乎没有贡献。Google的真正业务是搜索,利润的绝对大头是广告。一个盯着屏幕看的用户不会给它带来任何广告收入,你必须不停地搜索和点击。正如其用户体验设计师Irene Au所言,Google的核心战略就是让用户快来快走,它做的一切都是为这个战略服务。对Google来说,短而新的信息可以带来更多点击,价值远远超过经典长篇大论,它把所有书籍上网,正是把整体的书变成一堆可搜索的短信息的集合。

不过经济学家Tyler Cowen则对肤浅信息的流行有不同的解释。在Create Your Own Economy(中译本《达蜜经济学》)一书中,他提出廉价必然导致低俗流行,是Alchian-Allen定理的要求。这个定理说如果低品质苹果和高品质苹果同时涨价,那么人们将更乐意买高品质苹果,反正也要花很多钱还不如吃个好的。在通讯和交通手段不发达的时代,出门看一场戏剧往往要花费很多时间和金钱,所以要看就看个经典的,而且戏剧往往很长。同样道理在中国发明纸张之前,竹简是昂贵而费力的信息载体,所以那时候的书本本都是经典。

如果获得信息很容易,我们就会倾向于短小轻快的内容。这有一个心理学原因,那就是期待和尝试的乐趣。比如说我们收到一个的礼品盒,打开这个盒子的过程本身就是个很愉快的经历,这就是为什么有人爱看最新电子产品的开箱视频。点开一个链接就如同打开礼品盒,各种短小信息构成了一股期待–尝试–发现的快乐之泉,我们享受这源源不断的小乐趣。另外,很多时候完成一个工作的乐趣集中在开始和结束,而不在漫长的中间过程,我们喜欢不断地开始和不断地结束。相对于一本600页的书,我们可能更想读两本300页的书。我们在网上追求能够立即满足的小刺激。

Cowen认为多任务不是坏事。当处理短小信息的时候,同时干好几个任务,比如说一边看新闻一边聊天,是高效的方式,而且人的多任务能力可以训练。更重要的是,多任务工作可以让我们对这些小事情保持兴趣。Cowen热烈欢迎互联网技术给人们带来的种种方便。

在Cowen看来,新技术的最重要特性是允许我们定制自己接收的信息。过去一张专辑里的歌曲是出版者设定的;而现在每个人的播放器上都是自己选择的节目。网上阅读的要点在于选择和过滤,我们应该学会订阅特选的博客,访问专门的论坛,从而排除无关信息。

哪种人最善于对信息定制,整理和排序?有自闭症倾向的人。自闭症患者往往因为大脑的缺陷而缺少对情感交流的解读能力。对人情的不解反而使他们让思想保持冷静客观。他们把更多的精力投入到对特定信息的收集,整理,分类和记忆中,是最极端的信息爱好者。也许自闭症者不怎么了解自己的邻居,但他们往往对某个特定领域了如指掌。一个小男孩爱好火车时刻表,他可以整日在网上看时刻表。

有点轻微的自闭症倾向甚至可能是成为大师的先决条件。Cowen列举了很多可能有自闭症倾向的名人,包括牛顿,爱因斯坦,图灵,爱迪生,亚当·斯密,甚至杰斐逊和莫扎特。Cowen考证,从福尔摩斯特别注重细节而又不怎么擅长处理人际关系这一点来看,他和柯南道尔都有典型的自闭症症状。更进一步,Cowen认为现代教育正是要把学生往自闭症的思维方式上培养。

Cowen没有回答的问题是上网能彻底取代读书么?收集并整理一大堆短信息能取代对成体系知识的学习么?显然不能。大量的信息不能自动带来深度理解。很多自闭症患者对细节具有过目不忘的超强记忆力,他们甚至可以把一本多年以前看过的书背出来,却不怎么理解书的意思。Carr对阅读肤浅化的担心是合理的,上网不能取代读书;而Cowen的贡献则在于如果我们上网,我们就应该用自闭症思维上网。

知识是有等级的。八卦新闻,实效性强的信息,网友对时局的看法,本来就不值得印在纸上浪费树木,在网上看看正好。扫读网页不见得是什么毛病,相反,能够以不同速度读不同等级的内容是最有用的阅读技术。

上网的关键态度,是要成为网络的主人,而不做各种超链接的奴隶。高效率的上网应该像自闭症患者一样具有很强的目的性,以我为主,不被无关信息左右。就算是纯粹为了娱乐上网也无可厚非,这时候读得快就是优点。一个真正的智者不会让上网占用读书时间,他应该经常能够平静地深入思考,只有电话接线员才随叫随注意。…

物理学的逻辑和霍金的答案

(《新知客》,2010年11月)

明星物理学家霍金的新书 The Grand Design (《大设计》) ,和当年的《时间简史》一样受到公众和媒体的热烈追捧,成为又一本能够连续占据畅销书排行榜的“物理书”。很多媒体关注的重点都是说霍金在这本书里排除了上帝存在的可能性,但其实这本书说的是比上帝存不存在更重要的事。它说的是为什么会有这么一个恰好适合人类生存的宇宙。

这大概是人类所能提出的最大问题了。宇宙为什么存在?宇宙是怎么起源的?我们这个宇宙的性质非常精妙地符合人类需求,那么它是被“设计”出来的么?很多人认为物理学家跟哲学家和宗教人士一样,追问这些问题是为了获得“内心的平安”,但物理学家跟他们不一样。物理学有一套非常不同的逻辑。

我曾经在一次聚会上跟一个牧师聊天。这是一位非常虔诚的牧师,走到哪都带着一个破旧的随身听,里面放的是《圣经》录音带。我以为我的知识足以挑战他的信仰,我问他你怎么可能相信地球是在6000多年前被上帝创造的呢?我们有充分的证据表明地球上很多东西的年龄超过一百万年。不料这位牧师说了一个几乎让我目瞪口呆的理论。他说上帝创造万物的时候可以创造各种年龄的万物。这就好比说假设我现在可以创造出来一个人来,这个人的年龄看上去是20岁,可是他是什么时候被创造的?现在被创造的。

这真是一个完美的理论,我无法从逻辑上质疑它的正确性,这位牧师靠这个理论获得了内心的平安。可见获得内心的平安是容易的事情,如果你相信上帝无所不能,上帝安排了一切,你就可以解释任何现象,你就获得了内心的平安。可是物理学家对自己有比“内心的平安”更高的要求。我对这个牧师说,我的理论不但能解释各种化石的年龄,我还能对尚未发现的化石做出预言,你的理论也能解释,可是你的理论能预言么?

判断一个物理理论的好坏不在于这个理论是否符合人的直觉,或者是否够漂亮,而在于它能不能做出预言。与哲学家们整天为了坚持自己的学派和“信念”跟人吵架不同,物理学家从不执着于任何一个物理理论,堪称是最彻底的革命者。

但物理学家也有一个可以称作“信念”的东西,这个信念就是世界应该是合“理”的。也就是说,物理定律应该适用于所有时间和所有地点,所有事件都必须精确地符合描写物理定律的数学方程。

正是这个信念使得物理学家可以不断地做出预言。如果有一个侦探发现一月一日有人被杀;二月一日又有人被同样的方法杀死;三月一日还有人被同样的方法杀死,他就会得出一个理论:罪犯在每月一日杀人。这个理论不但能解释过去的三起杀人案,而且能做出四月一日会有人被杀的预言。物理学家的思路类似,只不过对他们来说,四月一日必须有人被杀 — 不允许物理定律像犯罪一样有被停止的可能。过去,电磁相互作用和弱相互左右被认为是两种不同的力,而萨拉姆和温伯格在1967年用一个统一的理论把这两种力统一了起来。这个理论不但能解释已知的现象,还预言了在这个框架内必须存在的三个新粒子,后来果然被试验发现。反过来说,有人试图把强相互作用也给统一进去,结果得到了几个所谓“大统一理论”,Grand United Theory (GUT)。这些 GUT 都预言质子应该会衰变,然而目前为止所有的实验都表明质子就算真的会衰变,其半衰期也比 GUT 预言的要长,所以 GUT 理论就算再精妙也不能被接受。

既然所有事件都符合物理定律,上帝还有什么用呢?如果上帝不能干预物理过程(比如说制造奇迹),他存不存在还有什么意义呢?牛顿就提出了一种意义。

牛顿在解出行星轨道方程之后发现引力会对这些轨道做出扰动。而这种扰动一旦累积起来就会导致轨道的不稳定,使得行星或者坠入太阳,或者脱离太阳系。据此,牛顿认为上帝必须存在,只有上帝才能时不时地对地球轨道进行微调,确保稳定。要不是拉普拉斯后来证明这种轨道扰动是周期性的不可积累,物理学家大概也只好接受上帝存在。

牛顿认为上帝必须存在的另一个理由则不需要他的直接干预,这就是地球在太阳系的位置实在是太幸运了。方程表明一个行星的轨道在一般情况下应该是椭圆形,圆形是非常特殊的情况。如果地球轨道是椭圆,哪怕“椭”的不是特别厉害,其近日点和远日点的温度也将会非常不同,而不会有像现在这样一年四季温度相差不算太大的环境。而地球的轨道几乎就是圆的!地球四季的温差几乎完全来自自转和公转的倾角,而与距离太阳远近无关。地球的另一个幸运之处在于这个距离与我们这个太阳的质量正好搭配合适,哪怕太阳质量有20%的不同,地球也将因为过冷或者过热而不适合生存。牛顿考虑到这些巧合,认为这一定是上帝安排的,就好像一个连续买彩票中大奖的人认为这是上天的眷顾一样。要不是后来我们发现宇宙中有那么多的行星系统所以其中有一个适合生存的不算意外,物理学家大概也只好相信这个巧合是安排的。

相对于那些因为自己“信仰”无神论而否定牛顿的人而言,像牛顿这样的较真精神反而更了不起。现在,类似于牛顿遇到的这些问题仍然困扰物理学家。这些问题的特征就是我们这个宇宙实在太幸运了,差一点都不行!

第一个问题是宇宙起源的初始条件。天文观测和经典理论都表明宇宙起源于大爆炸,而量子引力的进展则表明大爆炸比此前想象的要快得多。对宇宙微波背景辐射非均匀性的发现证实了暴涨理论。然而要想实现足以形成我们这个宇宙的暴涨,宇宙起源的初始条件必须满足无比严格的要求。这就好像你要做一个炸弹,这个炸弹的形状必须是一个绝对精确的球形它才能实现预期的爆炸效果一样。除了上帝谁还能准备这样精确的初始条件?

第二个问题是各种物理参数为什么如此地恰到好处。计算表明如果把强相互作用的强度改变0.5%,或者把电磁相互作用的强度改变4%,碳和氧这两个对生命至关重要的元素就不会出现;哪怕把质子的质量增加0.2%,它就会迅速衰变从而根本不会有任何化学现象。另外,空间还必须是三维的,否则行星轨道就不会稳定。现代物理学无法从逻辑上解释为什么这些物理参数是这样的,就好像一个网络游戏玩家不能用物理定律解释某些超强 boss 的武力值一样,唯一的解释似乎是它们是被“设计”成这样的,否则这个宇宙或者游戏就不好玩。

霍金在书里给出了一个不需要设计者的解释。霍金首先用所谓“无边界条件”来取消了“宇宙创生之前发生了什么”这个问题,这个条件说在早期宇宙的极端条件下,时间维被扭曲得好像一个空间维,也就是说那时候有四维空间而没有时间,也就不存在“之前”的问题了。进一步,早期宇宙处于量子态,而它的历史则是所有满足“无边界条件”的历史叠加的结果。一个量子的宇宙可以自发地诞生。

正如量子力学中的一个粒子可以有多种不同的状态,创世之后也可以产生多种不同类型的宇宙状态。每一个可能的宇宙中都有自己的一套物理定律和物理常数,我们只不过恰好生活在其中一个允许星系和人类出现的宇宙中而已。这就好比说既然有非常多的行星系统存在,我们恰好得到一个适合人类生存的地球就并不奇怪。

霍金在书里使用物理学的一些最新进展,比如M理论,和他本人在量子引力方面的研究成果作为论据,对这些大问题给了一个相当说得过去的答案。然而在专业的物理学家看来,这个论证很不严谨。书中用到的很多物理理论,比如说超引力,在数学上并不严格,更不用说M理论还远远没有得到实验证实。霍金几乎是等于宣称物理学家一直追求的“统一理论”已经成型,大问题的答案已经有了,可是很多物理学家不会同意他的看法,比如中科院理论物理研究所的李淼老师就不买账。

不过霍金也解释了为什么M理论是最佳选择。首先,如果你的宇宙是一个连续系统,它的物理定律不随时间改变,那么其中必定能量守恒。其次,这个守恒的总能量必须等于0。这是因为如果能量大于零,宇宙就无法被凭空创造出来;而如果能量小于零,它就可以在真空中的任何地方出现。更进一步,既然宇宙的总能量为零,而在其中制造星球需要正的能量,那么它就必须包含引力,因为引力提供负能量。最后,这个引力必须用超引力理论来描述才能消除无穷大项,而M理论正是超引力的最一般理论。

霍金甚至提出了这套理论的一个预言:如果宇宙真是这样诞生的,那么在微波背景辐射中应该能观测到某种精微的特征,这种特征目前的观测手段还看不到,但将来或许可以看到。

物理定律必须处处管用,以至于上帝就算存在也无事可做;而一个好的物理理论必须不但能解释已知的现象,还能对未知的现象作出预言。这就是物理学的两个逻辑。霍金的学说显然符合第一个逻辑,只是不知道它能不能符合第二个。…

剧情函数库

(《新知客》,2010年10月)

著名物理学家徐一鸿先生在《可怕的对称》这本书中谈到对称性群的时候提到一个很有意思的笑话。说

有一个客人随他的朋友参加一个笑话俱乐部的聚会。一个会员叫道,“C—46!”,其他人都会心地笑了起来。另一个站起来叫道,“S—5”,引得所有的人都笑了起来。这个迷惑不解的客人问道,这是怎么回事?他的朋友解释道:“所有可能的笑话,当然不能计细小的差别,都已经被归类编上号了,我们心里都知道这些编号指的是什么。”

这个故事多年以来在我脑中挥之不去。是否真能做到把所有可能的笑话发现并列举出来,以至于一一编号,并宣布从此之后世上再没有新鲜的笑话了呢?考虑到一个有实用意义的笑话应该可以用不超过500个汉字讲完,而500汉字的排列组合只有有限多种,我们有充分的理由认为世界上只有有限多个可能的笑话。唯一的问题是能不能在人类有生之年把它们穷举,因为这种排列组合的总数是一个天文数字。好在看来人类似乎还没有发现所有可能的笑话,总能出几个新段子。就好像音符的排列组合也有限,而人类并没有终结所有可能的音乐一样。

然而令人遗憾的是,所有可能在影视剧里出现的剧情,似乎已经都被编剧们发现并使用过了。只要看得足够多,就会发现所有的故事都似曾相识,所有的桥段都是俗套。比如有人总结了“香港TVB剧集俗套大全”,大结构无非是女人斗,争家产和江湖恩怨之类。小桥段也都是反复使用多次的,比如掉下悬崖一定死不了,好人躲进府中坏人一定搜不到,女扮男装很久才被发现,世界上有两个人长得一模一样等等,其实大多数都是传统评书和武打小说用烂了的。但俗套绝不仅限于中文世界,美剧翻来覆去拍普通人成为超级英雄,犯罪分子则必有悲惨童年经历;日本少女漫画中两人一旦发生一夜情,早上起来床上一定会少一个人。

一部影视作品,一本小说,甚至是一段广告,无非是由多个大小不同互相嵌套连接的剧情桥段组成。现在我们看到好多桥段都是被反复使用了的,那么也许所有已知能用的桥段总数并不是一个天文数字。既然如此,有没有可能干脆把所有被用过的桥段分门别类,像笑话俱乐部一样,不计细小的差别,全部列举出来?

这件事已经有人做了!这就是 TV Tropes(tvtropes.org)。这是一个维基百科式的众人合作贡献内容的网站,它的主题是分析列举各种流行电影,电视剧,动画,小说和游戏中出现的所有剧情。网站的参与者不是任何影评人,而是一群极客,他们看电影不是欣赏情节的好坏,而是本着理工科的精神把情节分解,识别并统计其中的桥段。网站的源起是一个程序员想要分析《捉鬼者巴菲》电视剧中使用的各种俗套,现在正发展到所有作品。在 TV Tropes 眼中,没有那个作品真是特例独行的,几乎所有剧情都不过是对已有桥段的排列组合。

看过《阿凡达》之后,很多人反应画面一流但情节一般。那么《阿凡达》的情节有多一般?TV Tropes 列举了片中使用的上百个“俗套”。比如剧中 Jake 第一次去森林探险,当他遇到一只雷兽,女科学家 Grace 告诉他不要动,然后雷兽自己走开了……但实际上雷兽走开的原因是 Jake 身后有一只更大的猛兽,这时候 Grace 就大喊让他赶紧跑。这种把英雄从一个危险中拯救出来的拯救者其实是一个更大的危险的桥段,在 TV Tropes 中叫做“Always a Bigger Fish”。在这个桥段的条目下,网站列举了使用过它的多个作品,比如《侏罗纪公园3》。

桥段(tropes),是剧情的基本粒子,也是 TV Tropes 的基本单位,被分门别类的一一列举,就差编号了。但 TV Tropes 的真正意义并不是“桥段百科全书”或“桥段数据库”,而是一个“桥段编程语言”!每一个程序员写程序都要调用大量现成的库函数,每一个做数值计算的科学家都有一本算法大全,TV Tropes 就是剧本的库函数和编剧们的算法大全。

比如你想在一部动作电影里来一段追逐戏,TV Tropes 会告诉你追逐戏一共有57种不同的桥段可供选择。如果被追的这个人比较笨,一个办法是让他往高处,比如说往楼顶上跑,这样的结果就是他会被陷在那里,《金刚》中就用这个办法。如果被追的这个人很聪明,就必须给他一点难度,比如说他想消失在人群中可是身上穿着某种显眼的衣服不能换,然后再安排这时候正好赶上有一群人都穿着类似的衣服走过!比如《黑暗骑士》中的几十个人质就都被戴上了同样的面具。相比之下,追坏人的英雄随便拦下一辆出租车,让司机“跟上前面那辆车”这个桥段就实在是太俗套了。

我们设想在生活中人与人之间应该有几乎无限多种可能发生的事情,为什么剧本中只有57种追逐方法?因为只有这些追法好看。正所谓“文似看山不喜平”,观众看小说看电影追求的是好看,而不是真实。从有通俗文学那天开始,一代代的作家和编剧们绞尽脑汁,就只发现了57种好看的追逐。反过来说如果就是不用任何桥段,平铺直叙,就好像我最近看的一个网络小说一连三天连载都是你一言我一语地开会,那还有什么意思?

TV Tropes 网站的出现,必然是通俗文学史上的一件大事,因为它把编剧从艺术变成了技术。莎士比亚时代天才的剧作家都是单打独斗,而现在美剧编剧都是团队合作了。我希望中国的编剧们,尤其是TVB,多读一读这个网站,学几个新鲜点的套路。也许未来的编剧们讨论剧情,是这么一种方式:

编剧A:“前25分钟是一个A-15剧情,分四段,分别是NM-23,KB-1,DSJ-9和Z-4。建议其中从第一段到第二段的过渡使用一个XUB-7。”

编剧B:“XUB-7最近三年已经被人用过13次了,是不是可以换成PI-32?”

编剧C:“不妥,我查了最新的统计,63%的亚洲20岁以下女观众不喜欢PI-32剧情。”

庖丁解牛到了一定的境界,眼睛里面看到的就不再是一头完整的牛了。一个人一旦熟知了 TV Tropes 上的各种桥段,再看电视剧就会只看到一堆库函数。这样看电视剧还有意思么?所以 TV Tropes 的口号就是“TV Tropes Will Ruin Your Life”。无形之中,剧情数据库把观众分为“会看电影的”和“不会看电影的”两类,只有不会看电影的观众才会被剧情感动,而会看电影的观众则永远失去了这个乐趣。豆瓣这样的小资影评网站有可能会被理工男们占领,他们使用桥段编码对每一部影视剧进行基因分析,用外行看不懂的语言剧透。

《连线》杂志的 Scott Brown 在谈到 TV Tropes 时发出感慨,认为原创剧情已经消失了。其实也不至于。真正的原创剧情是高雅文学和文艺片的事情,流行文学和商业片只需要“好用的”剧情。评价严肃作品,往往要看它是不是发明了独一无二的人物和剧情。所以严肃文学作家是科学家,通俗文学作家是工程师。另一方面,科学和社会进步总能带来一点新鲜的剧情,比如发现相对论之前,又有哪个剧本使用过时间旅行?

最后让我把本文开头的笑话讲完。

有一个人站起来叫道,“G—6!”,这时每一个人都捧腹大笑起来。这个客人问究竟是什么笑话如此可笑。他朋友答道:“哦,这是乔·史蒙,他笨透了,还不知道根本没有G—6 这种类型的笑话呢!”

因为一个人说错编号而引发的笑话本身必然也在笑话俱乐部的数据库中,但是亲眼目睹一个笑话发生还是值得捧腹大笑一次 — 说明就算所有桥段都已经被发明了,商业片仍然可以拍得很好看。有了各种库函数,编程是如此的简单,以至于高中生也会写程序,可是最好的程序员仍然可以把编程从技术达到艺术的境界。…

从Web 2.0到推荐引擎2.0

(《新知客》,2010年9月)

互联网应用的新概念似乎总是层出不穷,然而相对于2005年前后中国一下子冒出来的一大批 web 2.0 网站和最近几年出现的“云计算”,此时此刻的互联网业界似乎有点沉闷。人们开始谈论,互联网下一个有趣的事情是什么?

百姓网 CEO 王建硕,最近在《中国企业家》杂志发表文章《2011年注定是中国互联网第三春》,提出一个五年周期理论,认为每隔五年左右就会有一批人出来创业,就会有一批风险投资周转完毕转而支持新的项目,这样经过这两年的沉闷,2011年必将有新东西爆发。王建硕看好的概念是“移动互联网”。紧接着,著名 IT 博客“对牛乱弹琴”,也谈到2005这个奇迹年,不过他并不怎么看好2011年的爆发,认为现有的 web 2.0 公司仍在寻求能真正赚钱的模式,而不会出现什么全新的概念。

有一个东西可能成为未来几年互联网公司的新主攻方向:推荐引擎。

豆瓣网,土豆网和各种视频分享网站,包括博客的流行,在中国都是从2005年开始的。今天的年轻人中可能任何两个人过去一天内看过的节目和新闻都完全不同,每个人都能根据自己的兴趣找到特有的一套内容,这就是 web 2.0 的力量。对2005年的创新公司来说,最重要的革命性思想可能是2004年《连线》杂志主编 Chris Anderson 提出的所谓“长尾”理论。这个理论说互联网使得过去几件流行商品通吃的局面一去不返了,现在哪怕是最不流行的东西也会有人喜欢,是小众市场的时代。

互联网的大趋势,甚至可以说是整个社会的一个大趋势,是人们面临的选择越来越多。过去是全国上下看一个电视剧,而现在中国每年生产一万五千集,其中很多甚至根本没有被播出的机会。1994年,全美国总共有50万种不同的商品出售,而现在仅仅在亚马逊网站上就有超过240万种商品。长尾和 web 2.0,正是选择越来越多带来的现象。 Anderson 提出长尾的三个法则,第一是让所有东西都可以被获得;第二是让这些东西卖的很便宜;第三是帮我找到它。前两点可以说已经做到而且做得很好了,现在的关键是第三点,怎么帮助用户作出选择。这就是推荐引擎的作用了。

据市场分析公司 Forrester 统计,那些在电子商务网站被推荐过商品的用户,有三分之一的人会根据这些推荐买件东西。任何广告都不可能做到这样的成绩。所以推荐引擎不但是 web2.0 的最核心技术,更是广告的终极形式。我们可以设想,当一个人面对购物网站上几十万种商品,有多大可能没有一件是他愿意买的呢?这个人空手而归的最重要原因,也许是那个他一定会买的商品没有被他发现。

多年以前,我曾经在亚马逊买过一本《量子力学》,是物理系研究生的教材。结果很长一段时间内亚马逊不停地向我推荐各种物理教材。这个推荐引擎想的非常周到,只可惜它不知道我早就不需要这种教材了。现在在当当网买书,每一本书的关联推荐往往都是一些流行热卖的类似的书,这些书我早就知道而没有买,难道会因为看到推荐才买么?人们需要的是个性化的,恰到好处的,最好还有一点惊喜的推荐,而传统的推荐引擎太落后了。

在线DVD租借提供商 Netflix,自己有一个算法保密的推荐引擎 Cinematch,根据用户对电影的打分来判断他还可能喜欢什么电影。这是一个相当优秀的引擎 — 如果你想知道喜欢一本书的读者还喜欢什么样的书,亚马逊可以免费告诉你答案,而 Netflix 的电影推荐服务只给付费用户,甚至可以说是一大卖点。但 Netflix 并不满足,它在2006年提出悬赏,希望有人能把推荐引擎的性能提高10%,这10%的奖金是一百万美元。

这件事充分说明一个好的推荐引擎是多么重要,同时又是多么困难。这笔奖金一直到2009年才被一个七人小组得到,其中包括两名AT&T的科学家。

传统的推荐引擎主要根据统计用户记录来发现关联,重点是“买过这本书的人一般还都买了什么书”。这个原理是简单的,它的缺点在于往往推荐的都是一些相似的东西,而且这些东西必须已经有很多人买过了。它无法制造惊喜。这可能也是很多人更愿意逛书店的原因之一,在书店里往往会偶遇一些本来绝对想不到自己会喜欢的,而且不怎么出名的好书。另一方面,传统的引擎不知道一本书或者一个电影到底好在哪里,为什么人们会喜欢,以至于无法做出更精确的推荐。

但现在有两个新的推荐技术,堪称是推荐引擎2.0。

Pandora 是一个专门致力于歌曲推荐的公司,它的办法是分析歌曲。在 Pandora 的算法中,给每一首歌都有400种不同的属性,聘请一位音乐专家,使用20分钟的时间给这首歌的所有可能的属性打分。这样一来每一首歌都被一组数标记了属性。Pandora 的目标是建立一个包含所有歌曲的数据库,称之为“音乐基因组计划”。他们每月能分析一万首歌曲,在过去十年之内已经分析了74万首。推荐算法的原理是,如果你表示喜欢一首歌,程序会自动寻找跟这首歌的“基因”相同的歌曲,并赌你也会喜欢。Pandora 现在已经是 iPhone 和 iPod 中最流行的应用之一,随着播放的进行你可以随时表示喜欢或是不喜欢一首歌,程序通过网络自动提供各种你可能喜欢的歌曲。

Pandora 的独特之处在于它完全根据一首歌的本身属性和你自己的喜好记录来判断你喜不喜欢,而不考虑别人喜不喜欢。显而易见的好处是也许这首歌并不流行,可是你就是喜欢。Pandora “了解”歌曲。统计表明,在使用过 Pandora 的人中,45%买了更多音乐,只有1%的人因为 Pandora 减少了音乐购买。

而另一个推荐引擎公司, Hunch,有更大的野心,它的做法是直接分析人。Hunch 并不去分析歌曲,电影或者书有什么属性,它分析每个用户有什么属性。你喜欢百事可乐还是可口可乐?你喜欢蓝色的笔还是黑色的笔?通过大量的统计分析,Hunch 发现,如果你相信 UFO 存在,那么你更有可能喜欢百事可乐;如果你有一个 MBA 学位,那么你更有可能喜欢蓝色的笔。

现在去 Hunch 的网站,它允许你用 Facebook 或者 Twitter 的账号登陆,然后它会问你20个看上去与电影和书籍一点关系都没有的问题。这些问题包括你住在城市,郊区还是乡下,你会不会自己安装家庭影院的音箱系统,你能不能连续做10个引体向上,喜欢吃什么样的炸薯条等等。然后根据这些信息,它将会向你5本杂志,5个电视剧和5本书。我很少看电视剧,但它推荐的5本杂志中有2本是我早就订阅了的;它推荐的5本书里有一本是我看过的。它其他的推荐我不怎么感兴趣,但这已经是相当不错的准确度。Hunch 的雄心壮志是给每一个用户建立一个个人喜好档案,然后那些电子商务公司就会向它购买完全基于个人喜好的推荐服务。

中国显然需要高性能的推荐引擎,而且考虑到国人的喜好与西方用户未必相同,这种推荐引擎还必然是具有中国特色的。我预计推荐引擎会在中国有很大的发展,但是其中也有困难。

首先,“炼成”一个好的推荐引擎需要大量的真实交易数据,而这些数据往往各公司保密,是一种稀缺资源。Netflix 是为了举办100万美元的优化大奖,才公开了部分用户电影评价数据。Pandora 是自己采用劳动密集型的做法雇人给每一首歌设定属性,而且费时多年才开始盈利。很难想象淘宝或者当当能把自己网站的交易记录交给一个第三方公司研究。

更重要的是,推荐引擎技术很难山寨,它不仅仅是一个编程的问题,而必须请统计学家,艺术家和工程师合作研究。早期的互联网公司最大的不同是它使用了互联网;中国在2005年爆发出来的 web 2.0 公司,最大的不同也许仅仅是一个好主意;而现在则到了需要核心技术的时候。也许那个大学本科退学生,甚至高中生想起来一个好主意,写几个月程序,然后就能拉到风险投资说创业就创业,说上市就上市的时代已经快要结束了。

从 web 2.0 到推荐引擎2.0,是互联网公司从低端到高端的一个进化。…

科学无定论:从手机辐射到全球变暖

(《新知客》,2010年8月)

你相信全球变暖么?你相信手机辐射致癌么?这也许是两个愚蠢的提问 — 手机辐射和全球变暖是纯粹的科学问题,应该由科学家来回答。科学事实怎么能谈“相信不相信”呢?只能谈“知道不知道”,“理解不理解”,真是如此么?

好的科学家给人的印象常常是冷酷无情的真理提供者:他们从不考虑任何人的爱憎,敢于跟教会,政府和广大公众的偏见唱反调,是愚昧众生中的孤胆英雄。而一般人则应该学习科学家们提供的答案,最好再把答案传播出去,与利益集团和偏见无知者作斗争!不是么?比如全球变暖,2009年的调查显示只有57%的美国人认为全球变暖是真的,相信全球变暖是人类行为导致的更只有36%,这两个数字都比上一年低。我估计在中国调查的话数字也不会高。是不是公众正在变得越来越愚蠢,或者利益集团加大了宣传攻势呢?

事实是,手机辐射和全球变暖的问题都有一点麻烦。尽管手机辐射是如此的令人关心,但就当前而言,科学家也不知道手机辐射是否真的有害。尽管全球变暖是如此的迫在眉睫,尽管绝大多数科学家都“知道”全球变暖是真的,但遗憾的是很多科学家对这个结论的处理方式远远谈不上科学。

人们对手机辐射的最直接感受是打电话的时候手机会把整个头部“烤”热,但这个热量其实比站在太阳下头部感受到的“阳光辐射”低一个数量级。手机发出的无线电波强度显然大于调频广播,但是否足以对人体细胞产生某种伤害,以至于导致癌症呢?很多科学家认为不会。2008年,美国国家癌症研究所主任 Robert Hoover 就曾经这样向国会作证。可是你怎么敢肯定就绝对没有这种伤害?你怎么知道 Hoover 没有被通讯公司收买呢?

最好的办法是做实验。1995年的一个实验发现,每天两个小时手机强度的无线电波照射会对老鼠的脑部细胞产生伤害并可能导致癌症。然而2004年一个欧盟资助的项目重复做了这个实验,却没有得到类似的结果。

如果手机真的对健康有害,那么那些频繁使用手机的人应该比不用手机的人更容易患上某种疾病。2007年丹麦癌症学会对超过42万手机用户的统计表明,手机对健康无害。另有很多类似的研究得到同样的结论。但这些统计研究也不是完全可靠的。比如丹麦的这项调查并没有包括那些不需要自己支付手机账单的商业用户 — 而这些用户往往是使用手机最频繁的。另外,这项研究仅仅统计到2002年的肿瘤诊断,可是手机辐射也许需要几十年才能导致脑癌。

我们需要的是一个样本全面,手段科学的彻底调查。国际癌症研究总署 (IARC)就在组织了一项十三个国家参与,耗资2400万美元的长期研究,称为 Interphone Study。今年五月,研究报告终于出来了。结论是这样的:第一,那些最经常使用手机,且用的历史最长的10%用户,他们患上某种脑癌的概率比那些根本不用手机的用户高40%。这似乎是一个明确的警告。

可是这份报告的第二个结论是,那些不怎么经常用手机的用户,他们患脑癌的概率比那些只用有线电话的人要低!难道说时不时地用用手机反而会对大脑有好处么?

没准还真是这样。一个更有意思的最新成果是南佛罗里达大学的几个科学家再次用老鼠做实验,同样是每天两个小时的照射,结论居然是手机辐射可以减少记忆损失,从而避免老年痴呆症!

所以的确有科学家怀疑手机辐射的危害,但有的科学家发现手机辐射并没有危害,有的科学家甚至发现手机辐射有好处。以至于世界卫生组织和美国国家癌症研究所都既不能宣布手机辐射无害,也不能宣布有害,只能说“没有证据显示”手机对公众健康有害。在这句“没有证据”的背后,是多个研究项目相互矛盾甚至可以说漏洞百出的结论,结果就是对于手机辐射的研究,你就算都知道了并且理解了,最后仍然要面对“相信不相信”的选择。

全球变暖的研究者们达成共识的能力比研究手机辐射的科学家要好得多,与疑虑重重的公众相反,绝大多数科学家都认为人造全球变暖是真的。但我们可以看到,公众仍然有充分的理由问一个“相信不相信”。作为一个全球变暖学说的支持者,伯克利物理教授 Richard Muller 在其 Physics for Future Presidents 一书中列举了科学家和媒体(尤其是帮戈尔获得诺贝尔和平奖的纪录片《难以忽视的真相》)犯下的四个错误。我们将会看到,中国的专家和媒体也在犯同样的错误。

歪曲

一个众所周知全球变暖“证据”是变暖引起南极冰盖的减小,这会导致海平面的上升。然而事实是2001年的 IPCC 报告预测全球变暖会导致南极冰盖增加!为什么?因为变暖促进海洋水分的蒸发从而增加南极的降雪!所以你最多只能说南极冰盖减少证明科学家的预测模型有问题,而不能说它验证了全球变暖学说。

另一个著名的歪曲事实是戈尔纪录片中一张图说明飓风引起的人类财产损失最近一百年以来爆炸式增长,这张图被广泛引用,目的是证明全球变暖正在让地球上的气候灾害越来越多。这张图的唯一问题是它完全没有考虑通货膨胀。如果你把通货膨胀计算进去,历史上的灾害损失基本上是随机分布的。很难想象这么重要的图会犯这么低级的错误,只能解释成是故意的。

至于戈尔片中那个因为找不到冰块而淹死的北极熊?北极熊被淹死的全部证据只有四只,他们被淹死的原因是赶上了风暴。

夸张

很多人认为是全球变暖会增加飓风等灾难性天气。的确有些科学家的模型认为这是真的,但这些模型并不完善。而另一些科学家则认为全球变暖会减少飓风的出现!风暴的产生是非常难以模拟的气象过程,不同的模型往往有完全相反的结论,总体而言,科学家并没有达成什么共识。历史记录也没有证据说现在的飓风比过去多。

数据采摘

全球变暖带来的改变是多方面的,而为了引起公众的警觉,人们往往只报道那些坏的方面。在戈尔的纪录片里,他提到由于全球变暖,龙卷风增加了。从历史数据来看,这个论断是正确的,可是他没有把数据说全。没错,如果你考察过去50年的数据统计,记录到的龙卷风的总数的确增加了,但是大的龙卷风,那些足以造成灾害的龙卷风,减少了!在这里戈尔没有撒谎,但是你能说他很诚实么?

数据采摘并不只是戈尔的习惯,很多科学家也会有意无意地这么做,比如那张著名的过去千年北半球温度变化曲线,就被查出存在重大的统计缺陷。

新闻偏见

如果这个冬天不太冷,媒体就会说你看这就是全球变暖;如果这个城市40年前比现在冷很多,媒体就会说你看这就是全球变暖;甚至2009年冬季全球很多地方非常冷,结果有媒体说专家认为全球变冷就是全球变暖。今年春季中国南方大旱,有专家说是因为全球变暖(一个新闻标题甚至是《当干旱成为习惯》);今年夏季中国南方大汛,有专家也说是因为全球变暖。事实是过去一个世纪内全球平均温度只升高了0.55度。平均到每一年,温度能升高多少呢?每年升高的这么一点温度是否足以造成今年相对去年这么大的改变?大部分被人们感觉到的“非常”气候和变暖其实是气候的正常起伏和城市建设增加排热量的结果。

全球变暖的趋势很可能是真的,而且很可能是人类行为造成的,但是其中有非常多有争议的地方。甚至就连到底是二氧化碳增加导致温度上升还是由于温度上升导致二氧化碳增加这个最基本的论断,科学家们也在争论之中。全球变暖并不简单,可也许是本着小心为上的目的,媒体和科学家都倾向于向公众传达简单的信息。

也许公众喜欢简单的信息,但简单有代价。上世纪80年代,美国加州曾经连续六年干旱。为了让公众充分认识到干旱带来的可能危害,科学家和政客把这场干旱描写成永久干旱,一些科学家甚至提出干旱是全球变暖的特征。于是政府投资搞了很多抗旱的设施。然而六年过后开始出现连续的高降水!最后的代价是科学家们失去了公众的信任。

科学家不是圣人,他们只是一帮干着可能不太普通的工作的普通人。有些科学家会为了争取眼球和科研经费而夸大自己的结果。有些科学家会因为拿了利益集团的资助而故意得出有偏见的结论。更重要的是,所有科学家都会犯错误,就算他们不犯错误,他们也不可能总在公众最需要答案的时候立即提供答案。

科学家不是真理提供者,科学家是真理探索者。一个科学家的价值不是“知道”,而是“不知道”。科普文章的重大误区,在于把科学描写成科学家已经定论的东西。其实科学家在真实生活中最常干的并不是与公众,民间科学家或者宗教团体辩论,而是与同行辩论。真正值得报道,最值得玩味的科学是那些尚不知道正确答案,一帮科学家激动地争执不休的科学。科学前沿的意思不是与日常生活无关,而是没有定论。

对科学家的信任度下降不但不是社会的退步,而且是社会的进步。我们应该把科学家当成打仗之前散出去的探马。他们一有风吹草动就兴奋地跑回来报告,最后摆在我们面前的情报往往互相矛盾。我们不怕矛盾的情报,因为我们了解这些探马可能会犯错误,或者他们的确不知道。我们要做的也许仅仅是耐心等待。除此之外,作为信息时代的人,我们得自己判断:怎样去相信一件“科学家讲的事情”。

(全球变暖部分所有没有给出参考文献链接的例证来自 Muller 的书。)
—-

本文交稿之后,看到 Nature 上一篇新闻综述:
Climate science: An erosion of trust?

此文谈的也是气象科学家在公众心目中信任度下降的问题。它没有说到点子上。…