Archive for category 风头浪尖

数据、大数据与欧洲杯

(《南方都市报》,2016年7月12日)

体育比赛大概是公众接触到的数据密集度最高的领域了。从几十年前宋世雄解说中国女排比赛,我们就习惯了听取各项数据:这名球员年龄多少,身高多少,她今天已经得了多少分,中国队的得分中发球多少分,扣球多少分,对方失误送了多少分等等等。一边欣赏感性的运动之美,一边盘算实时数据,就好像后来的人打电子游戏一样。

这些数据绝非枯燥无味。数据显示成就和潜能,数据代表胜负的趋势,数据还是浮夸的资本和球迷之间争论的终结者。美国有的专业棒球杂志上没有煽情的报道和图片,全是各种数据表格,一个有极客精神的资深球迷光看这些数据就能达到高潮。

当然那时候数据就叫数据,并不像今天这样有点统计数字就敢叫“大数据”。然而现在毕竟是所谓“大数据时代”,那么在这个时代,要把数据玩到什么程度,才算没有辜负“大数据”这个称号呢?

首先这意味着用数据预测比赛胜负。这得算是一个古老的行业,博彩公司一直都在这么干。大数据的一个新玩法,就是使用“大量”的数据 — 以本届欧洲杯为例,雅虎公司的科学家有个新创意[1],他们社交网络Tumblr上今年前几个月但凡涉及到欧洲杯参赛球队的对话全都提取出来,一共2400万条,跟雅虎体育存的比赛数据结合起来分析预测。

换句话说这些科学家很重视球迷的群体智慧:球迷说哪个队厉害,没准这个队就真厉害。结果可想而知,英格兰队 — 在球迷中的待遇相当于欧洲的中国队 — 被这个模型高估了:雅虎预测英格兰进四强,事实上英格兰连八强都没进。

雅虎大概没搞明白信号和噪声的区别,不过他们也许仅仅是为了显示自己了解社交网络。一个更理性的预测应该纯粹用比赛数据分析。某精算咨询公司就用几百万次计算机模拟的方法预测法国队的夺冠概率最高[2],其次是德国和西班牙,而事实上进入决赛的葡萄牙的夺冠概率仅列第七位。该公司号称这个预测是不带任何偏见的,但我必须指出这是一个法国公司。

大数据的更高级用法是直接用数据指挥比赛!早在2006年世界杯,德国队守门员莱曼就在对阿根廷的点球大战之前获得一张教练给的小纸条,纸条上是科隆大学50名精英分析出来的阿根廷队队员踢点球的习惯动作和方位,并以此取胜。现在德国足协跟软件公司SAP合作,搞了两套升级版的大数据系统[3]。这回队员和教练不用小纸条了,直接在iPad Pro上实时用图形和视频分析对手每个球员的攻防特点,球队阵型和踢点球习惯。这些新一代球员 — 可能受从小打电子游戏的影响 — 都热爱阅读数据,软件得到了很好的应用,所以德国队一遇到点球决胜还能继续取胜……不过还是没有进入决赛。

其实在我看来,大数据预测和大数据指挥都有一个本质问题:数据只代表以往的经验。人作为一种有自由意志的动物是可以变的!如果你知道我踢点球的习惯 — 更确切地说是如果我知道你知道我踢点球的习惯 — 那我面对你的时候是不是应该改变习惯?难道我就不能多练几种罚点球踢法?事实上,对策论告诉我们,最好的办法是我有时候变有时候不变,让你猜不到。而“猜不到”难道不是体育比赛最大的魅力吗?

我认为大数据真正的价值并不是预测和操纵,而是分析和理解事实。比如说,有人认为欧洲杯比世界杯精彩,因为欧洲都是强队,而世界杯上有很多代表政治正确的、凑热闹的弱队,那么这个说法有道理吗?这个问题,让一帮球迷喝着啤酒谈一晚上也没用,用数据说话就很有意义。而这里的难点在于,从数据角度,什么叫“精彩”?

纽约时报网络版有人撰文[4],用几个指标来定义精彩:单场净胜球差距越小越精彩,总进球数越多越精彩,射门数、传球成功数、前场传球成功数、以及球队获得球权以后平均形成射门的次数,都是越多越精彩。根据这些指标分析,欧洲杯至少像世界杯一样精彩,过去五届欧洲杯的平均指标跟世界杯差异很小。而单轮2012欧洲杯和2014世界杯的话,从净胜球和传球成功数这两个看起来更重要的指标来论,欧洲杯要比世界杯精彩。

你可以质疑这些指标的合理性,但这些指标至少是可操作的,你很难找到更好的办法说明问题。再比如说,总有球迷质疑梅西和C罗在国家队比赛不如在俱乐部卖力,而著名预测网站FiveThrityEight则用数据说明[5],这二人(尤其是梅西)跟其他球星相比,在国家队和俱乐部都是首屈一指的人物,只不过他们在俱乐部的作用的确更大而已。

数据不但能平息争论,而且能发现隐藏的真相。英超是世界最强联赛,那英格兰队为什么就不行呢?《经济学人》上一篇文章[6]用数据分析告诉我们:那是因为英格兰的队员在联赛中都不是“角儿”— 最有创造性的传球和组织都是外援包办,轮不到他们。

这个关键数据是说英格兰队每隔22分钟才能制造一次带来射门的关键传球,这个成绩相当于英超中的埃佛顿队 — 而像阿森纳这样的顶级球队,这个数字是每隔14分钟一次。

你并不能从这个数据中得出英超应该限制外援的结论 — 只有天才才能带来充满想象力的传球,而英国就是不产天才又有什么办法呢?

作为一个只能隔岸观火的中国球迷,请允许我在本文最后呼吁,赶紧归化孔卡进中国国家队吧。

———–


[1] http://www.netimperative.com/2016/06/can-big-data-predict-euro-2016-winner/ Can big data predict Euro 2016 winner?
[2] http://www.mbe-intl.com/news/lighter-side FOOTBALL…vive la France! – 24 June 2016
[3] http://www.cnbc.com/2016/07/07/euro-2016-sap-and-german-football-team-worked-to-develop-big-data-analytics.html Athletes to analysts: How big data gave the German football team a leg up
Saheli Roy Choudhury | @sahelirc – Thursday, 7 Jul 2016
[4] http://www.nytimes.com/2016/06/15/upshot/euro-soccer-just-as-good-as-the-world-cup-if-not-better.html Euro Soccer: Just as Good as the World Cup, if Not Better By PETER EAVISJUNE 14, 2016
[5] http://fivethirtyeight.com/features/dear-lionel-messi-please-please-dont-quit-argentina/ Jun 29, 2016 Dear Lionel Messi, Please (Please!) Don’t Quit Argentina, By Benjamin Morris.
[6] http://www.economist.com/blogs/gametheory/2016/06/brexit-pitch The Achilles heel of English football, Jun 28th 2016, 17:26 by D.A.…

你比机器人强在哪?

(南方都市报 2015年09月30)

最近腾讯财经一篇看似普通的报道引起了广泛的兴趣 — 《8月CPI同比上涨2.0% 创12个月新高》 — 因为这篇文章是机器人写的。此文有图有数据,分段清楚语句通顺意思明白,如果不知道的话,所有读者都会认为它出自一位熟练记者之手。

这有点让人惊奇,但并未引起任何恐慌。我们都知道机器人有可能会抢走人的工作,不过单就此事而言,绝大多数议论都认为记者目前还不用担心饭碗。机器人在文中只是罗列了事实和数据,没有任何评论分析。事实上,腾讯这篇文章中连对数据的罗列是引用“人类”的:“余秋梅认为”、“他表示”、“银河证券的分析报告认为”……基本上就是个智能摘抄的工作。

可是如果你认为这件事不值一提,那你根本就不了解现在人工智能已经发展到了什么地步。

从去年开始,美联社对上市公司新财报的报道,已经完全不用人类记者写了。有些英文媒体已经开始使用机器人报道体育比赛。这些写作机器人早就超越了引用人类报告的阶段,它们直接阅读和分析数据,能判断出哪些数字是关键信息,知道谁是今天赛场上的英雄,球队在什么时刻开始反败为胜,比赛的高潮在哪,并以此选择报道角度和风格[1]。

有多家公司提供这种机器人写作服务。其中有一家叫做Narraive Scienece的,发现写新闻还不是最赚钱的,最赚钱的业务给公司写企业内部报告。机器人收集你企业的各种信息,发现你的趋势、成就和问题,生成的报告中有判断、有结论、有建议 — 基本上就是商业咨询的活。

这是腾讯在中国的一小步,其背后却是机器人在世界的一大步。

有些媒体不告诉你哪篇文章是机器人写的,所以你可能早就看过而不自知。关键在于,机器人写的东西不但不比人写的差,而且可能比人写的更好。

据此我以为,这个世界正在经历深刻的变革:人靠知识谋生的主流方法一变再变。

很久以前,人们佩服有知识的人,知识本身就很值钱。

不久之前,互联网时代,人们可以用搜索引擎得到想要的信息,知识本身就不再值钱了。注意不值钱不等于不重要 — 空气不值钱但是很重要 — 你必须有知识,但是你不能单靠有知识获得财富。这个时代的知识价值在于主动搜集和整理知识的能力。比如腾讯机器人新闻出来的第二天,“全媒派”立即发表一篇《5分钟科普“机器新闻”前世今生!》,综合介绍了各家机器新闻的状况,图文并茂通俗易懂,你说这篇文章值钱不值钱。

按今天最高标准,未必值钱。因为机器人既然会写报告,也完全可以写出类似的文章。我们甚至可以认为任何报告性的文章、包括大部分“科普”文章、百科问答知道之类的文章,在近期都有可能完全由机器人来写。也许媒体甚至根本就没必要保留这种文章,谁想了解哪方面内容完全可以随时让机器人根据这个特定读者的学识和口味专门写一篇。

那么今天什么值钱?也许使用知识的能力值钱。你总不能用搜索引擎来诊断自己的病情,对吧?还得靠医生的专业判断。

但是有一个非常厉害的东西已经存在多时了,它一旦被正式推向市场,就会立即让使用知识的能力也变得不再值钱。这就是IBM的人工智能系统,“华生”。它已经比任何医生懂得都多,它不再是简单搜索关键词,而是在相当程度上能够“理解”你的问题,它可以被用于疾病诊断和提供治疗建议。这样的系统,很快将会全面进入医学、法律和金融咨询领域。

也许用不了十年,它就将不再是“它”,而是“他”。

在这种局面下人类当何以自处呢?我们应该像霍金说的那样惧怕人工智能吗?或者心甘情愿地给机器人当宠物吗?

这就到了我要说的下一个阶段,人得靠创造新知识来赚钱。机器人会的所有东西,都是跟人学的。写报告也好,提建议也好,诊断病情也好,机器人的能耐在于从已经发生的事情中找到规律,然后把这个规律用于新的事情。机器人,是彻底的经验主义者。

人的一个任务是打破常规。近年美国总统选举越来越强调大数据的作用,候选人举手投足都试图合乎机器的要求,处处循规蹈矩地满足选民,结果选民也厌倦了。现在横空出世的共和党候选人川普却不按常理出牌,以性情中人的面目竞选,动不动就语出惊人,民调反而领先。

我老婆做菜不爱看菜谱,经常尝试自己发明新做法,往往做的不怎么好吃。但那一刻我感觉她身上充满了人性的光辉。

不过机器人并非就不能创新。机器人可以用组合、进化、甚至穷举的方法创造一系列新东西,一一比较性能,再选拔其中有价值的推出来。这不需要奇思妙想,这是纯暴力破解。在工业材料和制药业中,这种创新方式非常常见。这个,人比不了。

机器人也可以生成一大堆新的诗句和歌词,只不过这时候它无法判断哪句最好听。

因为只有人才能判断。人的喜好,可能是一个特别难以用机械化的方式琢磨的东西,有很多人试图用数据分析的方法预测哪个电影剧情能大卖,结果都不太成功。

所以人的第二个任务就是表达自己的好恶。你的任何情感流露,哪怕是一条微博一个点赞,对机器人来说都是弥足珍贵的,这也是一种创新。哪怕你看完一个报道之后在评论区开骂,哪怕骂得毫无营养,也能帮助机器人了解此时此地的人类。

我不敢肯定给机器人当受试者能有多赚钱。但表达感情宣布自己喜欢什么,是我们作为人类的神圣权利,将来可能还是义务,是机器人必须为人服务而不是相反的主权宣示。

过去,说一个人的大脑像电脑是夸他;将来,说人脑像电脑可能是骂人。在机器人时代,我们要想的是怎么让自己更像一个“人”,而不要追求像电脑!崇拜电脑,是人类历史上非常短暂的文化。

我在本文中用到了一些从网上取得的现成知识,可以说机器人对本文有所帮助。但主要内容和结论,不论对错,都是我的原创,你不可能在任何搜索引擎中搜索到,所以我敢说这篇文章机器人写不出来,所以我敢拿稿费。

……或者,至少现在它们还写不出来。

———-
[1] 这方面的详细报道,参加《连线》杂志,Can an Algorithm Write a Better News Story Than a Human Reporter? Steven Levy, 04.24.12.…

能把穷人变成正常人的教学法

(中国青年报,2015年6月8日,报纸版有删节,标题是《美国“衡水中学”:穷孩子如何不当考试机器》)

现在有很多人认为教育是一种服务:你能出得起什么样的价钱,就配得上什么水平的教育。不过哪怕是在今天,也仍然有些理想主义者认为教育是一种社会责任 — 不管这个孩子有钱没钱,我们都有义务把他培养成一个优秀的人。这些人的理想真的可行吗?

认为教育是服务的人可能都盯着美国私立高中。然而有点出乎意料的是,哪怕你是个理想主义者,认为优质教育也应该为穷人服务,甚至应该向穷人倾斜,你也可以向美国学习。


穷人与教育

美国四口之家的贫困线标准是年收入两万多美元,表面上比中国家庭收入中位数还高很多,但光看收入数字会被误导。事实上,美国穷人家庭孩子面临的挑战比普通的中国孩子大得多。

如果不幸生在美国的贫困家庭,你可能很难成为一个正常人。

想要做个正常人,你只需要满足三个条件:第一,先结婚后生孩子;第二,从高中毕业;第三,有份全职工作。有统计研究证明[1],在美国只要你能做到这三点,你就有98%的可能性不会陷入贫困。可是美国穷人恰恰做不到!

美国有超过三分之二的贫困儿童生活在单亲家庭之中,家长疲于奔命根本没时间管孩子。这使得他们很难得到足够的监督和管教,从而缺少自控能力。他们中的很多人没有从高中毕业 — 不是因为高中文凭很难拿,也不是因为生活所迫要挣钱养家,而是因为沉溺于毒品和聚会,连每天按时上学都做不到。

即便混到了高中毕业,贫困学生也很难考进大学,他们可能去社区学院,相当于中国的大专。而在社区学院,差不多有一半的学生曾经怀孕,或者曾经使别人怀孕。

如果你连个正经工作都没有,怀孕不是个好消息。可我以前看过一个报道,说有个黑人女高中生跟记者说她很自豪,因为她是她家族里第一个到了十六岁还既没有怀孕,也没有让别人怀孕的人!

想要不怀孕,需要一点自控力。自控,是一个非常基本和可贵的素质。一个中国学生在最差的情况下也只不过是指望用抄袭和作弊的方法混过考试,而一个美国“差生”,则可能直接忘了参加考试。他们连申请大学助学金的表格都懒得填。他们甚至可能会忘了约好的工作面试。如果他们真去面试了而且找到了工作,他们可能随时因为一点小事而辞职不干。

美国没有种族隔离制度,但“正常人”和穷人不会住同一个社区。一户贫困黑人的周围邻居,也都是贫困黑人。而作为黑人孩子,就算自己天生有自控能力,想上进,都没法上进 — 因为他的黑人朋友们会嘲笑他想当个白人!

所以美国穷人跟“正常人”之间最根本的,不是能力差异、不是经济差异,而是文化差异。黑人贫困儿童最应该抱怨的不是政府和学校,而是他们的父母、邻居和同学。这跟中国贫困儿童面临的局面完全不同。

现在有很多研究表明,贫困,其实是一个复杂系统中多种因素联合造成的结果,你很难简单地使用某个单一办法 — 帮助就业、直接发钱、或者让他去更好的学校读书 — 来让一个人摆脱贫困,你必须多管齐下才行。想要帮助一个贫困的黑人学生成为“正常人”,学校能做的非常有限,家庭和环境的影响实在太厉害了。

所以教育扶贫的难度,可能会超出一些理想主义者的想象。这就难怪有人抱怨说,现代社会干什么都需要资格认证,唯独当家长这个最需要资格的工作,不需要资格认证!

网上有种声音认为穷人就是垃圾人口,应该限制生育,或者干脆不要管,有多远躲多远。而大多数有点良知的人则认为社会亏欠穷人的,应该给穷人补偿。

但事实证明美国针对少数族裔的“平权法案”和种种福利制度并没有真正帮助穷人消除贫困。而与此同时贫困群体则心安理得地享受着社会福利,也不追求上进,他们唯一爱做的,就是要求更多的福利。

如此说来美国穷人还有没有希望了?希望不是很大,但美国的确有一股进步力量。这股力量既不指望用什么法案对穷人孩子降分录取,也不谋求给穷人直接发福利。他们试图使用科学方法来解决贫困问题。

他们搞教育创新。


宪章学校

1993年,青年教师Mike Feinberg和Dave Levin因为不满当时公立学校的落后局面,痛恨这个系统的官僚主义,决定利用刚刚通过的宪章学校法案创立自己的学校系统,这就是KIPP (Knowledge Is Power Program)。

所谓宪章学校,仍然算公立学校,仍然拿政府的教育经费,仍然对学生免收学费,但是其运营方式有非常大的自主性。你可以选择自己的教学大纲和教法,自己招聘老师,接受社会捐款,乃至在各地开分校。

KIPP最初以五年级到八年级的中学(相当于中国初中)为主,后来有了小学和高中,现在在遍布全国的几十个学校中有超过两万名学生[2]。

这是给穷人准备的学校。KIPP专门在各地最差的学区办学。学生中90%是黑人和墨西哥裔,87%来自贫困家庭。

Feinberg和Levin借鉴了当时各学校最好的教学方法,招到一帮志同道合的老师,在KIPP尝试各种教学手段。他们要求学生家长必须配合参与教育活动,他们给老师有定期培训。他们判断这些手段好不好使的标准只有一个,那就是是否有利于让这些贫困家庭的孩子考上大学。

这些手段几乎从一开始就取得了显著的成功。被媒体广泛报道之后,KIPP获得了大笔私人捐款,这使得他们能够创办更多分校。

如果你想创办这么一个中学,用最好的条件给穷人机会,你会给哪些穷人机会呢?为公平起见,你是否应该像中国的重点中学那样搞一个入学考试,把机会留给那些原本学习成绩最好的孩子?但KIPP对公平的理解却不是优先录取好学生,而是给所有人平等机会。所以录取不看学生之前的成绩,而是采取抽签的形式。

这可能是那些学生一生中最重要的一次机会,能不能抽中简直是天壤之别。美国贫困家庭孩子能考上大学的只有8%。而KIPP的毕业生,则有80%的人上了大学。

正因为入学没有选拔,KIPP取得的成就才更令人敬畏。KIPP的学生们在五年级入学的时候,其数学和英文水平普遍比同龄人落后的不是一点半点,而是落后一到两个学年!而到他们八年级的时候,他们的成绩100%超过平均水平。KIPP在其所在的整个城市内,比如纽约市,的所有学校中名列前茅。

使用什么样的教学法,才能取得这样的成就?

他们第一个办法非常简单:不是家庭和环境因素不好解决吗?那就干脆让学生每天在学校多呆几小时!一般美国中小学都是早上八点多开始,下午三点结束,而KIPP则是早上7点25开始,下午四点半结束。这意味着学生要在早上五六点钟起床,晚上五六点钟才能回到家里,累了一天,估计写完作业就得直接睡觉了。这样他们的确没有多少时间接受家长的文化熏陶,或者跟邻居家孩子一起出去混。不但如此,KIPP还在星期六上半天课。他们的暑假也比别人短。

但最重要的是,孩子们在KIPP所领教的,是一种完全不同的文化。


努力是可以学的

KIPP的理念,可以用“一个中心,两个基本点”来概括。

一个中心,就是一定要考上大学。“大学”,是KIPP学校里最常出现的词汇。老师跟学生说的话,跟家长说的话,学校里的各种口号,处处体现上大学这个中心目标 — 哪怕他们只不过是初中生。孩子们很小就被领着去大学访问,去接触从KIPP出来并成功考上大学的校友,树立自己有朝一日也要上大学的意识。KIPP的班级按照毕业上大学的年份命名,KIPP的教室用各个大学的名字命名。每一个KIPP的学生,都有自己心仪的大学。

两个基本点,叫做“work hard, be nice” — 努力学习,好好做人。这两句听起来很俗的话绝对不是随便说着玩的,在KIPP看来,这是为考上大学所必备的两个手段。

除了更长的在学校时间,KIPP的学生每天还有有两个小时的家庭作业。老师都得把自己的电话号码告诉学生,学生哪怕晚上在家里写作业遇到问题,也可以立即打电话问老师。在美国学校普遍鼓励合作和讨论的情况下,KIPP的学生每天早上做数学题的自习时间必须绝对安静。

前段时间有报道说英国首相卡梅伦不知道9乘8等于多少,给人印象似乎西方国家的教育并不强调背诵乘法表。而在KIPP,学生们必须大声背诵乘法口诀,而且是声情并茂地打着节拍背。

像某些中国中学一样,KIPP爱让学生喊各种励志口号,而且是在教室里由老师领着喊,比如一边拍桌子一边喊“Read baby read!(读书啊宝宝读书!)”[3]

其中有一句口号是“There are no shortcuts(没有捷径)。”KIPP不相信任何投机取巧的学习方法,他们让学生完全理解学习不是闹着玩的。在第一堂数学课上,KIPP老师会播放星球大战的音乐,告诉学生这将是一个非常困难的旅程。

提高学习强度,加强精神鼓励,这两条措施简直深得中国学校的真传。而KIPP对“努力学习”的理解还不止于此,他们还有一套物质奖励系统!

学生入学第一天是没有桌椅的,只能坐在地上,因为在KIPP,一切东西都必须是努力“挣”来的。谁表现好,谁才可以得到桌椅。

这似乎有点极端,但近年来有好几个经济学家做实验发现,如果根据学习成绩和平时表现给学生发奖金 — 真金白银直接发钱 — 的确可以在一定程度上提升成绩和毕业率,似乎相当好使[4]。不过这种做法很有争议,远远没有大面积推广。然而KIPP早就有了一套非常成熟详尽的奖励制度。

这套奖励制度[5]却不是按照学习成绩,给“好学生”发钱。它的核心思想在于让学生通过做好自己本来就应该能做好的事情去挣得奖励,以此来引导他们养成良好习惯,慢慢习惯成自然。比如一个学生如果能做到按时到校,他就可以据此“挣钱”— 这些“钱”能用于在校内换得物品;能在课堂上积极参与发言讨论,可以挣钱;能保持正能量的态度,挣钱。学生在学校的一举一动,都是对他们的考验。

KIPP做了大量的实验去发现和总结哪些奖励好使,哪些不好使。其中一个重要发现是奖励跟惩罚一样,一定要给的快!这显然完全符合“刻意练习”的精神,得有即时的反馈:该表扬立即表扬,该批评立即批评……KIPP每周给学生结算一次“奖金”。另一项发现是不同年龄段学生对奖励的需求不同。五年级小学生用几根铅笔就能打发,而高中生更想要的则是自由 — 如果你表现好,你就可以获得在吃午饭的时候戴个耳机听音乐的特权 — 没错,KIPP连怎么吃午饭都管。


素质,怎么教育

如果这种奖励制度使你联想到监狱,我要说的就是KIPP没准真的借鉴了一些监狱的管理方法。这绝对不是一个崇尚自由的学校。

怎么走路,怎么坐,走路的时候怎么拿东西,甚至上厕所之后怎么洗手,洗手之后用几张纸擦手,都有严格规定。

课堂上别的同学发言的时候,全班同学按规定动作看着他。在教室里,学生必须学会使用两种统一的音量说话,根据具体情况决定使用哪种音量。如果哪个同学在课堂上有小动作,老师会立即停止上课,然后全班讨论怎么“帮助”他克服这个坏毛病[6]。

这些规定,就是KIPP所谓的“be nice”。对KIPP来说,“好好做人”绝非是一句空洞的口号,而是一系列详尽的行为准则。而这套准则并非是领导层拍脑袋想出来的,其背后有科研结果的支持。

光把人培养到能考上大学的程度,作为一个简单的考试机器,似乎也不能叫成功的教育。KIPP的创始人之一,David Levin,曾经对KIPP毕业生进行了跟踪分析,他想知道哪些学生最终不但能考上大学,而且能在大学成功完成学业。结果他获得了一条非常宝贵的经验[7]。

Levin发现,那些最终在大学取得成功的学生,并非一定是KIPP学校里成绩最好的学生,而往往是那些拥有某些优良品格的人,比如说乐观、适应能力强、善于社交。他意识到自己此前犯了个错误!KIPP在学业上的教育非常成功,但是在品格方面的教育却不够好。

其实像这样的问题,要求学生德才兼备也好,呼吁素质教育也好,我们中国的教育工作者们每天都在强调,根本不新鲜。Levin的独特之处在于,他不是坐在那里瞎说,而是用自己学校毕业生的数据证明了这一点。更关键的是,Levin并没有停留在感叹和呼吁上,他直径采取了行动[8]。

你要怎么做,才算把素质教育落到实处呢?

当时有两个宾夕法尼亚大学的心理学家,Martin Seligman和Christopher Peterson,搞了个理论,说人类有些品质是超越文化差异的,是全世界所有人都尊重的美德,比如说智慧、自控、幽默感等等。他们一共总结了24条这样的品质。

Levin很喜欢这个理论,他决心让KIPP的学生拥有这些美德。Levin直接找到Seligman和Peterson,说你这24条实在太多不好操作,能不能给我们精简一下。于是心理学家最终给KIPP准备了七个目标品质:坚毅、自控、热忱、社交、感恩、乐观和好奇。这些品质跟上大学有什么关系?比如社交能力就跟能不能完成大学学业很有关系:有个研究说,能顺利从大学毕业的关键一条是,至少有一个教授能叫出你的名字。

这七个品质成了KIPP的“核心价值观”。就好像中国学校宣传自己的校训一样,KIPP用铺天盖地的标语口号往学生的脑子里灌输这七个品质。不过KIPP的口号可能比中国式宣传稍微高级一点,其并不是生硬地要求学生记住这七个名词都是什么,而是采用更加灵活多变的方式去潜移默化这些品质。

比如我们都听说过有个“斯坦福棉花糖实验”,说那些能坚持不吃第一块棉花糖,一直等到实验人员拿来第二块棉花糖再吃,表现出强硬自控能力的孩子,最后都有出息。显然KIPP的每个学生都知道这个典故,因为学校给他们的T恤衫上印的不是“自控”这个名词,而是“别吃那个棉花糖!”

KIPP的品行教育还不仅仅停留在口头上。学校居然给每个学生发卡片,让学生随时记录身边同学做出的符合“核心价值观”的行为!比如其中一条记录是“Jasmine发现William一个符合‘热忱’的行为:他在数学课上对老师的每个提问都积极举手。”

更有甚者,KIPP还搞了一个CPA(Character Point Average,品格平均绩点),与一般学校常用的GPA(Grade Point Average,成绩平均绩点)并列,就好像我们呼吁的“绿色GDP”一样。老师根据表现给学生在这七个品质方面打分,像评估足球运动员的技术特点一样评估每个学生的品行特点。一旦发现短板,就进行个别谈话,而且还会通知家长,共同研究怎么改进。

不光是思想灌输,而且用一系列制度去逼着你这么做 — 这背后的逻辑是,性格不是完全天生的,后天可以培养。而心理学家同意这一点。


KIPP水平的礼貌

很早就有人注意到,穷人家孩子和中产阶级家孩子的一个显著区别是平时的待人接物。得体的言谈举止和基本的礼貌对人的品格锻炼非常重要。对中产阶级家庭的孩子来说,基本社交礼仪通常都是跟着父母潜移默化地就会了,而穷人家孩子可能就不懂这些。所以KIPP就干脆连这些都教。

KIPP有非常严格的礼貌教育。如果一个姓Ali的老师跟你说“早上好”,你的回答不能也是“早上好”,而必须是“早上好,Ali老师!(Good morning, Ms. Ali.)”如果老师在课堂上问全班同学“明白吗?(Is that clear?)”,或者简单地说“Clear?”你既不能回答“yes”,也不能回答“clear”,而必须是“Crystal(水晶)”— 意思是“crystal clear”,非常明白。

KIPP的老师们在教学中摸索出来一套叫做SLANT[9]的课堂规定。SLANT是要求学生必须执行五个规定动作的缩写:Sit up,Listen,Ask and Answer questions,Nod,Track the speaker。这五个动作的意思是

  • 坐直。坐得笔直,才能体现一种良好的精神状态,同时也是尊重别人。不论是上课还是其它场合,KIPP都要求学生坐直。
  • 倾听。听是比读更重要的学习方法,不管是老师还是同学说话,你必须仔细听。只有这样才能促进更复杂的对话交流。
  • 提问与回答。学生必须敢于提问并且能回答问题。如果不敢提问,老师就不知道你掌握的如何 — 这对老师来说是最关键的信息。KIPP的中学生像中国的小学生一样热切地举手回答问题,每次提问都有如林的手臂高举起来。
  • 点头。你要是理解对方在说什么,你就要点头。这不是什么仪式,而是一种非语言的信息传递。
  • 眼睛盯着说话的人看。一方面是表示尊重,一方面是为了加强信息传递。

一般人如果到KIPP访问,有机会找个学生交谈的话,他可能会有一种受宠若惊的不适应感。这个学生会非常谦逊地注视你,用心地倾听你的话,一边听还一边点头。在这些彬彬有礼的学生中间,你可能会在一瞬间有一种自己突然变成了一个了不起的人物的感觉。

但真正了不起的是KIPP的师生。努力学习,做个好人 — 这两条其实说的都是自控力,前者是学习中的自控,后者是人际交往中的自控。

自控,是一种反人性的行为。它要求我们做“该做”的事,而不是“想做”的事。为什么KIPP最喜欢自控力?现在有句流行的话说“以一般人的努力程度之低,根本谈不上拼天赋”,其实是有道理的。一个有自控力的人生活再差也差不到哪去,自控力是比想象力更为基本和行之有效的个人素质,是摆脱贫困的关键一步。中国的教育基础比美国好,可能恰恰得益于中国文化中从小就强调自控。

当年我上小学,老师要求上课必须坐直并且还得把手背在身后。我稍微长大一点就对此嗤之以鼻。我认为人应该怎么舒服怎么坐,我的价值观是自由,而不是纪律。

可是我写这篇文章的时候,也不经意地坐直了一点。

——————-
[1] 参见David Brooks, The Social Animal 一书。
[2] Rod PAIGE and Elaine WITTY, The Black-White Achievement Gap: Why Closing It Is the Greatest Civil Rights Issue of Our Time, 2009.
[3] 如果你想体会一下这个口号是怎么喊的,YouTube上有段视频 https://www.youtube.com/watch?v=rADvu0cPHYA
[4] 关于用奖金鼓励孩子学习,以及本文后面有关“刻意练习”的一系列研究,和关于自控的研究,在我的《万万没想到:用理工科思维理解世界》一书中有更详细的讨论。
[5] 时代周刊,Thursday, Apr. 08, 2010, Should Kids Be Bribed to Do Well in School? By Amanda Ripley
[6] 见于The Talent Code一书,作者Daniel Coyle.
[7] 见于How Children Succeed: Grit, Curiosity, and the Hidden Power of Character一书,作者Paul Tough。
[8] Dave Levin有个演讲,可以在网上看到。https://www.youtube.com/watch?v=lAsSdyb6YMY
[9] 来自一位KIPP老师的文章。http://blogs.edweek.org/edweek/Bridging-Differences/2013/04/slant_and_the_golden_rule.html…

主题锤子和素材钉子的军备竞赛

(百度知道)

百度使用数据分析对2014高考作文题目预测这件事,值得再写篇文章。这是一次相当成功的预测,据有人分析,预测“命中了全国18卷中12卷作文方向”。其实在我看来还不止如此,甚至可以说全中。不过这些都不重要,甚至高考也不重要。重要的是,大数据的这种玩法,会给世界带来什么改变。


锤子和钉子

中国高考作文的出题方法有个固定的套路:给你讲一段小故事,然后让你根据这个故事,想想自己受到什么启发,写篇文章。换句话说你的作文重点根本不是这个故事,故事只是你要写的主题的一个素材。

同一个素材,各人思考角度不同,可以对应不同的主题。但更重要的是,不同的素材可以对应同样的主题。

比如全国卷的一个题目是“不要给野生动物喂食,否则它会丧失自己的觅食能力”。出题者的意图显然不是让人写一篇关于野生动物喂养的科普文章。

一个角度是把自己想象成野生动物,主题是年轻人应该自己闯荡,不能依赖前人经验的灌输。这不就是百度预测“生命的多彩”中的“奋斗”、“自由”和“青春”吗?而使用同样的主题,只要把文章稍加修改,完全还可以对付上海市的作文题:“你可以选择穿越沙漠的道路和方式,所以你是自由的;你必须穿越这片沙漠,所以你又是不自由的。”

另一个角度则是把自己想象成面对野生动物的人,那么主题就是要尊重自然,保护环境。这不就是百度预测“发展的困惑”中的“自然”、“环境”和“尊敬”吗?同样的主题下把文章稍加修改又可以对付辽宁省的作文题:“可惜漫天繁星没有了,沧海桑田转眼之间啊!当年那些祖先山洞边点燃篝火,看月亮初升天汉灿烂,他们欣赏的也许才是美景。”

现在我们的关键问题来了。到底是主题多呢,还是素材多?答案当然是素材多。素材怎么编都可以,但全体高中生都能想明白和说明白的道理就那么几个 — 具体说来,据百度数据分析发现,只有六个方面而已。

只要一个人熟读这六个方面各种可能主题的文章,掌握其写作套路,不管高考出什么素材都能应对自如。

这就正如有句谚语说“如果你手里有一把锤子,你看什么东西都是钉子”。这句谚语本来是贬义的,意思是告诫人们不要把什么东西都往自己掌握的有限理论上套。比如近年来人们学会了进化心理学之后,就不管看到什么社会现象都想用进化心理学解释,以至于我现在一听进化心理学就浑身起鸡皮疙瘩。

可是如果把这个锤子精神用在准备考试上,那是最好不过了 — 只不过你需要掌握的不是一把,而是六把锤子 — 有了这六把锤子就可以对付几乎所有的高考钉子。其实锤子精神还可以用在领导讲话上,任何事情都必须“高举中国特色社会主义伟大旗帜,以邓小平理论、“三个代表”重要思想为指导,深入贯彻落实科学发展观……”这方面目前一共有三把常用锤子,它们总是同时出现。

那么百度发现这些锤子用的是什么技术呢?


主题模型

给你一篇文章,你怎么能看出来这篇文章是说什么的呢?具体说来,你怎么能让机器知道这篇文章是说什么的呢?这个思想叫做“主题模型(topic modeling)”。

百度作文预测使用的主题模型技术叫做“隐含狄利克雷分布(Latent Dirichlet allocation,LDA)”。这是一个2003年才被提出的新技术,它的发明人之一正是刚刚加入百度,负责“百度大脑”项目的吴恩达。

LDA的基本思想非常简单。计算机认为文章只不过是一些词汇的集合。而每个主题,也只是一些关键词的集合。计算机没必要“理解”每个主题或者每个词的意思,甚至根本不用管这些词出现的先后顺序。

我们人为地设定一些主题,并且在数据分析的帮助下给每个主题设定好关键词。比如“狗”的主题下的关键词可以包括“骨头”、“汪星人”、“忠诚”、“朋友”等等,如果是最近的研究恐怕还要加上“广西玉林”。这些关键词的设定没必要非常严格,到底哪个词更重要可以交给机器去发现。

这样我们就有了一个主题的集合,每个主题又都是一大堆关键词的集合。同样一个词可以在多个主题中出现,但是在不同主题下出现的概率是不同的。

计算机要做的仅仅是使用一定的数学方法对根据每篇文章中的词汇进行分析。一篇文章拿过来,你要做的就是把事先设定的所有主题一个一个的过一遍,计算这篇文章中的词汇对应每个主题的可能性是多少。计算结果,就是这篇文章说的是每个主题的概率大小。一篇文章也许可以有超过一个主题,这不是问题。关键在于,计算机可以判断一篇文章最有可能说的是什么主题,第二可能说的是什么主题……这就相当于计算机已经“读懂”了这篇文章。

百度只要把海量的作文都用这种方法分析一遍,就得到了各种不同主题的出现总概率。更进一步,再结合年度风云搜索信息和当年的热点新闻信息,就可以判断现在最流行的作文主题是什么了。

LDA有很多应用。只要把“文章”改成“图像”,把“主题”改成“物体”,它就可以用来分析一张图片中都有什么物体,并用于给图像分类。它还可以用来分析音乐的乐句,再结合每首歌的受喜爱程度,就可以用于歌曲推荐。我猜主题模型的方法还可以用于分析新闻报道、电影剧本、小说和游戏情节,这样机器就能比任何文化批评家更早意识到现在流行什么。

如果机器如此厉害,人又当如何呢?


未来

设想几年之后,所有考生都知道了百度能预测作文题。这些考生将会熟练掌握百度指出的任何主题。这样一来,他们的高考作文成绩将会非常接近 — 而这是出题者所不愿意看到的,因为高考的作用不是为了证明学生学得好,而是为了选拔,选拔要求必须有比分差距。

出题者怎么办?他们必须打破俗套,发明全新主题!从这个意义上讲数据分析带来了社会进步。

但这有一个问题。数据分析会迅速发现这个新主题,并且促使它以比以往快得多的速度流行开来。等到所有考生都掌握了新的主题,这个新主题就又没用了。

所以数据分析的真正作用是能让好东西迅速流传开来……然后迅速消亡。这里说的当然不只是高考作文,更重要的是电影剧情之类。

华尔街的金融公司使用各种数学模型进行股票交易。这些模型的特点是一开始如果只有你在用,你也许可以非常赚钱,可是一旦别人也开始用同样的模型,那么市场就会在这方面变得越来越有效率,以至于这个模型的回报率就越来越低。于是你就只能再去发明一个新模型,一个更复杂的模型。直到这个模型也变得不好使。

结果华尔街就永远需要新模型,而且越来越复杂,越来越不容易赚钱。这是一场军备竞赛。

主题也是如此。一个好使的主题会因为有太多人使用而变得不再好使,人们被迫发明新主题,但新主题也将会变得不好使。

这都是互联网和数据分析带来的。整个过程的节奏可能会越来越快。历史必然加速前进,直到………

Holacracy:一种新的管理方法

(《商界评论》,2014年6月)

即使生活在技术进步日新月异的今天,我们也不是每年都能看到一个有可能改变世界的颠覆性创新。但我最近听说了一个新的管理方法,却的确有这样的潜力。这个方法叫做“Holacracy”,这是一个2007年才被发明出来的词,我们也许可以把它译为“合弄制”。最近一个大新闻是常有惊人之举的在线零售商Zappos决定全面改组,成为第一家实行合弄制的千人以上公司。而在此之前,时间管理系统GTD的发明人David Allen的公司和Medium.com等公司和非营利机构已经实行合弄制了。

合弄制,是一种非常极端地不同于传统公司管理的组织结构方式。它的创始人Brian Robertson甚至不管它叫“管理”,而叫“社会技术(social technology)”。一般公司都有不同等级的管理层,治理公司在很大程度上是一种集权体制,上层决策下层执行。而在一个合弄制的公司中,并不存在固定的管理人员和上下级关系,而且还实行民主决策 — 这两句话说着简单,但是任何一个稍有管理经验的人都会立即认为这不太靠谱。实际上合弄制引起了很多误解,比如有一个新闻标题就是《Zappos尝试“零管理”模式:或将”ç‚’”了全部管理层人员》。

合弄制到底是个什么东西呢?我们首先得回顾一下管理任何一个组织的逻辑。

我上大学的时候非常痛恨上课点名,曾经跟一个哥们一起去找校领导提意见。我说,任何强制性的制度都不是好制度。如果这个老师课讲得好学生自然愿意去听,再者你还可以用考试成绩刺激学生上课。市场自动调节,不比行政管理强么?

其实我们那时候不知道,早在1937年罗纳德·科斯就回答了这个问题:既然市场这么好,为什么还必须要有公司?为什么不让个人自己进行价值交换,非得要有等级制、讲纪律的组织?科斯的答案是这是因为交易成本。只要人数稍微多一点,让这些人通过讨价还价互相之间达成协议再去合作一件事情,都意味着极大的交易成本,远不如找个管理人员直接命令他们去做什么。成立组织,建立上下级关系,制定纪律,这些都可以降低交易成本。

可是任何组织机构一旦成立,它自身的生存就成了它的第一目的,机构会自我保护,领导会把保住权力作为首要任务。这样一来组织越大其管理费用就越高,交易成本不成比例地增加,办公室政治和官僚主义越来越严重,组织变得越来越僵化。大公司的运行效率和创新能力往往不如小公司,就是这个道理。

所有领导者都要思考这个悖论,但是这个悖论并不是无解的。CNN最近采访Zappos CEO谢家华,谢家华问了记者一个问题:为什么当一个城市越来越大,这个城市的人均创新会增加,可是当一个公司越来越大,这个公司的人均创新反而会减少?

这是因为在城市里人和商业都是自发组织的,而在公司里你得听命于上级。“市长”不是城市的CEO,他并不直接或间接管理市民或任何一家公司。一个公司要卖什么产品,一个自由职业者要搞什么创作,自己就做主,根本没有“上级领导”可供请示。像这样的自由个体越多,他们之间互相碰撞出火花的可能性就越大,创新当然越强。换句话说城市是个市场机制。

既然如此,解决大公司问题的出路所在就是效法城市!在公司内部实行分权,让下属部门能够自治,甚至一直分权到最基层员工。这个思想当然也不新,丰田汽车生产线和Whole Foods公司都是分权的好例子,这还不算我们中国早就有“鞍钢宪法”。互联网时代使得分权的组织形式变得越来越容易,比如几年前有本书叫Here Comes Everybody(中文版《人人时代》,又叫《未来是湿的》),就讲了很多这方面的尝试。

但是合弄制,并不是一般的分权改革,它是一种非常严格,而且相当复杂的组织管理方式。我仔细研读了holacracy.org网站,还看了一遍Brian Robertson的讲座视频,感觉任何公司实行这套系统简直就是给电脑安装一套完全不同的操作系统。

合弄制的一个核心思想是它是以工作为本,而不是以人为本。不管是公司还是非营利组织,合弄制首先要求你是一个“有目的的组织”(purposeful organization)。组织的目的可以是赚钱,可以是为顾客服务,也可以是改变世界。但目的跟一般意义上的“公司文化”不同 — 你的目的和你的现状之间存在一个差距,而你工作就是为了缩小这个差距达到目的。国家可以没有目的,家庭可以没有目的,同学会可以没有目的,但是公司必须有目的。组织所做的一切工作都应该是为了这个目的服务,而不是为了组织中的人员自己服务。合弄制要求组织中的每个人都要能够判断各项工作是否符合这个目的。

明确了公司的总目的,公司就可以通过管治会议(Governance Meeting)来根据这个目的把工作分块,变成一个个具体的功用。假设我们公司的目的就是通过在网上卖鞋赚钱,那么具体的功用就是采购、市场营销、客服等等。这些功用与传统公司的各个部门有本质区别。首先决定应该有什么功用的过程是集体讨论决策的,不是CEO一个人说了算,其次功用可以是临时的,完成任务就撤销,更重要的是,这里完全是分配工作,而不是分配人。

管制会议定下功用之后,给每个功用成立一个“圈(Circle)”,同时决定每个圈中需要的“角色(Roles)”。圈就是角色的集合。比如客服这个圈里可能需要接电话的角色,维护网络的角色等等。每个角色有自己明确的职责和权力,都写在这个角色的说明书上。

传统公司是人员组织结构固定,把工作往人身上分,而合弄制则是工作职责固定,把人往工作上分。每个圈有一个“链长(Lead Link)”,这是一个具体的人。链长对自己圈的工作没有决定权,他唯一的权力是往自己圈里的角色中放人。他可以在全公司范围内邀请任何人来填充角色,并且有权在认为一个人没有做好自己角色的时候将其从角色上踢出。所有圈里的重大决策都由这个圈里所有角色参加的管治会议民主讨论决定。而在日常工作中,每个人则根据自己的角色有相当大的自主权。没有任何人可以命令你干什么。你根据自己的角色的职责和权力自己决定干什么。

每个圈的管治会议还可以根据工作需要在圈中再成立“子圈”,规定每个子圈的功用和子圈中有些什么角色,并由链长指定每个子圈的链长。子圈中还可以又有子圈,如此层层嵌套,就如同人体分为器官、组织、细胞等等。每一个圈的管治会议,由直接属于这个圈的全体角色,以及这个圈直接下属每个子圈的一个代表参加。

如此看来合弄制并非是没有管理或者没有等级的体制。各层圈的上下级关系非常明确。一个圈之内实行民主,但上级圈直接决定子圈的目的和角色功用,而且链长有绝对的人事权。但关键在于,这些管理和等级都是针对工作,或者说是针对角色的,而不是针对人的!

合弄制的一个妙处在于每个人可以同时拥有多个不同的角色!你可以是某个高层圈的链长,又同时是某几个低层圈的普通角色。个人并没有固定的职称。如此一来员工没必要畏惧任何一个链长,完全是此处不留爷还有多个留爷处的局面。也许只有在一个角色也找不到的情况下你的这份工作才面临危险。合弄制中人与人之间的确实现了理论上的平等,比如Brian Robertson在他自己的公司里就同时有二十多个角色,他在多个链长“手下”工作。

传统公司中员工想的往往是往上爬,而公司的利益在于把事做成。在合弄制中每个员工都是公司的传感器,他随时判断公司是不是正在朝着既定目标前进,看人们做的事是否符合公司文化。如果发现有问题,他就可以在管制会议上提出来。很多情况下甚至不用等开会,他自己就可以行动。这种自主权和管制会议上的民主,可以大大减少办公室政治。通过这种机制,适合高层圈的领导者仍然能慢慢涌现出来,但合弄制的主题思想是让更多的人负责,是分权。

这样来说,越是大公司才越应该搞合弄制。可是越是大公司越不容易改组成合弄制,因为这套系统太过复杂,而且与传统公司管理方式区别太大。Robertson的做法是派人作为教练进入你的公司,手把手教你怎么做。一开始,教练会要求公司的CEO签署一份“合弄制宪法(Holacracy Constitution)”,同意放弃自己的大部分权力给管治会议。你将来觉得不好可以随时取消合弄制,但是只要合弄制存在一天,你就必须遵守这个宪法。

这个“宪法”的说法并不只是象征意义,因为实行合弄制就等于从专制变成法治!人们按照一定的规则自主行事,而不是按照传统的上下级关系行事,更不必效忠于任何个人。这难道不就是法治的本质吗?这不就是城市里做事的做法吗?

仔细想想,其实这个合弄制也不是从天上掉下来的。警方遇到大案往往会从各个部门,甚至本辖区以外的其他公安局,招兵买马成立专案组。医院遇到疑难杂症会邀请各路名医搞会诊。对科研工作者来说为了一个课题好几个不同大学和研究所的人合作研究更是家常便饭。在这些临时组织中人们的工作方式就很类似于合弄制,先有工作后找人,来了互相商量着办,而且事了拂衣去对事不对人。

Robertson本是个程序员,2001年开了个软件公司,他开公司的目的不是为了卖软件,而是为了实验让人与人怎么在一起工作最好。合弄制的思想起源于Arthur Koestler 1967年出的一本书,The Ghost in the Machine。此书影响巨大,认为自然界的东西大多是由“合弄结构(holarchy)”层层嵌套组成的,比如人体、器官、组织、细胞等。每个合弄结构中有“合弄(holons)”,合弄是独立自主的个体,但是他们又为了所在合弄结构的功用而互相协作。Holacracy这个词就是从holarchy而来,holarchy又是Koestler造出来的。此前中文世界已经有了“合弄结构”这个词,所以我们就可以把Holacracy翻译成“合弄制”。Robertson正在写一本叫做Holacracy: Evolution for Organizations的书。

已经有多个国家的若干个公司开始实行合弄制。Zappos本来2009年就被亚马逊收购,但仍被允许独立运营,一向敢为天下先的谢家华得以拿自己这个大公司做一把实验。Zappos将在2014年底全面完成合弄制改组。也许未来几年内合弄制就会在全世界流行并引发一场管理革命,甚至其影响力还可能超越公司,乃至于改变事业单位甚至政治组织。即便失败,合弄制也只不过是美国公司对管理创新的众多探索的一种,而现在似乎类似的探索非常流行。

在Robertson的讲座中有人问他合弄制到底有什么好处,Robertson说好处主要有两个。一个是职权非常透明,公司可以变得更有效率。另一点,公司可以更加容易做出改变,能够对市场做出迅速反应。

不过在我看来合弄制还有一个好处。普通员工会很喜欢这种体制!谁不爱平等和民主?…

剧情函数库

(《新知客》,2010年10月)

著名物理学家徐一鸿先生在《可怕的对称》这本书中谈到对称性群的时候提到一个很有意思的笑话。说

有一个客人随他的朋友参加一个笑话俱乐部的聚会。一个会员叫道,“C—46!”,其他人都会心地笑了起来。另一个站起来叫道,“S—5”,引得所有的人都笑了起来。这个迷惑不解的客人问道,这是怎么回事?他的朋友解释道:“所有可能的笑话,当然不能计细小的差别,都已经被归类编上号了,我们心里都知道这些编号指的是什么。”

这个故事多年以来在我脑中挥之不去。是否真能做到把所有可能的笑话发现并列举出来,以至于一一编号,并宣布从此之后世上再没有新鲜的笑话了呢?考虑到一个有实用意义的笑话应该可以用不超过500个汉字讲完,而500汉字的排列组合只有有限多种,我们有充分的理由认为世界上只有有限多个可能的笑话。唯一的问题是能不能在人类有生之年把它们穷举,因为这种排列组合的总数是一个天文数字。好在看来人类似乎还没有发现所有可能的笑话,总能出几个新段子。就好像音符的排列组合也有限,而人类并没有终结所有可能的音乐一样。

然而令人遗憾的是,所有可能在影视剧里出现的剧情,似乎已经都被编剧们发现并使用过了。只要看得足够多,就会发现所有的故事都似曾相识,所有的桥段都是俗套。比如有人总结了“香港TVB剧集俗套大全”,大结构无非是女人斗,争家产和江湖恩怨之类。小桥段也都是反复使用多次的,比如掉下悬崖一定死不了,好人躲进府中坏人一定搜不到,女扮男装很久才被发现,世界上有两个人长得一模一样等等,其实大多数都是传统评书和武打小说用烂了的。但俗套绝不仅限于中文世界,美剧翻来覆去拍普通人成为超级英雄,犯罪分子则必有悲惨童年经历;日本少女漫画中两人一旦发生一夜情,早上起来床上一定会少一个人。

一部影视作品,一本小说,甚至是一段广告,无非是由多个大小不同互相嵌套连接的剧情桥段组成。现在我们看到好多桥段都是被反复使用了的,那么也许所有已知能用的桥段总数并不是一个天文数字。既然如此,有没有可能干脆把所有被用过的桥段分门别类,像笑话俱乐部一样,不计细小的差别,全部列举出来?

这件事已经有人做了!这就是 TV Tropes(tvtropes.org)。这是一个维基百科式的众人合作贡献内容的网站,它的主题是分析列举各种流行电影,电视剧,动画,小说和游戏中出现的所有剧情。网站的参与者不是任何影评人,而是一群极客,他们看电影不是欣赏情节的好坏,而是本着理工科的精神把情节分解,识别并统计其中的桥段。网站的源起是一个程序员想要分析《捉鬼者巴菲》电视剧中使用的各种俗套,现在正发展到所有作品。在 TV Tropes 眼中,没有那个作品真是特例独行的,几乎所有剧情都不过是对已有桥段的排列组合。

看过《阿凡达》之后,很多人反应画面一流但情节一般。那么《阿凡达》的情节有多一般?TV Tropes 列举了片中使用的上百个“俗套”。比如剧中 Jake 第一次去森林探险,当他遇到一只雷兽,女科学家 Grace 告诉他不要动,然后雷兽自己走开了……但实际上雷兽走开的原因是 Jake 身后有一只更大的猛兽,这时候 Grace 就大喊让他赶紧跑。这种把英雄从一个危险中拯救出来的拯救者其实是一个更大的危险的桥段,在 TV Tropes 中叫做“Always a Bigger Fish”。在这个桥段的条目下,网站列举了使用过它的多个作品,比如《侏罗纪公园3》。

桥段(tropes),是剧情的基本粒子,也是 TV Tropes 的基本单位,被分门别类的一一列举,就差编号了。但 TV Tropes 的真正意义并不是“桥段百科全书”或“桥段数据库”,而是一个“桥段编程语言”!每一个程序员写程序都要调用大量现成的库函数,每一个做数值计算的科学家都有一本算法大全,TV Tropes 就是剧本的库函数和编剧们的算法大全。

比如你想在一部动作电影里来一段追逐戏,TV Tropes 会告诉你追逐戏一共有57种不同的桥段可供选择。如果被追的这个人比较笨,一个办法是让他往高处,比如说往楼顶上跑,这样的结果就是他会被陷在那里,《金刚》中就用这个办法。如果被追的这个人很聪明,就必须给他一点难度,比如说他想消失在人群中可是身上穿着某种显眼的衣服不能换,然后再安排这时候正好赶上有一群人都穿着类似的衣服走过!比如《黑暗骑士》中的几十个人质就都被戴上了同样的面具。相比之下,追坏人的英雄随便拦下一辆出租车,让司机“跟上前面那辆车”这个桥段就实在是太俗套了。

我们设想在生活中人与人之间应该有几乎无限多种可能发生的事情,为什么剧本中只有57种追逐方法?因为只有这些追法好看。正所谓“文似看山不喜平”,观众看小说看电影追求的是好看,而不是真实。从有通俗文学那天开始,一代代的作家和编剧们绞尽脑汁,就只发现了57种好看的追逐。反过来说如果就是不用任何桥段,平铺直叙,就好像我最近看的一个网络小说一连三天连载都是你一言我一语地开会,那还有什么意思?

TV Tropes 网站的出现,必然是通俗文学史上的一件大事,因为它把编剧从艺术变成了技术。莎士比亚时代天才的剧作家都是单打独斗,而现在美剧编剧都是团队合作了。我希望中国的编剧们,尤其是TVB,多读一读这个网站,学几个新鲜点的套路。也许未来的编剧们讨论剧情,是这么一种方式:

编剧A:“前25分钟是一个A-15剧情,分四段,分别是NM-23,KB-1,DSJ-9和Z-4。建议其中从第一段到第二段的过渡使用一个XUB-7。”

编剧B:“XUB-7最近三年已经被人用过13次了,是不是可以换成PI-32?”

编剧C:“不妥,我查了最新的统计,63%的亚洲20岁以下女观众不喜欢PI-32剧情。”

庖丁解牛到了一定的境界,眼睛里面看到的就不再是一头完整的牛了。一个人一旦熟知了 TV Tropes 上的各种桥段,再看电视剧就会只看到一堆库函数。这样看电视剧还有意思么?所以 TV Tropes 的口号就是“TV Tropes Will Ruin Your Life”。无形之中,剧情数据库把观众分为“会看电影的”和“不会看电影的”两类,只有不会看电影的观众才会被剧情感动,而会看电影的观众则永远失去了这个乐趣。豆瓣这样的小资影评网站有可能会被理工男们占领,他们使用桥段编码对每一部影视剧进行基因分析,用外行看不懂的语言剧透。

《连线》杂志的 Scott Brown 在谈到 TV Tropes 时发出感慨,认为原创剧情已经消失了。其实也不至于。真正的原创剧情是高雅文学和文艺片的事情,流行文学和商业片只需要“好用的”剧情。评价严肃作品,往往要看它是不是发明了独一无二的人物和剧情。所以严肃文学作家是科学家,通俗文学作家是工程师。另一方面,科学和社会进步总能带来一点新鲜的剧情,比如发现相对论之前,又有哪个剧本使用过时间旅行?

最后让我把本文开头的笑话讲完。

有一个人站起来叫道,“G—6!”,这时每一个人都捧腹大笑起来。这个客人问究竟是什么笑话如此可笑。他朋友答道:“哦,这是乔·史蒙,他笨透了,还不知道根本没有G—6 这种类型的笑话呢!”

因为一个人说错编号而引发的笑话本身必然也在笑话俱乐部的数据库中,但是亲眼目睹一个笑话发生还是值得捧腹大笑一次 — 说明就算所有桥段都已经被发明了,商业片仍然可以拍得很好看。有了各种库函数,编程是如此的简单,以至于高中生也会写程序,可是最好的程序员仍然可以把编程从技术达到艺术的境界。…