本文谈谈现代人,或者说现代的西方学者,是怎么研究社会科学的。在我国,常常是很多人因为感到数学不好学而去学社会科学,比如说去学法律。这样自然选择的 结果是产生了一大批像李银河这样感情充沛而不切实际的所谓学者。然而现在最领先的西方学者已经抛弃了过去那一套抱着悲天悯人的心态空谈理论的研究方法。如 果你去读他们的论文,你会发现其中到处都是图表和数学公式;如果你去观察他们的工作,你会发现他们大部分时间不是在写字,而是在编程。
法律领域内有一个非常经典的问题:给犯罪分子更长的刑期,是否会增强对他的改造,从而减少其出狱后的再犯罪率?在以往,人们可能会从伦理,道德,心理学 的角度去分析这个问题。有的人可能会举出各种例子来证明他的论点,然而这些例子往往是非常极端而没有代表性的。这个问题直到最近才得到一个有说服力的答 案。
耶鲁大学的Berube 和 Green 的研究完全基于数学统计。联邦法院总是随机的往不同的辖区派法官。有些法官倾向于重判,给长刑期;有些法官倾向于轻判,而随机过程决定了每个法官倾向于总 体面对类似的案件。这样一来,可能完全相同的犯罪事实,有的犯罪分子比较幸运就获得了较短的刑期,而不幸的就会刑期较长。作者通过对一万多名犯罪分子记录 的统计分析,结论是,刑期长短与再犯罪率无关。如果没有这样的统计数据,如果没有法官的随机指定,像这样的问题可能永远都无法解决。
统计是一个非常强大的研究社会问题的手段。NCAA篮球中有没有球队参与赌球?拉斯维加斯的一个赌博项目是每场比赛的胜负分差(Point Spread),也就是我们所常说的让多少球。比如宾夕法尼亚大学对哈佛大学,赌场开出的分差是14.5分,也就是说如果你押宾大,他们必须赢至少15分 你才能赌赢。如果你考察每场比赛的实际分差,和赌场事先开出来的比赛分差,其相差值几乎完美地符合正态分布(平均值是0)。这样一来,正好有50%的时 候,胜者实际赢了对手多少分比赌场预测值高,50%的时候比预测值低。也就是说赌博的赔率几乎是50%。这种50%概率正是赌场最喜欢的赌赢概率。
然而问题是,如果你考察那些胜负分差超过12分的场次,那么其分布就不是完美的正态分布了:有53%的机会,胜队实际取胜分差会比预测值低。为什么会出 现这种情况?宾大学者 WOLFERS 猜测,当稳操胜券的时候,胜队会故意放水一点,去操纵比赛分差来影响赌局(术语叫做 Shave Points)。也就是说使用统计方法,你甚至不需要任何直接的证据就能发现有人参与赌博。
类似的手段可以应用几乎任何社会领 域。比如说婚姻问题。传统的婚姻问题专家判断一对夫妇是否会离婚,成功率只有53%,只比瞎蒙高一点。而最新的方法,听一对夫妇之间的交谈15分钟,就有 能以95%的准确率判断他们未来15年内会不会离婚。其所使用的方法,是给这15分钟的交谈录像,然后几个人坐下来看录像,一个画面一个画面的分析其中人 物的细微表情和语言,然后把统计结果输入一个事先做好的复杂方程之中,这个方程会告诉你该夫妇离婚的可能性。这个方程是怎么设计出来的呢?用大量的数据回 归出来的。
统计方法能够大行其道的根本原因是现在网路和计算机技术的提高,特别是便宜的海量存储给大量的数据分析提供了可能性。现在指导社会科学的先进文化是理工科思维,先进生产力是统计模型,计算机和海量的数据。
这种通过分析海量数据来预测和理解社会问题的方法被人称为 number crunching,现在甚至已经有了专业的公司专门为商业公司干这个事情来预测顾客行为。这样做的一个结果是商家可能比你自己更了解你。比如你从 Blockbuster 租了一盘 DVD,Blockbuster 可能比你更了解你不按时归还的概率。
一个典型的专业公司是 Teradata。它为65%的世界顶级零售商,70% 的航空公司,和40%的银行服务。他们的一个典型业务是判断哪些老顾客可能会因为一次不愉快的服务经历而离开你们公司。Continental Airlines 就专门有人做这个。比如一次航班误点或者行李丢失事件发生之后,如果统计分析系统判断某个长期顾客有可能要因此从此不飞 Continental 了,这位客户就会得到特别好的照顾。
甚至赌场也这么做。每一个顾客入场玩都刷卡。他们根据每一个顾客的 收入,年龄,以往赌博记录,居住地等等计算该顾客的 pain point – 也就是此人一晚上最多输多少钱下次还能来玩。一旦发现某位顾客今晚输的钱已经接近 pain point 了,就会立即派服务员过去邀请他免费吃顿牛排停止赌博。
这件事情的最可怕前景是,商家将会可以根据顾客不同的价格承受能力,给每个顾客一个不同的价格。
传统的社会专家靠直觉,甚至是个人感情好恶来做研究,而未来属于数字。但我国在这方面可以说是相当落后。我国”主流经济学家”经常鄙视那些玩数学模型的海归,人们不习惯用数字说话。
更不利的一点是,我们可能根本就没有数字可以用。我国的统计水平可以说是极差,一个最基本的GDP数字居然都能随便变来变去。在这种情况下你怎么才能很 好的做出决策?我们看NBA比赛,无不赞叹美国人对数字统计的热衷:这是他的这个赛季的第几个两双,如果他两双了球队获胜的概率是多少,等等等等。量化思 维必须被培养成一种习惯。从这个角度讲,”吉尼斯世界纪录”的最大贡献可能是培养了人们尊重数字的习惯。
没有数字就没有真像。
本文素材主要来自两本书:Blink,作者是纽约人杂志的记者,和 Super Crunchers,作者是耶鲁法学院的教授,此人擅长用计算机做统计研究。
#1 by jason on 4月 4, 2010 - 9:38 上午
Quote
excellent blog
#2 by wmq on 8月 27, 2010 - 10:22 下午
Quote
支持
#3 by Frank Lin on 11月 1, 2010 - 7:10 下午
Quote
Agree!
“没有数字就没有真像”“真像”或应改为“真相”。
#4 by Frank Lin on 11月 1, 2010 - 7:20 下午
Quote
如果社会科学这样理想地发展下去,或许有一天真的会出现阿西莫夫的《基地》里面由数学家提出的能预测社会未来的新学科:心理史学。
#5 by 摸象 on 12月 23, 2010 - 4:51 下午
Quote
我认为那个刑期长短和再犯罪率关系的例子中的结论完全不成立
过度关注于数字本身是个错误的倾向
#6 by 同人于野 on 12月 24, 2010 - 1:05 上午
Quote
不用数字,你凭什么“认为”呢?
#7 by 朱健强 on 5月 1, 2011 - 11:35 上午
Quote
嗯,能不能说说这个:“像李银河这样感情充沛而不切实际的所谓学者”怎么理解?比如说“不切实际”这个词如何理解?
#8 by sean on 8月 10, 2012 - 12:10 下午
Quote
阿西莫夫 《基地》,不知道博主看过没?
另外博主是典型的理工科思维,不知道那些哲学家柏拉图康德等等的哲学著作lz是怎么看的?
技术解决不了人类的心灵和幸福以及爱恨情仇的问题。
不过很多具体而微的层面上,介绍西方最新的理念方法非常不错,比如天才学习法之类的。
#9 by lol on 10月 10, 2012 - 4:46 上午
Quote
历史心理学——主要的假设在于研究对象不能得知研究结果。如果统计对象对统计结果有有意识了解,对统计本身有不可知的影响。
#10 by atreess on 9月 23, 2012 - 10:08 上午
Quote
虽然我也是学理科的,但我已经在社会生活中意识到,企图依赖“数字化”来解社会问题是自大而又幼稚的。
请不要一上来说什么“现代人,或者说现代的西方学者,是怎么研究社会科学的”,你了解现代社会学么?还是你想当然的?
当代美国社会学已经对纯数学方法非常警惕了,正在回归历史主义和“讲故事”了。
你那种“到处都是图表和数学公式”的论文在现代的社会学中已经被看做是“反面教材”了,相反批评数学解法的文献倒也汗牛充栋。
#11 by lcn on 9月 23, 2012 - 10:58 下午
Quote
并不是数学方法有错,而是用的人用错。所有学科都是反感为了数学而数学的,所以你觉得物理学也应该放弃数学表述?
#12 by 眼镜熊 on 9月 26, 2012 - 9:03 上午
Quote
这是一篇倡导统计方法,或者再彻底一点的说就是物理学方法的文章。社会科学应该彻底摒弃‘心理的’、‘感情的’原则,成为模型+假设检验的科学。
对两年前的我而言,这篇文章无疑是喜闻乐见,举双手赞成的。但今天我却不能简单化的支持或反对。理由在于“社会科学的特殊性”。自然科学是纯粹研究无意识物体的(生命科学研究有生命,但一般来说无意识的东西),精神的科学研究有意识的物体,目前所知唯一有意识的东西就是人类。社会科学是处于物质和精神的交叉地带,研究的是精神的规律方面。例如,通过价值理论的假设,决策理论的假设,我们可以预测人的行为等等。根本的说,所谓‘社会的科学’能成其为科学,就是因其研究对象具备可描述性和因果性,而研究结果具有一定的可预测性。这是太基本的哲学问题了,如果你研究的对象不具备因果性,甚至都不可描述,你要怎么进行‘科学研究’?你充其量是‘研究’但却未必是‘科学’。
作者一上来就把李银河称为‘像李银河这样感情充沛而不切实际的所谓学者’,李银河可能只是把她的研究方法用在了不适当的学科。但你的确得认识到,研究社会中的人,理解其心理是必须条件,所以‘感情充沛’对提出假设是必要的素质。至于切不切实际,只需要引入严密的实验方法即可。如果你连人们‘需要什么’都推断不清楚,我不知道要怎么进行后续研究。而要想知道别人在想什么,你就需要在自己脑子里模拟别人,但本质上你还是你,你不可能超出自我的意识范围,这就是‘哲学的内省’。
因此谈到这,有个对作者观点的最大反论,那就是其实我们一直在研究一门很大的‘唯心主义科学’,那就是‘数学’。数学不是什么客观规律,而是‘精神可构造的不变量’,你绝不能用统计归纳的方法研究数学,而只能用非常不被作者认可的‘理论空谈’来研究。那么数学是不是‘典型的充满空谈的科学呢?’,结果不言自明。
从哲学上看,这只说明我们为了把握规律,不得不经过心理的中介。你有可能通过‘守恒的数学’,‘符合逻辑的推理’而得到正确的表示,也可能通过‘感情’,‘违反逻辑的推理’而得到错误的表示。但对心灵本身来说并无所谓对和错,心灵之为我们自身而存在。
心灵只为我们自身而存在!!
否则我们为什么还要读诗呢,诗就是一种充满了幻觉,偏见,感情,强词夺理,黑白颠倒的东西,身为一个科学家,我是不是应该第一个反对读诗呢?进一步的,文学(特别是充满了科学上的胡说八道的古代文学)也都不要读了(注意,我说的不是去伪存真式读法,而是随意的读,相信你乐意相信的东西)。
以上大概没人反对,那么怎么研究像诗这类的东西呢?怎么研究感情呢?结论显然,不管你导入多少归纳方法,‘对心灵的心灵研究’都是必要的。
因此,我们需要正确有力的新方法,来研究‘真正自由的为了自我而存在心灵’。
(或者你从‘唯物主义的角度’指出不存在自由的心灵)
(注:可描述性一般需要可观测性)
#13 by Lance on 5月 1, 2013 - 8:43 下午
Quote
社会科学既然作为“科学”,就必然要采用量化和实证的研究方法,从这个角度看,作者的论断完全没有错。
但是,社会科学的特点在于,其研究对象的复杂性带来了统计上的诸多问题。比如你举的那个关于刑期和在犯罪率的例子中指出:“这样一来,可能完全相同的犯罪事实,有的犯罪分子比较幸运就获得了较短的刑期,而不幸的就会刑期较长。”从逻辑上看,这个例子完全没有问题,但如何判断这些刑期属于“完全相同的犯罪事件”(考虑到每个案子都会在细节上存在许多的不同),则需要严谨的法律工作者进行反复的推敲和讨论才可能确定。我认为,在一个一万人的统计研究中,这其中的差异是不可能完全被考量的。
这样一来,最后得出的结论,很可能会有误差,这个误差在某些因素的影响下,甚至可能超出容错的范畴(当然,我没有数据支持,这只是个猜想)
再比如,如果要研究传播学,数字化的分析只能研究出传播渠道、受众特征等可以量化的内容。至于文章内容是如何影响传播的,因为涉及复杂的人文环境,是量化分析目前还很难做到的。
所以,传统的社会科学研究方法,在短时间内很难说会不会像博主预言的那样被量化分析所全面取代。
#14 by 方志良 on 1月 5, 2015 - 1:53 上午
Quote
您好!我叫方志良,是4R4P责任动力学创始人。在拜读您这篇文章后,发现您是我的知音,您的理论就是我的研究:4R4P责任动力学。
【如果你学习责任动力学你会发现你根本就是在学责任图式与数学公式!分享了这篇文章让我看到了对责任动力学发展的未来满满的,希望与改变世界认真的责任动力与信心!看了这篇文章让我感觉到这20年的傻值得!历史的改变总需要一个人去孤独地忍受质疑与痛苦地坚持真理的标准!】
本文谈谈现代人,或者说现代的西方学者,是怎么研究社会科学的。在我国,常常是很多人因为感到数学不好学而去学社会科学,比如说去学法律。这样自然选择的结果是产生了一大批像李银河这样感情充沛而不切实际的所谓学者。然而现在最领先的西方学者已经抛弃了过去那一套抱着悲天悯人的心态空谈理论的研究方法。如果你去读他们的论文,你会发现其中到处都是图表和数学公式;如果你去观察他们的工作,你会发现他们大部分时间不是在写字,而是在编程。
【判断一个人的职场生涯是否有挫折,我们4R4P只需要用任性即可做到,你认为我没素质,我却测试了你的R4、R3的永久之熵,只需要对话三句,这就是神奇的责任性格说。】
类似的手段可以应用几乎任何社会领域。比如说婚姻问题。传统的婚姻问题专家判断一对夫妇是否会离婚,成功率只有53%,只比瞎蒙高一点。而最新的方法,听一对夫妇之间的交谈15分钟,就有能以95%的准确率判断他们未来15年内会不会离婚。其所使用的方法,是给这15分钟的交谈录像,然后几个人坐下来看录像,一个画面一个画面的分析其中人 物的细微表情和语言,然后把统计结果输入一个事先做好的复杂方程之中,这个方程会告诉你该夫妇离婚的可能性。这个方程是怎么设计出来的呢?用大量的数据回归出来的。
【这句话带给我们什么?传统的责任心、责任感还是东西吗?未来的责任动力学一定是属于数学的天堂,这不是在正是在预测我们的未来吗?兴奋幸福满满!这才是理性责任,理性思考模式,理性思维方式!】
传统的社会专家靠直觉,甚至是个人感情好恶来做研究,而未来属于数字。但我国在这方面可以说是相当落后。我国“主流经济学家”经常鄙视那些玩数学模型的海归,人们不习惯用数字说话。
静候您的佳音,希望与您共同探讨,感谢!