一个受过高等教育的人如果想表现自己的科学素养,最简单的办法是鄙视“彩票分析学”。这门学问完全合法地出现在各种晚报,新浪,搜狐甚至是人民网上,认为彩票的中奖号码跟股票一样,存在“走势”。它使用“双色历史号码”,“余数走势”,“五行码”等五花八门的数字曲线,使用“奇偶分析”,“跨度分析”,“大中小分析”,帮助彩民预测下一期中奖号码。网上大多数讨论彩票“规律”的文章,甚至包括一些“专家”接受记者的采访,都信誓旦旦地认为彩票是有规律的。而任何一个学过概率统计的大学生都可以告诉彩民:彩票开奖是个随机过程,所有号码中奖的概率都是一样的,这次的中奖号码跟历史号码完全没关系。
研究双色球的余数走势无疑是个缺少科学素养的愚蠢行为。但事实是,即使是受过很好教育的人面对随机事件也可能会犯类似的错误。这个错误就是试图从本来没有规律的事情中找到规律。
如果你曾经被河南人骗过,如果你恰好听说自己的一个朋友也被河南人骗过,如果你进一步发现网上也有个人被河南人骗过,你是否会得出结论河南骗子多呢?如果去年有个清华毕业的硕士生被查出来抄袭,今年又有个清华教授被查出来抄袭,你是否会得出结论说清华纵容抄袭呢?
即使考虑到河南是个人口大省,而清华这样的名校的媒体曝光率比较高,这两个地方的坏消息似乎也比相同量级的省份或相同知名度的大学高了一点。所以结论难道不是明摆着的吗?如果骗子是在中国各个人口大省随机分布的,如果抄袭者是在中国各个名牌大学随机分布的,那为什么恰恰是河南和清华“脱颖而出”?
在下结论之前我们先考察1940年的伦敦大轰炸。当时伦敦在德军V2导弹的攻击下损失惨重,报纸公布标记了所有受到轰炸地点的伦敦地图之后,人们发现轰炸点的分布很不均匀。有些地区反复受到轰炸,而有些地区却毫发无损。对英国军方来说这是一个非常恐怖的事情,因为这意味着V2导弹的精度比预想的要高得多,以至于德军可以精确选择轰炸目标。而伦敦居民则相信,那些没有遭到轰炸的地区是德国间谍居住的地方,有些人甚至开始搬家。
然而事后证明V2是一个精度相当差的实验性质的武器,与其说是导弹还不如说是大炮 — 德军只能大概地把它打向伦敦,而根本无法精确控制落点。也就是说伦敦各地区受到的轰炸完全是随机的。一直到1946年,有人从数学角度分析了轰炸数据,把整个可能受到轰炸的地区分为576个小块,发现其中229块没有受到任何轰炸,而有8个小块受到了4 次以上的轰炸。这些数据虽然不均匀,但完全符合随机分布。实际上科学家可以用计算机模拟的办法得到更多“看上去很不随机”的随机结果。
问题的关键是随机分布不等于均匀分布。人们往往认为如果是随机的,那就应该是均匀的,殊不知这一点仅在样本总数非常大的时候才有效。当初 iPod 最早推出“随机播放”功能的时候,用户发现有些歌曲会被重复播放,他们据此认为播放根本不随机。苹果公司只好放弃真正的随机算法,用乔布斯本人的话说,就是改进以后的算法使播放“更不随机以至于让人感觉更随机”。一旦出现不均匀,人们就会认为其中必有缘故,而事实却是这可能只不过都是偶然的。
一个更直接的例子是所谓“生日悖论”。在获得奥斯卡最佳男主角奖的73名演员之中,有六对演员的生日相同。考虑到一年有365天,这是一个相当不均匀的分布,难道我们据此可以说这六个生日是演员出生的幸运日么?实际上,哪怕一个班级只有23个人,其中有两人生日相同的概率就超过50%。进一步如果这个班级有57人,那么有超过99%的可能性会出现相同的生日。
从极少的几个事例中发现规律这种思维在多数情况下都是有益的,其实是人的重要生存本能。当发现有两个小学生吃了食堂的午饭就出现不适症状之后,立即怀疑食堂的饭菜有问题绝对是明智的选择。进化心理学可以很好的解释为什么人会有这种自发寻找规律的心理:那个亲眼看到两个同伴吃了一种奇异的蘑菇就倒下了,还去吃这种蘑菇的原始人,不可能是我们的祖先。但我们必须明白这个道理,有些看似很有规律的事情其实是随机的。就算是一个投注站连续开出两次大奖,也不能说明这是个幸运投注站,或者说有什么阴谋。就算我们连续三天听说关于河南人的坏消息,也不能下结论说河南骗子比别的省多。除非你有大规模的统计数字。
#1 by David on 3月 29, 2010 - 2:58 下午
Quote
真正的原因是人们习惯选择性地认知,哪些符合规律的都被自动忽略了,而这些奇异的事却被记住,传扬。
#2 by Ben.W on 3月 29, 2010 - 3:13 下午
Quote
很不错~
不过,标题是讨论随机,但举的关于“河南人的坏消息”的例子,跟随机好像没太大关系。某地区的人是不是骗子,实在不是随机事件,这跟当地风气很有关系吧。
另外,关于“XX人都是骗子”这种提法,个人感觉最早见于电视剧《寻秦记》的第一集,里面有个家伙发明了“湖南人都是骗子”这句名言。哈哈,不知道作者是不是引用的时候有点小出入。
#3 by zkk on 3月 29, 2010 - 4:48 下午
Quote
我曾作过一个分析,来说明即使全国风气一样,同样会造成对河南人的偏见。当然,这只能说假设风气一样的可能性是有的,只是反驳了“河南人口碑差就说明河南风气比其它地方更不好”这一观点。
我试着解释一下这种偏见的形成吧。
偏见的来源主要是来自于河南的农民工。
1.全国农民工中,有40%是河南人,这是由于历史原因造成的,谁让河南地壤肥沃,适宜人类生存,人就多,多了就得出来呢。其他省最多大概是20+%
2.农民工的素质整体偏低,并非河南农民工这样。
也许你要问,既然农民工都素质低,那河南农民工虽然多,但也只占40%,那最多也只应该受40%的偏见,或者50%都可以理解。那为什么95%以上的偏见都是针对河南呢?
我们再讨论一下“偏见”的形成过程。
在整个社会对某个省并没有偏见的时候,在什么条件下才可以形成对某个省的农民工的偏见呢?
如果一个人仅仅遇到过某省农民工的一次不良行为即判断:“这个省的农民工都不行,进而判断这个省的人都不行。”那是相当轻率且不合逻辑的。一般来说,如果一个人遇到过三次同一省的农民工的不良形为,而在这期间没有遇到其他省的农民工的不良行为,从而形成“这个省的农民工素质实在是不行,并且可能这个省的人素质都不行”的判断是合情合理的。
那么事件A:“遇到过三次同一省的农民工的不良形为,而在这期间没有遇到其他省的农民工的不良行为”的概率怎么算呢?为方便,不假设太多前提,也不追求严密了。
事件A是河南人的概率是0.4的三次方6.4%,而其他省,最多的按20%算,0.2的三次方是0.008,是0.8%,差了八倍。
粗略的计算可以得出以下结论,用易懂的语言来讲就是这样的:“每一个人每天都有可能遇到农民工的不良行为。每100个这样的人中,有6.4个对河南人产生了偏见,有大约1个,对其他省的农民工产生了偏见。而其余92个,没有对任何省的农民工产生偏见。”
可以看得出,虽然河南人的农民工只占了40%,但在“农民工的素质是一样的”前提下,85%以上的偏见的产生是针对河南人的。
并且在社会舆论对河南人整体不利的前提下,对河南人形成偏见会更加容易,也许你遇见一次、两次河南人的不良形为就确定了“本该三次”才产生的偏见。
久而久之,95%的偏见是针对河南人,就不足为奇了。
我的意思就是,40%的数量优势,在人数上不是绝对优势。但通过人的基本的偏见形成机制,这40%的人被“偏见”优待,占到95%是正常的。
社会又有一种错误的认识,即认为:“如果95%的偏见是针对河南人,那么河南人中的95%,至少大部分是坏的。”
这种认识显然是不对的。从这个数据的推导过程中可以看出,前提是“农民工素质是一样的。”即“各省农民工中的败类的概率是一样的。”
#4 by 同人于野 on 3月 30, 2010 - 2:46 下午
Quote
这个分析很不错:)
#5 by zhenguanxi on 2月 24, 2013 - 6:55 下午
Quote
说农民工素质偏低算不算偏见呢?
#6 by zhenguanxi on 2月 24, 2013 - 6:56 下午
Quote
换句话说,作者凭什么认为农民工素质普遍偏低比河南人素质普遍偏低更可信?
#7 by zhenguanxi on 2月 24, 2013 - 6:58 下午
Quote
也可能是反过来,因为河南人素质普遍偏低,而河南民工又比较多,所以才会产生民工素质普遍偏低这一假象。
#8 by Hong Xiaowan on 3月 31, 2010 - 2:01 上午
Quote
人不容易相信陌生人,尤其是现在的社会,所以,一般的诈骗案的案犯的往往是苦主所认为的好人,而不是陌生的河南坏人。
#9 by Pencilman on 10月 23, 2011 - 9:21 下午
Quote
Nice.
#10 by 左岸读书 on 3月 29, 2010 - 3:33 下午
Quote
随机是一种乐趣!
#11 by 初级潜水员 on 3月 29, 2010 - 3:56 下午
Quote
一次买100来注中3.5亿的那种情况,是随机的吗?
好像还有2年中了2次500万的一个黑龙江的
一个人一次买2注中500万的情况也有好多,这都是随机的吗?
#12 by MonteCarlo on 3月 30, 2010 - 5:50 上午
Quote
彩票抽奖是所谓的独立随机事件,即每次抽奖之间没有任何关系,不管以前出了什么数字,每次抽奖时每个数字被抽中的可能性是相等的。只要抽奖的机器造的足够精确,任何一次抽奖都可以看作是独立随机事件。
所以一个数中了并不等于将来再出现的机会就少了,随机事件只是说结果并不确定,但是不否认存在连续出现相同结果的可能。
#13 by Hong Xiaowan on 3月 31, 2010 - 2:02 上午
Quote
问题在于想对于中奖的概率,抽奖机是在是不够精确。
#14 by Channery on 8月 19, 2011 - 10:42 上午
Quote
Good points all around. Truly aprpeaicted.
Pingback: 吐泡泡的小鱼 » 【小鱼吐泡】2010.3.29
#15 by scotty on 3月 29, 2010 - 10:06 下午
Quote
彩票走势不是完全无道理的,难道你要推翻Bayes理论
#16 by zkk on 3月 29, 2010 - 10:47 下午
Quote
与Bayes理论有什么关系?
#17 by lupy on 3月 29, 2010 - 10:28 下午
Quote
最后的“生日悖论”没有弄明白,73个演员当中,出现生日相同的概率很高可以理解,但出现六对相同的概率还那么高就让人费解了,用随机概率似乎解释不了。我觉得用星座或心理学来解释比较好,生日相近的人,性格相近,相同星座的人,性格也相近。如果以生日为横坐标画概率颁布图,我觉得这也未必不会给大家提供一点信息,至少对心理学家来说常常是这样做的。
#18 by 同人死忠 on 3月 29, 2010 - 10:39 下午
Quote
我觉得用星座或心理学来解释比较好,生日相近的人,性格相近,相同星座的人,性格也相近。
你亮了。。。
#19 by Hong Xiaowan on 3月 31, 2010 - 2:46 上午
Quote
生日和雷电的例子类似,特定的时间段和特定的地点有特定的概率。节日,冬季结婚的人多一些,因此孩子出生的时间和父母结婚的时间有一定的关系,2000年龙年,年底出生的孩子要更加多一些…下点力气,资料可以做到很精确,婚庆市场,育婴市场要比股票好控制,好预测多了。
#20 by donglongchao on 7月 29, 2010 - 7:49 下午
Quote
有一个关于欧洲球星为什么很多生日都在冬季的调查也与这个类似。
#21 by 路人甲 on 3月 30, 2010 - 12:28 上午
Quote
一点猜想:iPod的算法也不是真正的随机算法,因为真正的随机算法是不可能实现的。我想iPod开始的算法使用的是pseudo-random generator,就是用对一个大素数求余来产生一系列伪随机数,由于四舍五入的关系,比如如果4.5和5之间的所有随机数都会变成歌曲5,才会出现重复。后来改进的算法应该是用sodol的方法按区域来产生伪随机数,这样就可以保证不重复。
#22 by MonteCarlo on 3月 30, 2010 - 5:52 上午
Quote
像随机播放列表这种应用,对所谓的随机性要求很低,根本不需要什么大素数之类的,只需要取当前时间作为一个随机种子就行了。
#23 by Hong Xiaowan on 3月 31, 2010 - 2:36 上午
Quote
iPod的问题很容易解决,用户需要的不是随机播放歌曲,用户需要的是用和上次不一样的顺序播放所有歌曲,因此,这不是随机,而是一种排列组合。
完美的体验还要考虑用户的遗忘性,让用户无法记住这次循环和上次有什么不同。
#24 by 路人甲 on 3月 30, 2010 - 12:38 上午
Quote
还有,据我到目前为止的观察,似乎不同星座的人性格确有不同。比如:
1,天平座的人,一般比较犹豫,遇事很难决断。
2,处女座的人,一般比较细心,做事十分仔细。
3,水瓶座的人,做事就比较随心所欲。
4,射手座的人,很少事业心(野心)很强的人,很容易快乐。
。。。
不知道怎么解释?
#25 by titan on 3月 30, 2010 - 1:58 上午
Quote
样本小,提取的数据是一种总结,很模糊和主观,甚至不是在描述同一类特征。例如“一般比较细心,做事十分仔细”与“很少事业心(野心)很强的人,很容易快乐。”是可以共存在一个样本上的,而两种星座明显不行。
没有10万20万样本怎么敢下结论
#26 by MonteCarlo on 3月 30, 2010 - 6:40 上午
Quote
要记住一点,统计结论是建立在大量的数据结果之上的,你观察的人有100个就已经不容易了,但这对得到一个统计性结果来说还是太少了。
你的问题其实需要通过心理学来解释,有句话叫做,人们只看到他们想看到的。这种星座理论在你脑子里已经先入为主,所以当你发现合乎理论的情况时,你就会把它归因于星座理论,而不相符时就容易被忽略。每个人的性格都是复杂的,你只是观察到了你想观察的而已。
#27 by Stone on 3月 30, 2010 - 8:40 上午
Quote
星座理论似乎很不合逻辑,可以参考九型人格理论。
#28 by wangyii on 3月 30, 2010 - 9:09 上午
Quote
先入为主的观念。
#29 by 同人死忠 on 3月 30, 2010 - 11:31 上午
Quote
你这些星座理论从哪来的?很好奇啊
#30 by MonteCarlo on 3月 30, 2010 - 6:49 上午
Quote
彩票与河南人问题是不能混为一谈的,作者虽然在讲随机,但是从内容上看,对概率理论并没有系统的学习过。彩票的概率事件是最简单的独立随机事件,每次抽彩票的事件是相互独立的,这次的结果对下次并没有影响,反过来也是。而人群的特点就没有那么简单了。如果非要用概率论来解释,人群更类似于相关系数不为零的多维变量组。
人和人之间的行为是有密切联系的,不是完全无关的,否则市场统计就是没有意义。做任何市场调查都是先随机抽取一定的样本,然后根据不同的变量寻找这些样本之间的相关性,其中生活地区在大部分人口统计中都是非常重要的一个特征值。人们的很多行为都是和生活地区密切相关的。这种相关性的内在原因非常复杂,从当地的气候,环境到传统生活方式与所在地的发达程度富裕水平,都会当地的人群产生相同的影响,从而使这些人具有相同的秉性。
当然,以地域来简单的给人贴标签是不正确的,但是并不是完全没有道理。
#31 by 同人于野 on 3月 30, 2010 - 11:05 下午
Quote
本文说的是仅凭少数事例不能推翻“骗子在各省随机分布”这个简单假设,而不是研究骗子到底是怎么分布的。
#32 by MonteCarlo on 3月 31, 2010 - 12:08 上午
Quote
问题的关键在你一开始就拿骗子当做上帝掷的骰子,认为骗子在各省的是随机分布的理论就有问题。某种犯罪率的分布从统计学上讲是跟地域相关性非常高的。当然,简单的拿某个省作为区分的标志是不正确的,但是从人的社会性这一点讲,就不能把诈骗当做一个随机事件。
概率论的使用是有前提的,不是每种现象都能当做随机现象来分析,在应用之前首先就得先确认是不是随机事件,变量之间是不是独立的。
我最近写的论文涉及到分组的大规模样本的整体概率分布。所以自然的也把中国的社会问题和理论结合。中国社会可以看做是一个组间差异很大,但组内差异较小的样本集合。这和中国的地理环境以及历史传统有关。中国各地之间的差异很大,但是小范围内的人的生活方式与习惯却非常接近。这和中国漫长的农业社会历史有关,因为中国的精耕细作式农业要求人们以聚居的方式生活,而且不鼓励人口流动,以社会的稳定为第一要求,而将生产技术的发展放在次要位置,所以造成组内差异很小。而中国幅员辽阔,历史悠久,各地之间人口流动性差,所以就形成了差异较大的生活方式。
#33 by 同人于野 on 3月 31, 2010 - 1:14 上午
Quote
我已经说得很清楚了,本文说的是少量数据不能推翻这个假定,而不是研究这个假定本身。
#34 by zhenguanxi on 2月 24, 2013 - 6:51 下午
Quote
因为你知道抽奖过程,所以少量数据的规律性不能推翻中奖号码是随机的这个假定,但如果你不知道全国各个地方的犯罪数据,又连续遇到几个河南骗子,那假定河南骗子更多才是理性的吧。偏见不能作为法律,但拿来指导生活还是可以甚至是应该的,比如去了美国,我肯定会尽量少去黑人多的地方。
#35 by Hong Xiaowan on 3月 31, 2010 - 2:17 上午
Quote
诈骗分为迫不得已的诈骗,和故意的骗局,而故意的骗局,无论大小,都会注意其欺骗性,比如丹东边贸骗局成型后,被大量复制,虽然成功率很小,但是收益很大,在收益小到一定程度后,这样的骗局向全国扩散,参与其中的人,已经不是原来的那一伙人了。并且开始大量的利用熟人关系。
传销是另外一个熟人骗局了。
因为这样走向往往控制在诈骗集团的核心首脑中,这好像不能用概率论来解释,而应该用六度理论,心理等这样的社会工程等等来解释跟好一些。
#36 by Stone on 3月 30, 2010 - 8:39 上午
Quote
人们对随机的期望其实更多是平均分配,例如作者所说的ipod的歌曲。
#37 by 简单生活 on 3月 30, 2010 - 12:54 下午
Quote
在股市理论里,也说股票走势是随机的,但是一样有人发财。
在彩票里也如此,一样有人赚钱。理论只能反映现实世界的一部分,而不是全部。因为理论发生作用是要有条件的。而现实世界除了有概率起作用外,还有其它的规律起作用。 这些合力构成现实现象,如果单纯只拿一种理论来看现实,我觉得,是不全面的。
#38 by I'mhere是部好电影 on 5月 15, 2015 - 11:11 上午
Quote
现在各种理论层出不穷;存在的理论未必在多大程度上符合实际。据说美国现在还有一个为数几千人的“学会”,不断发表“学术成果”,试图严谨的论证地球是平的。
股市里有“随机漫步理论”和“有效市场理论”,可都被事实证明是错误的。一个显著的反例就是,各种主流交易市场(包括金融衍生品市场)都有大约1%-5%的散户能保持数年间稳定盈利的纪录,我身边也有这样的人物。股市“随机性”被大众心理打上了深深的烙印,所以并不是真正随机的,也就是说从一定程度上可以预测的。建议你用强力研读几本华尔街经典交易名著,比如《通向财务自由之路》和《专业投机原理》。
#39 by I‘mhere on 5月 15, 2015 - 11:29 上午
Quote
我想说的是,把股市和彩票的随机性作比较的做法是没有道理的。简而言之,股市固然有随机的一面,可同样有可预测的因素,因此从股市中稳定持续盈利是可以做到的;彩票根本没有可预测的成分,因此没有听说谁从彩票中稳定持续盈利。
#40 by 被讥笑为科学主义者的人 on 3月 30, 2010 - 3:01 下午
Quote
过去有一种说法:如果在炮轰过程中跳到弹坑里,被炸到的可能性减小,看来也是谬传。
如果V2相当于大炮瞄准伦敦,那么落点应该是以某一点为中心的正态分布。
#41 by 同人于野 on 3月 30, 2010 - 11:10 下午
Quote
的确如此,同理某个地方或某个人被闪电击中过一次,它下一次还被击中的概率并不减少。如果轰炸次数足够多,应该能够看到正太分布的图像,这样人们就不会怀疑了,但问题是还不够多。
#42 by MonteCarlo on 3月 30, 2010 - 11:35 下午
Quote
闪电的例子就举错了,闪电如果被击中过一次的话,那么将来被击中的可能性更多,因为被雷击是跟地理环境有直接关系的。雷击不是真正的随机事件。
#43 by 同人于野 on 3月 30, 2010 - 11:57 下午
Quote
你是说一个地方被闪电击中后,会对这个地方产生改变,从而增加这个地方再次被击中的概率么?
如果你想说的是被击中说明这个地方环境特殊,比其他地方容易被击中,那你跟我不矛盾。我说的是一个地方不会因为被击中过一次就减少下次再被击中的概率。
#44 by MonteCarlo on 3月 31, 2010 - 12:12 上午
Quote
这是错用了因果关系,一个地方被雷击的事件本身并不导致它再次被雷击,而是因为使它第一次被雷击的原因会导致它容易再次被雷击。
被雷击的地方都是比周围地势高,导电性良好的位置,极端的例子就是避雷针,山上的宝塔大树也都是。如果雷击是随机事件,避雷针这个东西就可以扔掉,大树下也可以随便避雨了。
还是前面回复里用过的话,概率论要慎用,不是什么现象都可以当做随机事件处理。
#45 by 同人于野 on 3月 31, 2010 - 1:13 上午
Quote
是你理解错了。雷击当然是随机事件,说雷击是随机事件,并不是否认某些地点被雷击的概率高于其他地点。难道你认为只有所有概率相同才是随机事件?而且我从一开始就是说的这个地方跟这个地方自己比,你说其他的有什么意思呢?
#46 by zhenguanxi on 2月 24, 2013 - 6:53 下午
Quote
那你的意思是除了必然事件都是随机事件?
#47 by I'mhere是部好电影 on 5月 15, 2015 - 11:15 上午
Quote
他说的是后验概率,应该会提高。你说的是先验概率,那就不会有所改变。
#48 by Hong Xiaowan on 3月 31, 2010 - 2:30 上午
Quote
跳到弹坑里被弹片打中的可能性会变小,现在的单兵装备依靠卫星或者其他装备实时跟踪对方的炮火,可以计算出战场上危险最小的地方,也就是被击中概率最小的地方。
#49 by jxzhp on 3月 30, 2010 - 4:00 下午
Quote
20楼的,多因素影响有一定范围吧,例如某个村里有很多人偷渡或制造某种伪劣商品或用电话骗人,等等,这是因为一个村或者一个乡镇之间的人际交往很密切,发现某种不正当的发财方式后更容易扩散开来,但因为碰见了某个省籍的骗子就进而判断这个省的人群“骗子特性”更强,不合理吧,毕竟一个省都是有几千万甚至上亿人口的。
Pingback: 有一种规律叫随机 « 学而时嘻之
#50 by 被讥笑为科学主义者的人 on 3月 30, 2010 - 7:31 下午
Quote
那个亲眼看到两个同伴吃了一种奇异的蘑菇就倒下了,还去吃这种蘑菇的原始人,不可能是我们的祖先。
===========================
是这么回事。人的学习过程总是从小样本开始的,逐步迭代达到和统计一样的结果,要很长时间。
不过如果这个蘑菇不奇异,是每天吃而没问题的那种,该怎么办?原始人很可能要归结为蘑菇受了什么诅咒。捏造一个原因,看来是比统计学习更有前途的方法,可能由此到达理性。
正是这种本能的“理性”倾向,总让人不满足于“随机的”解释。我发现那些炒股的人,不断听股评而乐此不疲,他们就是以为这里面有“规律”可循,赔多少也痴心不改。
#51 by 同人于野 on 3月 30, 2010 - 11:14 下午
Quote
人总是倾向于认为凡事必然有个原因,甚至连自然灾害的背后都有“神”的某种意图。
完全同意您的“股票没规律”这个说法。我看经济学家的一致结论,是股票走势是随机的,“技术分析”,什么K线图之类,完全没用。
#52 by Hong Xiaowan on 3月 31, 2010 - 2:22 上午
Quote
股票是可以预测的,也可以被控制,当然控制股票是违法的,不过不被发现就是合法的。
#53 by Hong Xiaowan on 3月 31, 2010 - 1:48 上午
Quote
在非常饥饿的情况下,还是会存在第三个吃了奇异的蘑菇,最后并没有死。
这样的例子现在还有,河豚,年年有人吃,年年吃死人,动物除了会规避危险之外,有时候不得不在危险之中找机会。
所以,这个不可能是不存在的。
#54 by 陈齐 on 3月 30, 2010 - 10:10 下午
Quote
按照概率论的观点,每次的彩票中奖号码都是个随机事件,并且是独立事件,彼此之间没有任何关系。但是我觉得那些走势图并非扯淡,你可以把之前一个月的中奖号码加以统计,并且把他们当做一个整体来看,在这个整体中,所有的数出现的概率一定是相同的,虽然实际出现的比例未必相同。那样的话如果数a出现的次数多而数b出现的次数少,那么在下次彩票中出现b的概率就要比出现a大。要整体来看。
#55 by 同人于野 on 3月 30, 2010 - 11:14 下午
Quote
这是错误的说法。下次的概率不会因为这次出现过而改变。
#56 by MonteCarlo on 3月 30, 2010 - 11:48 下午
Quote
这又是对独立随机事件的错误理解。两次抽彩票之间是没有任何因果关系的。只是在大量抽样的基础上,才能说他们的总数是接近相等的。 建议纠缠于这个问题上的人去网上搜索一下先验概率和后验概率,以及贝叶斯定理。贝叶斯定理看起来很简单,但是对整个概率论的意义是非常重大的。
#57 by Hong Xiaowan on 3月 31, 2010 - 1:54 上午
Quote
对比中奖的概率和现在的制造精度,绝对精确的抽奖机只是在理论中存在,或者说,可以找到中奖的规律。
v2的例子和此类似,无论是如何的不故意,都不可能做到绝对随机,而努力把v2射向伦敦,本来就是一种故意,v2始发的角度,操作人不经意的动作习惯,天气都会影响随机的效果。
#58 by Hong Xiaowan on 3月 31, 2010 - 1:43 上午
Quote
v2不是完全的随机
Pingback: 每日嘀咕(2010.03.30-03.31)
#59 by amon on 3月 31, 2010 - 8:00 上午
Quote
研究彩票的人都是在研究彩票机的随机算法
你参考ipod的伪随机就明白了
所以专业彩民会比你随机选号中奖的概率高
虽然大部分也就是忽略不计的微小优势
我记得概率论因为不可证伪性被有些人说是伪科学
有兴趣研究这个的,辅修心理学,去赌场赚钱吧
#60 by starcloud on 3月 31, 2010 - 1:18 下午
Quote
可以做个实验,用线性同余法产生一个随机数序列,让这帮研究彩票的“专家”们(他们据我观察都是用笔和纸去“破解”的)算去吧,看要算到啥时候能算对。:)
#61 by Hong Xiaowan on 3月 31, 2010 - 6:31 下午
Quote
有这样的牛人的,摸奖专业户,彩票专业户,不可能算的绝对正确,但是能算出赢面有多大。也就是一定可以通过彩票赚取利润,但是一般不会中大奖。
#62 by starcloud on 4月 2, 2010 - 11:50 上午
Quote
彩票机比线性同余法复杂多了。
我更愿意把它看成混沌,结果是确定但不可预测的,因此所谓的“计算”、“预测”可以说是没有意义的。
#63 by 斩鞍 on 3月 31, 2010 - 8:51 上午
Quote
“就算我们连续三天听说关于河南人的坏消息,也不能下结论说河南骗子比别的省多。除非你有大规模的统计数字。”
如果事件A由事件B诱发,那么观察到的事件A发生率可能不具备统计意义,但是背后的事件B或者事件C有可能有规律可循。选择哪个事件来观察和总结,在这样的情况下,会导致不同的结果。
另:GGL提示网站上有有害软件……
#64 by 同人于野 on 3月 31, 2010 - 11:37 下午
Quote
除了wordpress 就是 google 的,不应该有有害的啊。
#65 by 斩鞍 on 4月 1, 2010 - 1:53 上午
Quote
The website at http://www.geekonomics10000.com contains elements from the site powergym.be, which appears to host malware – software that can hurt your computer or otherwise operate without your consent. Just visiting a site that contains malware can infect your computer.
The website at http://www.geekonomics10000.com contains elements from the site help2strike.org.ua, which appears to host malware – software that can hurt your computer or otherwise operate without your consent. Just visiting a site that contains malware can infect your computer.
The website at http://www.geekonomics10000.com contains elements from the site germanadvertising.net, which appears to host malware – software that can hurt your computer or otherwise operate without your consent. Just visiting a site that contains malware can infect your computer.
The website at http://www.geekonomics10000.com contains elements from the site germanadvertising.net, which appears to host malware – software that can hurt your computer or otherwise operate without your consent. Just visiting a site that contains malware can infect your computer.
#66 by 同人于野 on 4月 1, 2010 - 11:57 下午
Quote
多谢指出!可能是我们在 dreamhost 的服务器被攻击了,车东兄已经帮我删除了恶意代码,目前正在请求 google 重新审核。
#67 by 木马 on 3月 31, 2010 - 10:46 上午
Quote
随机只是一个理想状态下的纯粹数学问题
在现实世界中没有真随机 只有伪随机。
所谓必须具有的科学观念,只是一个笑话,一个理科生用来为难文科生的说法而已。
文科生也可以很容易的为难理科生,所谓的人文素质,因为着同样只是一个纯粹的概念
#68 by jason on 3月 31, 2010 - 11:26 上午
Quote
“在下结论之前我们先考察1940年的伦敦大轰炸。当时伦敦在德军V2导弹的攻击下损失惨重…”
这里有点问题,如果是1940-1941年的伦敦大轰炸,则当时德军还没有V2导弹。VI和V2导弹对伦敦的攻击是在1944年。见http://zh.wikipedia.org/zh-cn/%E4%BC%A6%E6%95%A6%E5%A4%A7%E8%BD%B0%E7%82%B8
#69 by 同人于野 on 3月 31, 2010 - 11:36 下午
Quote
多谢指出!我看的一本书里的确说的是1940年用V2,但V2的确应该是在二战后期出现,wiki 的说法应该是正确的。
#70 by starcloud on 3月 31, 2010 - 1:30 下午
Quote
“我这个硬币连续100次扔出1元了,现在是第101次,你押1元还是菊花?”
“疯狂彩民”回答:菊花!这个不是应该平均点么,怎么地也要扳回来点吧……
标准的回答:50% vs 50% 要相信概率论!每一次扔硬币都是随机的……
现实的回答:还是押1元吧,连中100次1元的概率是(1/2)^100,而你丫这硬币有鬼的概率貌似更大……我宁愿相信你这硬币有鬼
#71 by Hong Xiaowan on 3月 31, 2010 - 6:36 下午
Quote
你拿出硬币,多扔扔,你会发现,美元和人民币的概率是不一样的,他们都不是50% vs 50%,了解这个诀窍的赌徒,用抛硬币和翻跟头,再加充足的赌本,很容易把你的钱洗劫一空。
#72 by 同人于野 on 3月 31, 2010 - 11:32 下午
Quote
很生动!
#73 by 被讥笑为科学主义者的人 on 3月 31, 2010 - 4:01 下午
Quote
53很精彩。
根据统计学,可以计算出此时硬币有鬼的概率是
1-(0.5)^100
#74 by rarew on 4月 4, 2010 - 1:24 下午
Quote
你这统计学应用的不对。否则,只扔一次,这硬币也有50%的可能性有鬼 🙂 原则上算不出有鬼的概率来。只能“假设检验”,算p值啥的。最后如何判断还是人为的设定一个值。
#75 by 杜牛牛 on 4月 1, 2010 - 11:24 上午
Quote
我非常赞同本文的观点:
1, 个案是无意义的,不能说明真实情况(例如河南人骗子清华学生作弊)
2, 大众对随机这个词存在“平均”的普遍误解(例如Ipod的程序)
3, 二项独立事件每一次发生某结果的概率是相同的,不会因为历史数据而改变(例如一个彩票站过去连续2次抽出大奖,下一次抽出奖的概率和依然很小)
但是我也有个疑问,就是:随机性是否能用“尚未被发现规律(概率)”来解释?
我相信一部分的随机性是因为我们尚未发现规律导致的,另一部分可能是“根本随机”,不论我们对自然的认识程度多么高,都不可能破解这个“随机”,或者这些“随机”(未能被解释的随机)的根本属性就是随机。随机本身就是对随机的解释。
那么这个比率是多少?多少我们认为的随机是因为我们无法解释,多少是真的随机?
我们现在没有这个数字,如果没有,那么我们就无法判断随机性是根本随机,还是只是因为我们认识不足?
无法判断就无法归类,就无法区别对待。
很想听听同人兄的看法。
#76 by 同人于野 on 4月 2, 2010 - 12:03 上午
Quote
关键是在样本小的情况下根本无法判断是随机还是真有原因,其实就是统计学所说的“假设检验”问题。也可能是随机过程,也可能真有原因,但是样本不够的情况下无法判断。也就是说(在一定的可信区间内)无法推翻“河南骗子比例其实跟别的省一样多”这个假设。
#77 by molly on 4月 1, 2010 - 6:53 下午
Quote
根本随机?假如能用算法实现所谓根本随机,我就摆脱宿命论。
#78 by starcloud on 4月 2, 2010 - 10:55 上午
Quote
我的理解是能用确定性算法实现的就不能称之为随机,而只是伪随机。
而问题是永远不能确定某个随机能否在有朝一日被确定性算法实现与否,因此这个问题无意义。
也就是说,能用确定性算法实现的就是伪随机,不能实现的只是暂时不能而已,不代表以后不能,也无法证明以后不能。
#79 by irenefu on 4月 1, 2010 - 11:48 下午
Quote
我们知道彩票是随机过程是因为我们是彩票的设计者,我们站在了系统外,因而我们能更清晰地看清这个道理。
但是,当人们自己陷入了这个系统中时,我们并不能立即获得假设说这个系统中发生的某个事件是随机的,因而我们会通过总结规律来识别这个事件的性质,或者说进一步证明我们的人生观。
个人以为,只要我们仍然身在这个系统中,这个随机过程的命题假设就永远无法证明。另外,说不定,我们某些规律性的世界认知(物理?)只不过是四维世界某些人的设计罢了。
#80 by starcloud on 4月 2, 2010 - 11:21 上午
Quote
我有个建议,同人兄可以再讲讲这块。
从三体问题讲起,庞加莱,混沌,确定但不可预测,蝴蝶效应,测不准原理,薛定谔的猫,直到上帝究竟扔不扔骰子。
这应该正是你这个物理强人的强项吧!:)
先谢了!期待中…
#81 by starcloud on 4月 2, 2010 - 12:07 下午
Quote
反正我也是挺头疼这些问题的。
波函数到底是所谓“本质”还仅仅是一个数学描述?世界的本源究竟是不是概率论的?如果微观世界是概率和波函数主宰一切的话,那么宏观世界的确定性(混沌,从本质上讲也是确定的)是从何而来的?
#82 by 同人于野 on 4月 2, 2010 - 11:23 下午
Quote
关于量子力学的书和文章车载斗量,我得想想怎样才能写得有特色,而且最好能结合一些最新的进展,这就不好写了:)
#83 by rarew on 4月 6, 2010 - 11:09 下午
Quote
还有一个违反我的直觉的例子:布朗运动。觉得明明是各个方向的运动几率一样大,为何就离原来的地方越来越远了呢?呵呵。
#84 by Ace on 10月 25, 2012 - 7:35 下午
Quote
不要停留于「直觉」,严格算一算你就知道为什么了。
#85 by cloudriver on 4月 13, 2010 - 8:13 下午
Quote
中彩票的整体规律是有的,纵观很多年的中奖号码,我猜想各数字出现几率是大体相同的。只是这个跨度太长,想具体到一次,和短期内的某些次,基本上是无稽之谈和侥幸。但如果一个人赌着一号,用几十年来跟,几率大大提高,用几辈子来跟,几率大大大大提高。。子子孙孙一直跟下去,总有一天会中。只是。。呵呵。。这个成本太高
#86 by FXTX1987 on 4月 18, 2010 - 10:37 上午
Quote
“如果你曾经被河南人骗过,如果你恰好听说自己的一个朋友也被河南人骗过,如果你进一步发现网上也有个人被河南人骗过,你是否会得出结论河南骗子多呢?如果去年有个清华毕业的硕士生被查出来抄袭,今年又有个清华教授被查出来抄袭,你是否会得出结论说清华纵容抄袭呢?”
最大似然概率…
#87 by 斧柯 on 3月 8, 2011 - 11:33 上午
Quote
学概率时就总纠结于参数估计和假设检验,因为两者总得出看似矛盾的结论。
本文就如此,参数估计(最大似然)时应该得出“河南人骗子多”的结论;假设检验时就不能推翻“各地骗子是随机分布的”这个假设。
#88 by vieplivee on 4月 22, 2010 - 7:50 上午
Quote
讨论太多来不及一一细看……
我只想说。十年前我真的认为统计是伪科学,因为它可以用一个人为控制的方法来为两个截然相反的命题找论据。现在我很后悔当初学了纯数学没学统计,不光因为不喜欢做啥子纯数学研究的缘故……怎么说呢,最近我真的有机会接触了一点统计,听课啊,跟朋友讨论等等。统计这个学科理解起来其实跟任何一个“严肃”的科学一样有趣,并且在现实的世界里,在人们对自然界掌握的证据远不足以进行任何确凿的、精确的推导的时候,统计能够起到指引明灯的作用。
火药可以用来制作美丽的烟花,也是人类用来互相杀伤武器的基础。一朵玫瑰是一朵玫瑰是一朵玫瑰,就看你往哪戴……
Pingback: 存在即合理 « Antique
#89 by 斯比瑞特 on 5月 7, 2010 - 12:37 下午
Quote
好像要看你怎么来定义“规律”这个词。
举个例子,如果3D彩票,百位连续20期不出1,那坚持每期买1**短期内中出是基本是肯定的(先别说理论)。
#90 by Steve Yu on 5月 7, 2010 - 3:48 下午
Quote
独立事件吧 前面不管多少期没出现 每一个单次的概率都一样不会因为以前的情况而改变, 彩票 不是 股票
#91 by liming on 5月 9, 2010 - 2:59 下午
Quote
“随机分布不等于均匀分布”,很容易被人忽略。
#92 by Ann on 5月 9, 2010 - 10:43 下午
Quote
哪种更适合作为取样的方法呢?是随机选择还是按照某一个方法平均选择呢?
#93 by liming on 5月 10, 2010 - 10:41 下午
Quote
取决于你的目的。
#94 by 游客 on 6月 6, 2010 - 2:01 上午
Quote
中医
Pingback: 存在即合理(未完待续) « Euler's maze
#95 by 木大 on 9月 15, 2011 - 8:08 上午
Quote
看到了评论才发现原来是同行。
我比较关心最根本的随机性假设的问题。
概率论在数学范畴自然没有问题的。但是当与现实结合起来的时候,我们如何来断定一个事件是完全随机的。
往往我们喜欢把大量事件(原则上是无穷多)的统计分布等价成单个事件的随机概率。
但是这个东西只能算个假说吧,我感觉其可靠性有等研究。
最后,上帝到底扔不扔骰子,说到最后这才是最根本的。
#96 by Ace on 10月 25, 2012 - 7:37 下午
Quote
「完全随机」是一个伪概念,因为「随机」指的是变量的一种性质,即变量服从某种概率分布,而概率分布不存在完全或不完全的说法。
#97 by lcn on 10月 25, 2012 - 11:23 下午
Quote
你显然理解错了“完全随机”的指代。是否完全随机是指的你看到的一个观测量背后是不是有除开随机变量X之外的u、v、w等其他确定性变量的影响。至于随机变量X的分布,大家都是假设其确定的,即使不清楚其具体分布。
#98 by Ace on 10月 26, 2012 - 2:39 上午
Quote
好吧,这样说得通。
#99 by 还看今朝 on 3月 2, 2012 - 2:23 上午
Quote
与同人兄探讨随机问题
在这篇文章中,同人兄提到能不能根据几次被河南人骗,而去推断河南人骗子多的问题。文章的最后给出的结论是不能,“就算我们连续三天听说关于河南人的坏消息,也不能下结论说河南骗子比别的省多。除非你有大规模的统计数字。”我觉得,同人兄虽然一直宣扬“用理工科思维理解世界”,但是在这里只是用文科生的思维来理解世界,只是感觉上“样本太少”,所以得不出结论。我通过概率论的一些演算,却能得到“河南省骗子多”的结论。
河南省人口大约1亿。我们假设其骗子为1/10,即1千万。看看能不能推翻这个结论?我连续遇到三个河南人,都是骗子的可能性是:P= C31千万 / C31亿, 大约等于1/1000.这是一个小概率事件,但是它却发生了。根据实际推断原理,我们可以推断骗子1/10,是几乎不可能的。
骗子数越多,这个概率越大,越来越推翻不了。比如说,要是骗子为5000万的话,遇到三个河南人都是骗子的可能性为1/8,这不是小概率事件,不能推翻假设。
也就是说,根据概率论的演算,骗子越多,遇到三个河南人都是骗子的可能性越大。骗子为1千万时,连续遇到骗子的可能性很小,几乎不可能发生。当骗子为1/2时,假设才有可能不被推翻。所以,我们能得出“河南省骗子多”的结论。
#100 by FDSK19 on 2月 1, 2013 - 11:50 上午
Quote
如果我没有理解错:
1)按这种方法,我可以先假设任何省份的骗子数为其总人数的1/2,然后基于该假设进行推导以后,论证原假设是正确的——其实这样是循环论证吧?
2)即使不循环论证了——同人的方法核心是大样本的统计规律,而你提供的方法的核心是基于小样本的假设检验。其实我觉得他这篇已经有说到这点:仅仅依靠基于小样本的假设检验而得出结论,这个结论可能并不够准确。关于本问题(“河南人”与“骗子”的关系),还是看看#3由zkk作出的分析吧。
#101 by I‘mhere on 5月 15, 2015 - 11:37 上午
Quote
1)中并没有什么循环论证的问题吧?你的意思是,按照这种理论,我们也可以先假设北京的骗子是1/2,然后推出北京骗子多的结论。问题是,你遇到过连续被北京人骗3次的情况吗?为啥偏偏没有北京,没有上海,没有别的省,只有河南呢?
#102 by 包包 on 2月 24, 2013 - 12:24 下午
Quote
樓主。我是廣東的。。說實話廣東本省的騙子很少。。如果找法院記錄的犯罪率其實是可以看到90%以上的罪案都不是本地人做的。。。。
至於出現騙子的原因我想貧困是一點。。然後人品也是一點、民風什麽的。。。估計可以根據經濟來做一個曲綫圖。。
另外就是,當然不能一棍子打死一省人但小到一個地方,民風確實是存在的。。。。正如英國人比較內向拘謹彬彬有禮也是真的。。。還有鳳陽為何乞丐成風。。。
另外關於在家鄉就是老實巴交農民結果出去反而作案,曾經看過這麼一個解釋就是。。農村基本上是以戶甲制的一個村人口不多鄰里都認識如果一干什麽事情全村都會知道,所以不會去犯案但是城市人口流動頻繁大家互不認識就沒有這個約束了。。。。而且干完還可以逃可以轉移9參看八十年代90年代最流行的“跨省流串作案字眼”)我不知道這個理論在犯罪學是否成立
#103 by Ferdinand on 3月 31, 2013 - 11:06 下午
Quote
根据我在其他文章所了解到的,人们出现博主所说的现象,我觉得是直观思维所导致的错误,在直观思维的自主系统下,这一系统易犯系统性错误,有时候会将原本较难的问题作简单化处理,但对于逻辑学和统计学问题,它几乎一无所知。人们单依靠记忆作出判断的,所以就是容易出现思维上的错误。
#104 by lcn on 4月 1, 2013 - 2:08 上午
Quote
这样的处理不单只是直观思维,其实也是概率思维,因为实际上相当于自己假定一个贝叶斯概率的先验分布,然后根据自己观察的事实、信息来进行概率的更新。只不过,概率更新是需要有足够多的次数才能摆脱先验假定的影响的。
#105 by syoutenga on 6月 3, 2013 - 8:53 上午
Quote
同人兄你好!你的V2(V1)例子很好玩,我想把它作为讲授随机性的critical thinking的阅读材料。请问有木有这方面的英文文章(用这个例子来说明随机性)呢?我自己google到一个有意思的网页 http://www.dailymail.co.uk/sciencetech/article-2243951/The-astonishing-interactive-map-EVERY-bomb-dropped-London-Blitz.html 但好像没有你讲得这么drama。谢谢!
#106 by raymond on 9月 30, 2013 - 1:53 下午
Quote
一个小问题:v2导弹是战争快结束的1944年才出现的,1940年伦敦大轰炸时v2还没出生呢。