<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>评论：第四个科学发现范式</title>
	<atom:link href="http://www.geekonomics10000.com/495/feed" rel="self" type="application/rss+xml" />
	<link>http://www.geekonomics10000.com/495</link>
	<description>用理工科思维理解世界</description>
	<lastBuildDate>Fri, 03 Feb 2012 04:32:48 +0000</lastBuildDate>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
	<item>
		<title>由：LeesLee</title>
		<link>http://www.geekonomics10000.com/495/comment-page-1#comment-3395</link>
		<dc:creator>LeesLee</dc:creator>
		<pubDate>Fri, 08 Apr 2011 10:48:58 +0000</pubDate>
		<guid isPermaLink="false">http://www.geekonomics10000.com/?p=495#comment-3395</guid>
		<description>只有变异影响到了生理的正常运行才成为病。
染色体上不全是基因，相当多的DNA片段不参与蛋白质的制作，发生变异一般不产生影响</description>
		<content:encoded><![CDATA[<p>只有变异影响到了生理的正常运行才成为病。<br />
染色体上不全是基因，相当多的DNA片段不参与蛋白质的制作，发生变异一般不产生影响</p>
]]></content:encoded>
	</item>
	<item>
		<title>由：小僧</title>
		<link>http://www.geekonomics10000.com/495/comment-page-1#comment-2923</link>
		<dc:creator>小僧</dc:creator>
		<pubDate>Wed, 08 Dec 2010 09:50:52 +0000</pubDate>
		<guid isPermaLink="false">http://www.geekonomics10000.com/?p=495#comment-2923</guid>
		<description>我只看到一句话
“这个思路并不奇特甚至司空见惯”</description>
		<content:encoded><![CDATA[<p>我只看到一句话<br />
“这个思路并不奇特甚至司空见惯”</p>
]]></content:encoded>
	</item>
	<item>
		<title>由：larry</title>
		<link>http://www.geekonomics10000.com/495/comment-page-1#comment-2256</link>
		<dc:creator>larry</dc:creator>
		<pubDate>Wed, 14 Jul 2010 23:40:51 +0000</pubDate>
		<guid isPermaLink="false">http://www.geekonomics10000.com/?p=495#comment-2256</guid>
		<description>这个只是数据挖掘学界一直引用的一个“经典案例”而已，只是说明了技术可行性，在商业上没有可拷贝性，没有可商业执行性。不必较真。
http://www.itpub.net/viewthread.php?tid=1281661</description>
		<content:encoded><![CDATA[<p>这个只是数据挖掘学界一直引用的一个“经典案例”而已，只是说明了技术可行性，在商业上没有可拷贝性，没有可商业执行性。不必较真。<br />
<a href="http://www.itpub.net/viewthread.php?tid=1281661" rel="nofollow">http://www.itpub.net/viewthread.php?tid=1281661</a></p>
]]></content:encoded>
	</item>
	<item>
		<title>由：feiqu</title>
		<link>http://www.geekonomics10000.com/495/comment-page-1#comment-2245</link>
		<dc:creator>feiqu</dc:creator>
		<pubDate>Fri, 09 Jul 2010 13:01:50 +0000</pubDate>
		<guid isPermaLink="false">http://www.geekonomics10000.com/?p=495#comment-2245</guid>
		<description>我正面临处理海量数据的问题，试试看！
楼主对网络爬虫技术怎么看？</description>
		<content:encoded><![CDATA[<p>我正面临处理海量数据的问题，试试看！<br />
楼主对网络爬虫技术怎么看？</p>
]]></content:encoded>
	</item>
	<item>
		<title>由：hplonline</title>
		<link>http://www.geekonomics10000.com/495/comment-page-1#comment-2242</link>
		<dc:creator>hplonline</dc:creator>
		<pubDate>Thu, 08 Jul 2010 08:03:25 +0000</pubDate>
		<guid isPermaLink="false">http://www.geekonomics10000.com/?p=495#comment-2242</guid>
		<description>嗯，听说一个新名词。就像上面同学说的，一般的研究也就是从4开始的。只是大部分时候开始得很偶然，取决于人对于数据的敏感程度。比如苹果向下掉是大家都会在生活中获得的数据，但在看了很多次这个数据之后，牛顿终于想到什么。。而4范式的感觉是，希望实现海量的存储，海量的实时分析，让本身不对任何东西敏感的机器，使用人类定义“敏感”的有限种方法，来发现新的东西。比如ddos攻击的时候，通过路由器的目的IP的信息熵可能瞬间降低。</description>
		<content:encoded><![CDATA[<p>嗯，听说一个新名词。就像上面同学说的，一般的研究也就是从4开始的。只是大部分时候开始得很偶然，取决于人对于数据的敏感程度。比如苹果向下掉是大家都会在生活中获得的数据，但在看了很多次这个数据之后，牛顿终于想到什么。。而4范式的感觉是，希望实现海量的存储，海量的实时分析，让本身不对任何东西敏感的机器，使用人类定义“敏感”的有限种方法，来发现新的东西。比如ddos攻击的时候，通过路由器的目的IP的信息熵可能瞬间降低。</p>
]]></content:encoded>
	</item>
	<item>
		<title>由：Nicttism-online</title>
		<link>http://www.geekonomics10000.com/495/comment-page-1#comment-2221</link>
		<dc:creator>Nicttism-online</dc:creator>
		<pubDate>Fri, 02 Jul 2010 02:35:46 +0000</pubDate>
		<guid isPermaLink="false">http://www.geekonomics10000.com/?p=495#comment-2221</guid>
		<description>what I was looking for, thanks</description>
		<content:encoded><![CDATA[<p>what I was looking for, thanks</p>
]]></content:encoded>
	</item>
	<item>
		<title>由：同人于野</title>
		<link>http://www.geekonomics10000.com/495/comment-page-1#comment-2141</link>
		<dc:creator>同人于野</dc:creator>
		<pubDate>Sun, 27 Jun 2010 23:09:02 +0000</pubDate>
		<guid isPermaLink="false">http://www.geekonomics10000.com/?p=495#comment-2141</guid>
		<description>的确如此，correlation 不代表因果关系，但就目前而言能得到 correlation 就不错了，是一切的一切的第一步。</description>
		<content:encoded><![CDATA[<p>的确如此，correlation 不代表因果关系，但就目前而言能得到 correlation 就不错了，是一切的一切的第一步。</p>
]]></content:encoded>
	</item>
	<item>
		<title>由：Fleeting Years</title>
		<link>http://www.geekonomics10000.com/495/comment-page-1#comment-2140</link>
		<dc:creator>Fleeting Years</dc:creator>
		<pubDate>Sun, 27 Jun 2010 11:30:42 +0000</pubDate>
		<guid isPermaLink="false">http://www.geekonomics10000.com/?p=495#comment-2140</guid>
		<description>似乎有一些问题，如果我没有理解错的话，这样筛选出来的数据有可能不存在因果关系......

比如，“喝咖啡对降低帕金森症发病率有好处”，可能实际上两者并没有因果关系，可能一者是另一者的伴随结果或同为另一个原因的结果,甚至我们不知道因果是否倒置，可能是某些细菌导致口感改变且降低发病率，或可能是降低发病率时的生理反应导致口感改变。

另外，我对这种方法前途不看好，不主观限定而分析的话数据的变量太多了，主观的确定范围反倒很容易忽略真正的原因：毕竟攻克不下的难关突破口很可能在意想不到的地方，这是一二三四范式方法都很难触及找到的。</description>
		<content:encoded><![CDATA[<p>似乎有一些问题，如果我没有理解错的话，这样筛选出来的数据有可能不存在因果关系&#8230;&#8230;</p>
<p>比如，“喝咖啡对降低帕金森症发病率有好处”，可能实际上两者并没有因果关系，可能一者是另一者的伴随结果或同为另一个原因的结果,甚至我们不知道因果是否倒置，可能是某些细菌导致口感改变且降低发病率，或可能是降低发病率时的生理反应导致口感改变。</p>
<p>另外，我对这种方法前途不看好，不主观限定而分析的话数据的变量太多了，主观的确定范围反倒很容易忽略真正的原因：毕竟攻克不下的难关突破口很可能在意想不到的地方，这是一二三四范式方法都很难触及找到的。</p>
]]></content:encoded>
	</item>
	<item>
		<title>由：同人于野</title>
		<link>http://www.geekonomics10000.com/495/comment-page-1#comment-2139</link>
		<dc:creator>同人于野</dc:creator>
		<pubDate>Sun, 27 Jun 2010 06:17:38 +0000</pubDate>
		<guid isPermaLink="false">http://www.geekonomics10000.com/?p=495#comment-2139</guid>
		<description>那些风云榜不可能自动发现所有的词，我认为其中一定有主观的设定。</description>
		<content:encoded><![CDATA[<p>那些风云榜不可能自动发现所有的词，我认为其中一定有主观的设定。</p>
]]></content:encoded>
	</item>
	<item>
		<title>由：同人于野</title>
		<link>http://www.geekonomics10000.com/495/comment-page-1#comment-2138</link>
		<dc:creator>同人于野</dc:creator>
		<pubDate>Sun, 27 Jun 2010 06:16:59 +0000</pubDate>
		<guid isPermaLink="false">http://www.geekonomics10000.com/?p=495#comment-2138</guid>
		<description>这个“第四代”高就高在要大海捞针，要机械。否则就是一般意义的经验公式了。</description>
		<content:encoded><![CDATA[<p>这个“第四代”高就高在要大海捞针，要机械。否则就是一般意义的经验公式了。</p>
]]></content:encoded>
	</item>
	<item>
		<title>由：同人于野</title>
		<link>http://www.geekonomics10000.com/495/comment-page-1#comment-2135</link>
		<dc:creator>同人于野</dc:creator>
		<pubDate>Sun, 27 Jun 2010 06:12:26 +0000</pubDate>
		<guid isPermaLink="false">http://www.geekonomics10000.com/?p=495#comment-2135</guid>
		<description>这样用数据分析方法搞出来的一个诊断软件叫做 Isabel，我记得好像是被微软收购了。我估计搜索引擎恐怕目前还没有碰专业的医疗数据库。Google 分析流感也只是看人们在其网站搜索的关键词而已。医疗数据库需要医院的配合，Isabel 这样的软件是跟医院关系密切的人整出来的。当然原理还是一样的，技术就那么几下子没什么了不起，有没有足够大的数据库才是关键。</description>
		<content:encoded><![CDATA[<p>这样用数据分析方法搞出来的一个诊断软件叫做 Isabel，我记得好像是被微软收购了。我估计搜索引擎恐怕目前还没有碰专业的医疗数据库。Google 分析流感也只是看人们在其网站搜索的关键词而已。医疗数据库需要医院的配合，Isabel 这样的软件是跟医院关系密切的人整出来的。当然原理还是一样的，技术就那么几下子没什么了不起，有没有足够大的数据库才是关键。</p>
]]></content:encoded>
	</item>
	<item>
		<title>由：chili</title>
		<link>http://www.geekonomics10000.com/495/comment-page-1#comment-2132</link>
		<dc:creator>chili</dc:creator>
		<pubDate>Sat, 26 Jun 2010 20:49:07 +0000</pubDate>
		<guid isPermaLink="false">http://www.geekonomics10000.com/?p=495#comment-2132</guid>
		<description>流行病学研究，大量病例统计是普通方法。
google们对医疗表现出极大兴趣是理所当然的。
比如美国的电子病历系统，遭到医院的强烈抵制，花费无数的钱才启动。
病历从纸张变成数据存储，看似简单的变化，也有极深的未来影响。一旦数百万数千万病历都存储起来后，google就可以从这些人的病历中挖掘各种相关性。一个人如果要检查身体，搜索引擎就可以根据你的年龄体重家庭背景，然后和数百万既往病历对比，找出最大可能性。
一句话，搜索引擎的诊断，要远远比任何内科医生都精准。</description>
		<content:encoded><![CDATA[<p>流行病学研究，大量病例统计是普通方法。<br />
google们对医疗表现出极大兴趣是理所当然的。<br />
比如美国的电子病历系统，遭到医院的强烈抵制，花费无数的钱才启动。<br />
病历从纸张变成数据存储，看似简单的变化，也有极深的未来影响。一旦数百万数千万病历都存储起来后，google就可以从这些人的病历中挖掘各种相关性。一个人如果要检查身体，搜索引擎就可以根据你的年龄体重家庭背景，然后和数百万既往病历对比，找出最大可能性。<br />
一句话，搜索引擎的诊断，要远远比任何内科医生都精准。</p>
]]></content:encoded>
	</item>
	<item>
		<title>由：奇婕</title>
		<link>http://www.geekonomics10000.com/495/comment-page-1#comment-2131</link>
		<dc:creator>奇婕</dc:creator>
		<pubDate>Fri, 25 Jun 2010 10:30:14 +0000</pubDate>
		<guid isPermaLink="false">http://www.geekonomics10000.com/?p=495#comment-2131</guid>
		<description>嗯，看你的博客感觉收获很多，特别启发思路。 
谢谢
这个数据挖掘的工作有点大海捞针的意思，工作比较机械，但关键的还是人的思想。</description>
		<content:encoded><![CDATA[<p>嗯，看你的博客感觉收获很多，特别启发思路。<br />
谢谢<br />
这个数据挖掘的工作有点大海捞针的意思，工作比较机械，但关键的还是人的思想。</p>
]]></content:encoded>
	</item>
	<item>
		<title>由：liming</title>
		<link>http://www.geekonomics10000.com/495/comment-page-1#comment-2130</link>
		<dc:creator>liming</dc:creator>
		<pubDate>Thu, 24 Jun 2010 17:01:26 +0000</pubDate>
		<guid isPermaLink="false">http://www.geekonomics10000.com/?p=495#comment-2130</guid>
		<description>关于“假设 google 有一个机制自动发现任何被突然大量搜索的词，这种模式识别显然就是真正客观而不是主观的。”

可以百分百确定，google有这个机制和能力。——几乎所有的搜索引擎大概都有这能力，百度也有，“上升最快风云榜”就是一个产出。</description>
		<content:encoded><![CDATA[<p>关于“假设 google 有一个机制自动发现任何被突然大量搜索的词，这种模式识别显然就是真正客观而不是主观的。”</p>
<p>可以百分百确定，google有这个机制和能力。——几乎所有的搜索引擎大概都有这能力，百度也有，“上升最快风云榜”就是一个产出。</p>
]]></content:encoded>
	</item>
	<item>
		<title>由：同人于野</title>
		<link>http://www.geekonomics10000.com/495/comment-page-1#comment-2129</link>
		<dc:creator>同人于野</dc:creator>
		<pubDate>Thu, 24 Jun 2010 16:36:18 +0000</pubDate>
		<guid isPermaLink="false">http://www.geekonomics10000.com/?p=495#comment-2129</guid>
		<description>这个道理肯定是对的，但这个例子可能有点问题。商店里的啤酒一般会冷藏，这样的话不太可能跟尿布放在一起。另外尿布不长买，一般一买就是好几箱，而啤酒是要常买的。而且尿布的销量似乎应该是全年都差不多，啤酒则明显夏季更多一些，这样看来二者之间的相关性不应该太明显。</description>
		<content:encoded><![CDATA[<p>这个道理肯定是对的，但这个例子可能有点问题。商店里的啤酒一般会冷藏，这样的话不太可能跟尿布放在一起。另外尿布不长买，一般一买就是好几箱，而啤酒是要常买的。而且尿布的销量似乎应该是全年都差不多，啤酒则明显夏季更多一些，这样看来二者之间的相关性不应该太明显。</p>
]]></content:encoded>
	</item>
	<item>
		<title>由：同人于野</title>
		<link>http://www.geekonomics10000.com/495/comment-page-1#comment-2128</link>
		<dc:creator>同人于野</dc:creator>
		<pubDate>Thu, 24 Jun 2010 16:32:45 +0000</pubDate>
		<guid isPermaLink="false">http://www.geekonomics10000.com/?p=495#comment-2128</guid>
		<description>不敢当，大部分内容是看到而不是想到的。</description>
		<content:encoded><![CDATA[<p>不敢当，大部分内容是看到而不是想到的。</p>
]]></content:encoded>
	</item>
	<item>
		<title>由：同人于野</title>
		<link>http://www.geekonomics10000.com/495/comment-page-1#comment-2127</link>
		<dc:creator>同人于野</dc:creator>
		<pubDate>Thu, 24 Jun 2010 16:28:56 +0000</pubDate>
		<guid isPermaLink="false">http://www.geekonomics10000.com/?p=495#comment-2127</guid>
		<description>稍微补充了一点内容。</description>
		<content:encoded><![CDATA[<p>稍微补充了一点内容。</p>
]]></content:encoded>
	</item>
	<item>
		<title>由：xiang</title>
		<link>http://www.geekonomics10000.com/495/comment-page-1#comment-2126</link>
		<dc:creator>xiang</dc:creator>
		<pubDate>Thu, 24 Jun 2010 12:15:50 +0000</pubDate>
		<guid isPermaLink="false">http://www.geekonomics10000.com/?p=495#comment-2126</guid>
		<description>万老师的渊博程度已经超越了我想象的极限……</description>
		<content:encoded><![CDATA[<p>万老师的渊博程度已经超越了我想象的极限……</p>
]]></content:encoded>
	</item>
	<item>
		<title>由：XYZ</title>
		<link>http://www.geekonomics10000.com/495/comment-page-1#comment-2125</link>
		<dc:creator>XYZ</dc:creator>
		<pubDate>Thu, 24 Jun 2010 11:41:27 +0000</pubDate>
		<guid isPermaLink="false">http://www.geekonomics10000.com/?p=495#comment-2125</guid>
		<description>Google不是一直有关键字搜索趋势么？但是一般大量的搜索的都是娱乐性质的把，如果是这样的客观不一定有用，说道底对于关键字的筛选，还是要人为设置模式识别判断的范式把？</description>
		<content:encoded><![CDATA[<p>Google不是一直有关键字搜索趋势么？但是一般大量的搜索的都是娱乐性质的把，如果是这样的客观不一定有用，说道底对于关键字的筛选，还是要人为设置模式识别判断的范式把？</p>
]]></content:encoded>
	</item>
	<item>
		<title>由：bai_qi</title>
		<link>http://www.geekonomics10000.com/495/comment-page-1#comment-2124</link>
		<dc:creator>bai_qi</dc:creator>
		<pubDate>Thu, 24 Jun 2010 10:26:10 +0000</pubDate>
		<guid isPermaLink="false">http://www.geekonomics10000.com/?p=495#comment-2124</guid>
		<description>这不就是数据挖掘嘛？
沃尔玛用数据挖掘技术无意中发现婴儿尿布与啤酒的销量呈现正相关的关系，进一步分析发现是年轻的爸爸经常会被妈妈叫去买尿布，有时就会顺手捎一支啤酒回来呷。
后面沃尔玛就把啤酒与尿布安排在同一个地方，结果，啤酒销量大涨！！</description>
		<content:encoded><![CDATA[<p>这不就是数据挖掘嘛？<br />
沃尔玛用数据挖掘技术无意中发现婴儿尿布与啤酒的销量呈现正相关的关系，进一步分析发现是年轻的爸爸经常会被妈妈叫去买尿布，有时就会顺手捎一支啤酒回来呷。<br />
后面沃尔玛就把啤酒与尿布安排在同一个地方，结果，啤酒销量大涨！！</p>
]]></content:encoded>
	</item>
</channel>
</rss>

