(《新知客》,2010年6月)
“如果你不知道往哪踢,就往门里踢”,多年以前施拉普纳曾经这样教中国队。也许这只是德国人调侃,但很多球队即将怀着这样简明易懂的战术参加本届世界杯赛 — 好在他们不是去南非,而是去新加坡参加另一场世界杯足球赛:机器人的世界杯。这项由日本发起的赛事规模越来越大,它的目标是在2050年,让一支机器人足球队战胜人类世界杯冠军。人类球员对此不必过分担心,从目前的发展水平来看,我们距离把足球比赛外包给机器人的那一天还非常遥远。
即使是这样,我们仍然能从机器人比赛中学到非常有价值的东西,这个价值不是关于机器,而是关于我们。通过考察机器人球员的弱点,我们可以了解人的优势到底是什么。更进一步,我们可以了解人到底是怎么学会各种技能的。
最引人瞩目的比赛是类人组。这是目前最先进的机器人球员,他们身高相当于一两岁到四五岁的小孩,本届世界杯甚至首次有了成人身高组。他们直立行走,用脚来踢球,而不像小型组球员那样被装在轮子上。除了发现球,追上球和射门这些基本功能之外,如果机器人在比赛中跌倒,还必须能以一个变形金刚式的动作自行站立起来。看他们做这些动作的时候你会几乎觉得他们是活的。然而面对近在咫尺的球门线上一个几乎不会动的守门员,球就在停脚下,在没有干扰的情况下,一个机器人球员需要30秒的时间来调整自己跟球的相对位置,然后才能完成一个很轻的射门动作。这已经足够成为一个必进球,因为距离太短,球速太“快”,守门员来不及做出任何反应。比赛不但谈不上技战术,甚至谈不上拼抢,大多数情况下能踢到球就很不错了。
相对于机器人研究的现状而言,能踢到球已经是一个相当了不起的成就。据悉尼技术大学的Williams教授介绍,作为机器人,你要在各种状态之间切换。如果你处于无球状态,程序给你的任务是“找到球”,而在球场上的众多物体中判断哪个是球已经是很难的技术。发现球以后你的状态变成“走向球”,你要计算球的方位,调整自己的姿态来面向球,然后才能迈步走过去,这还不算球可能在移动。一旦球在你脚下了,你的状态将变成“拿球”,然后你不必考虑什么复杂的传切配合,只需听从施拉普纳的简单忠告,射门。不过在此之前你还必须完成一个复杂的任务,那就是首先找到球门,然后计算射门角度并寻找一个合适的你跟球和球门的相对位置。
问题在于,人踢球的时候并不做任何数值计算。MIT的计算机科学家Rodney Brooks最近指出, 要想让机器人拥有人的基本智能,它至少需要2岁儿童的物品认知能力,4岁儿童语言能力,6岁儿童的动手能力,和8岁儿童的社交认知能力,而目前的技术水平据此相距甚远。实际上,当前机器人科学家正在研究的问题,是如何让机器人学会怎么区分不同的物体,怎么伸手去把一个物体拿起来,而这些都是人类在一岁以前就掌握的技能。小孩伸手拿东西的时候既不计算出手角度也不用考虑手指组合的姿态,他们几乎是无意识的就能把各种复杂的物体,使用每次都不太一样的姿势抓取过来。我们都会做,可是我们都不知道我们怎么做的。
绝大多数计算机程序,比如传统的专家系统,本质上都是融合了海量知识的一系列 “if… then…”逻辑判断,而这样的系统无法适应真实世界的千变万化,不能算真正的“智能”。在人工智能领域的最前沿,科学家必须一边研究计算机,一边研究人脑。现在美国国家科学基金的 Project One 项目中,来自多个大学的计算机科学家,认知科学家和发展心理学家正在团队合作,目标是创造一个具备一岁婴儿的认知和交流能力的机器人。他们邀请婴幼儿到最尖端的计算机实验室来跟妈妈玩躲猫猫之类的游戏,使用高速摄像机记录每一个动作和反应。在这个项目中,发展心理学家 Lev Vygotsky 发现了婴儿在一岁左右的一个智力跃进:当一个婴儿想要一个玩具而够不着的时候,他会示意妈妈把这个玩具递给他!Project One 正在努力研发世界上第一个具备这种能力 — 不是人指导机器人,而是机器人反过来指导人 — 的机器人。
科学家们发现与其说他们现在更加了解怎么造一个机器人,不如说他们现在更加了解人类自己。当前的一个共识是小孩出生的时候大脑里并没有预存任何关于怎么拿一个物体之类的程序,家长也没给输入,是孩子自己在实践中的不断摸索,试错和练习使他们掌握了这些技能。我们不是通过阅读说明书学会的开车,我们通过上路练习,被人鸣笛抗议,被教练和交警训斥学会开车。人的学习过程不是对动作要领的记忆,而是通过反复练习使得控制身体的各个脑神经元之间不断地连接,以至于从硬件层面对大脑重组。
人工智能研究的趋势就是让机器像人一样具有学习能力,使用软件模拟人的神经网络。机器人球员不再是一出厂就会,他们也需要大量的训练和比赛。比如当机器人做对了一个动作,就给他一个正面的激励,做错了给一个惩罚。通过神经网络的训练,机器人已经学会了从众多物体中识别一个人脸之类的技能。
人的这种学习和判断过程往往是无意识的。畅销书《异类》的作者格拉德威尔的另一本书,Blink(《决断两秒间》)中,就记载了大量的无意识判断的神奇例子。比如一个网球教练每次看电视转播都能预知运动员的发球失误,可是他无法解释自己是根据什么做出的判断。格拉德威尔说不清这个能力来自哪里,归结为人具备的一个超级计算机系统。清华大学赵南元教授在《认知科学揭秘》一书中指出,这套系统来自进化,人工智能研究必须考虑人是进化的产物这个事实。Jonah Lehrer 的 How We Decide 一书也提到,人脑的确有两套计算系统:一套是有意识的用于数值和逻辑计算,这套系统在人类历史中出现较晚,所以速度很慢;而另一套系统,靠神经元的连接重组形成的感情系统,则是数十万年进化的产物,其速度要快得多。
所以人的优势在于“感觉”,在于对“感觉”的训练。美式足球联盟曾经认为球员应该像计算机一样打球。鉴于四分卫的重要性,他们给四分卫候选新秀进行很高难度的智商和数学测验,内容是12分钟内50道越来越难的数学题,认为四分卫在最短的时间内判断场上形势需要用到这些能力。然而事实证明很多最好的四分卫在这种考试中得分很差,他们不是用数学比赛。如果你采访一个四分卫是怎么在关键时刻传出绝妙一球的,他的回答很可能是“我不知道。传球并没有一定之规,我只是感觉应该把球传向那里。”
人类中的大师都这样。在机器人学会说“我只是感觉”之前,他们不可能战胜人类冠军。
#1 by 被讥笑为科学主义者的人 on 6月 3, 2010 - 3:33 下午
Quote
“感觉”即模式识别。
#2 by AA on 6月 3, 2010 - 6:17 下午
Quote
模式识别就是概率统计,没有接触到根本性的东西.MIT的教授都说了,他认为AI最可行的只有逻辑这条路了.可惜逻辑能够制造的集合太狭窄了,逻辑这个算子能量太有限了.
#3 by 依云 on 6月 3, 2010 - 7:24 下午
Quote
人脑另一套系统是量子计算?
#4 by 被讥笑为科学主义者的人 on 6月 3, 2010 - 11:40 下午
Quote
#2 by AA on June 3, 2010 – 6:17 pm
Reply Quote
模式识别就是概率统计,没有接触到根本性的东西.MIT的教授都说了,他认为AI最可行的只有逻辑这条路了.可惜逻辑能够制造的集合太狭窄了,逻辑这个算子能量太有限了.
=========================
模式识别并不仅仅是概率统计。
你认为“根本性的东西”什么呢?
#5 by gaga on 6月 4, 2010 - 7:53 上午
Quote
嗯~我们泛函分析老师在做有关神经网络的问题,不过那个是人类自身的大脑,但是那个貌似也需要模拟的。这套模拟系统不知道有多大用处哦,还有哦,看那个I AM ROBORT 电影中提到过用插分方程来作出判断,我想应该是建立在”看的感觉”之上 比如进行红外感应做出距离测算然后判断吧~
Pingback: Tweets that mention 我们能从机器人世界杯学到什么 « 学而时嘻之 -- Topsy.com
#6 by 草根网 on 6月 4, 2010 - 1:21 下午
Quote
好文,收藏至20ju.com
#7 by 冠杰 on 6月 4, 2010 - 11:43 下午
Quote
从编程的角度看,人工神经元很有前途
#8 by 康康 on 6月 5, 2010 - 8:57 上午
Quote
很有意思。 对于专长研究而言,非常有启发。
#9 by AA on 6月 5, 2010 - 4:56 下午
Quote
模式识别并不仅仅是概率统计。
你认为“根本性的东西”什么呢?
——————————–
AI领域高级专家到公开说目前为止都不知道到底什么叫智能.
模式识别大部分是关于目标特征点,数学统计游戏
#10 by AA on 6月 5, 2010 - 5:03 下午
Quote
人脑另一套系统是量子计算?
———————–
个人估计有点这方面的倾向.因为如果把现实发生情况比作一个函数,那么这个函数的约束条件是不定的或者说是模糊的,所以最终是无数种混沌的结果.
#11 by 被讥笑为科学主义者的人 on 6月 5, 2010 - 7:28 下午
Quote
#9 by AA on June 5, 2010 – 4:56 pm
Reply Quote
模式识别并不仅仅是概率统计。
你认为“根本性的东西”什么呢?
——————————–
AI领域高级专家到公开说目前为止都不知道到底什么叫智能.
==============================
我觉得智能就是学习能力。
模式识别大部分是关于目标特征点,数学统计游戏
==========================
不完全是吧,语音识别的“目标特征点”在哪里?
#12 by freetstar on 6月 6, 2010 - 10:44 上午
Quote
不错了,正在研究这方面
#13 by AA on 6月 6, 2010 - 11:51 上午
Quote
自己去查维基百科,关键字”语音识别”,然后再来说.
#14 by 被讥笑为科学主义者的人 on 6月 6, 2010 - 5:05 下午
Quote
#13 by AA on June 6, 2010 – 11:51 am
Reply Quote
自己去查维基百科,关键字”语音识别”,然后再来说.
===============================
在维基百科的语音识别中未发现“目标特征点”一词,看来还是你杜撰的术语。
#15 by chengzhi on 6月 7, 2010 - 3:56 下午
Quote
博主,媒体现在还在讲低碳,(世博会也在讲低碳),
我有点理解不了啊,co2和气候变暖(甚至都没变暖)有的关系是:太阳活动影响地球气候,然后影响到co2的排放。
觉得自己在被忽悠。
我有点困惑。
祝好。
#16 by 则道 on 6月 8, 2010 - 4:01 下午
Quote
上次在一部讲混沌理论的纪录片里看到美国已经有一些研究进化软件的公司让一个程序通过不断的练习和进化慢慢的能够像人一样能走能跑能跳了。
#17 by 凉薯 on 6月 8, 2010 - 4:49 下午
Quote
传统计算机软件是瀑布式的逻辑模式,所有逻辑一开始就定死,而人脑(和神经网络)是通过纠错,学习,迭代工作的。估计人脑和CPU的工作原理也有很大差别(每个神经元都独立运行,有很高的并发性,而不是CPU集中逻辑)。这些都造成模拟人脑有极大困难。一家之言。
#18 by 二就二啦 on 6月 9, 2010 - 8:14 上午
Quote
比较赞同楼上的观点!
#19 by 人民有胡说的权力 on 6月 9, 2010 - 11:52 上午
Quote
所以按照楼上的说法,我们设计一个自组织的程序,给它足够多的试错机会,也许就能产生一个AI?我不这么认为,我觉着,恐怕智能的形成不完全是纠错、学习加迭代这么一个过程形成的。
#20 by hypermania on 6月 9, 2010 - 8:57 下午
Quote
科学家到现在也没有在脑中发现能够产生智力的物质,只有大量的神经元。神经网络程序是很常见的,但是没有人脑的神经的程序。是不是当神经网络程序复杂到像人脑一样,就会产生智力?
#21 by Divas on 5月 9, 2013 - 11:02 上午
Quote
现在对人的两套系统的认识:控制化系统(偏向于思维和规划)和自动化系统(与自主神经系统有关),The Happiness Hypothesis:Finding Modern Truth in Ancient Wisdom(象与骑象人)有谈到