复杂-第28章
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
集合所不可或缺的。除了少数情况以外,神经网络研究人员基本上不在这个方面下功
夫。”
结果荷兰德决定自己设计一个杂交的模拟适应性作用者,把神经网络和专家系统的
长处相结合。为了加强计算机效率,他先用专家系统有名的“如果……则”规则开始入
手。但他是从神经网络角度采用这个规则的。
荷兰德说,事实上,在任何情况下都会有类似“如果……则”的规则。六十年代末,
在人们远还没听说过专家系统以前,基于规则的系统就已经作为人类用于认知的普通功
能的计算机而被卡内奇…麦伦一派的爱伦·纽威尔和赫伯特·西蒙介绍进计算机编程里
来了。纽威尔和西蒙把每一条规则都当作一个单一的知识包,或一个单一的技术组合。
比如“如果吱吱的叫声是来自一只鸟,那么吱吱叫的东西就有翅膀”,或“如果在扣留
你的反对者的人质还是扣留反对者的夫人之间选择,那就扣留反对者的夫人。”而且,
这些规则指出,当程序员用这种方式来表达知识时,这个规则就自动获得了认知的某种
绝妙的灵活性。根据条件采取行动的规则,即“如果情况是这样的,那就采取那种办
法”,意味着这样的系统不在一个固定的系列,比如FORTRAN或PASCAL的某些子程序中
运行。一条特定的规则只有在它的条件被满足后才会被激活,这样,它的反应对它所对
应的情况而言就是恰如其分的。确实,当一条规则被激活后,它很可能会引起全部规则
的连锁反应:“如果情况是A,就采取B措施”、“如果情况是B,就采取C措施”、“如
果情况是C,就采取D措施”,等等。大体上说,整个新的程序随着这一系列的连锁反应
而产生,并会按照所提出的问题给出完善的答案,与让人兴奋的游戏式的盲目而僵硬的
计算机行为相比,这才真的是智能系统所需要的机制。
另外,基于规则的系统对大脑的神经分布来说具有很大的意义。比如说,一条规则
就相当于计算机中赫伯式的细胞集合之一。他说:“用赫伯的理论来看,一个细胞集合
就是一个简单的声明:如果事件如此这般地发生,那么我就会被高速激发一阵子。”规
则的相互作用,伴随着一条规则激活后引起的对其他规则的整个连动,就像神经稠密相
关联的大脑的一个自然结果。“赫伯的每一个细胞集合都包含了大约一千个到一万个神
经元。”荷兰德说。“每一个神经元又有一千到一万个与其它神经元相连的突触。所以
每一个细胞集合就与其它许多细胞集合相互关联。”大体上说,激活一个细胞集合,就
等于在某种内部布告栏上张贴了一个布告,就会被大脑中大多数、或所有其他细胞集合
看到。“细胞集合295834108现在正在行动!”当这个布告一出现,那些与这个细胞集
合有适当关联的细胞集合就会被激发起来,并把自己的布告贴到布告栏上,这就引起了
不断重复的循环。
荷兰德说,纽威尔-西蒙式的基于规则的系统的内部组织与这个布告栏的比喻非常
接近。这个系统的内部数据结构就相当于这种布告栏,其中包含了一系列数字布告。然
后还有大量的规则,也就是计算机把上百、甚至上千的数字编码成自身的部分。当整个
系统处于运作状态时,每一条规则都经常扫描布告栏,搜寻符合自己“如果”条件的布
告。每当其中一条规则发现了符合自己条件的布告,它立刻就会张贴一条数据信息,来
续接“则”这部分。
荷兰德说:“假如把这个系统当作某种办公室,布告栏上有必须今天处理的备忘录,
每一条规则相当于办公室里的一张办公桌,负有处理某种特定的布告的责任。每一天开
始的时候,每一个办公桌都将自己负责处理的备忘录集中起来。到一天结束的时候,每
一张办公桌都将处理结果的备忘录再张贴到布告栏上。”当然,到了第二天早上又开始
重复这个循环。另外,有些备忘录是被探测器张贴上去的,以使这个系统保持与外界正
在发生的事件的联系。还有一些备忘录也许是被激活的效应器,也就是使系统能够影响
外部世界的子系统。荷兰德说,探测器和效应器相当于眼睛和肌肉的计算机机制。所以,
从原则上说,一个基于规则的系统很容易就能从它的环境中获得反馈,这是它最首要的
要求之一。
所以荷兰德就把这个相似的布告栏比喻用于他的适应性作用者的设计之中,但同时
他又在细节设计上返回到对传统观念的反抗。
比如,从标准的纽威尔-西蒙的角度来说,张贴在布告栏上的规则和备忘录都应该
用“鸟类”或“黄色”这样的符号性语言来编写,这样做是因为我们特意要使之接近于
人类头脑中的概念。对人工智能领域里的绝大多数人来说,用这样的象征来代表人类头
脑中的概念,其正确性已毋庸争论,这是几十年来的金科玉律,纽威尔和西蒙是这派观
点的最雄辩的代表人物。而且,这也确实抓住了我们的头脑进行实际思考的很大特点。
计算机中的象征可以被结合到繁冗的数据结构中,来表现复杂的情况,就像概念是与心
理学家头脑中的各种模式相联系的,是从中产生的一样。反过来,这些数据结构也能够
被程序用来与推理和问题解决这类的大脑活动竞争,就像我们头脑中模拟的类型会在思
考的过程中被重建和改变一样。确实,如果你和许多研究人员一样,从字面上去理解纽
威尔-西蒙的观点,你就会看到,这种符号处理就是思考。
但荷兰德就是不买帐。他说:“符号处理是一个很好的开端,而且确实在理解有意
识的思想过程上前进了一大步。”但就符号本身而言却太呆板了,遗留下的内容也太多
了。一个包含B-I-R-D(鸟的英文拼写)数据的每个字母怎么能够真正抓住所有微妙
而游移不定的细微差别呢?如果这些字母与外部世界的真正鸟类无法沟通的话,对这个
程序来说又怎么能具有任何真正的含义?就算撇开这个问题不谈,首先这些符号概念从
何而来?它们是如何进化和发展的?又是如何通过外界的反馈而形成的?
对荷兰德来说,这正是人工智能的主流方向缺乏对学习问题的研究兴趣所导致的缺
憾。“我们陷入的困境,与我们在不懂物种如何进化之前就对物种进行分类时所陷入的
困境是同样的。”荷兰德说。“你可以从这类相似的系统中学到不少东西,但最终,这
条道路是走不远的。”他仍然坚信,必须从赫伯的角度来理解概念:涌现的结构是从某
种更深层的、不断在环境反馈中调整的神经基质中发展而来的。正如云彩形成于水蒸气
的物理和化学变化,概念是模糊的、游移不定的、具有动力的。它们经常在重组和改变
形状。“在理解复杂的适应性系统上,最关键的是要弄清楚层次是怎么出现的?”他说,
“如果你忽略了下一个层次的规律,你就永远不可能理解这个层次的问题。”
为了使他的适应性作用者抓住涌现这个概念,荷兰德决定,他的规则和布告不用具
有特别意义的符号手段来编写。它们将就是一排排1和0的二进制的任意序列。一个布告
也许就是像10010100这样的序列,与他的基因算法中的染色体很类似。而一条规则,用
英文来说,也许就像:“如果布告栏上有一个布告是1###0#00的话,其中#表示
‘无所谓’,那就贴上01110101这个布告。”
这种表示法很不符合常规,荷兰德只得给他的这些规则取一个新名称,“分类器”,
因为它们的办法是根据布告的特殊类型来分别不同的布告。他认为这个抽象的表示法至
关重要。因为他看到太多人工智能研究人员自己愚弄自己,假装他们基于符号的程序
“知道”。在他的分类器系统中,布告的意义必须来自于它导致一条分类器规则激活了
另一条分类器规则这种方式,或它具有意义是因为它的某一部分是直接被探测真实世界
的感应器所编写的。概念和头脑中的模型就会作为自我支持的一群分类器涌现出来,它
们应该能够像自动催化组那样自组和自我重组。
同时,荷兰德还从基于规则的系统的中央控制的常规概念中找出了例外。根据常识,
基于规则的系统过于灵活了,所以不得不设计某种形式的中央控制来避免无政府状态。
因为有成百上千条规则在争看充斥着布告的布告栏,所以总会有好几条规则突然蹿起来,
相互争执谁来张贴下一条布告。假设认为,不可能所有的规则都张贴下一条布告,因为
它们的布告可能完全不能连贯一致(“扣留人质”或“扣留其妻”),或者它们的布告
也许会引起完全不同的规则瀑布,这样就会导致整个系统完全不同的表现。所以,为了
防止计算机的精神分裂症,大多数系统都实行了繁冗的“争议解决”战略,以保障每次
只有一条规则能采取行动。
但荷兰德却认为,这种自上而来的争议解决法恰恰是错误之所在。难道这个世界是
如此简单、如此可以预测,以致于你总是能够在事先就知道什么是最好的规则吗?几乎
不可能。而如果这个系统被事先告知如何行动,那将之称为人工智能就是一个骗局:这
样的智能并不在程序之中,而是在程序员的脑子里。不,荷兰德要的是,让控制由学习
而来。他要控制从最底层涌现而出,就像大脑的神经基质中的涌现一样。让连续一贯性
见鬼去吧。如果两个分类器规则相互意见不能统一,那就让它们在自己的表现的基础上
去竞争出一个结果来,这个结果就是被证实了的对完成任务的贡献,而不是有一个软件
设计人员事先编好的程序的选择。
“与主流人工智能研究正相反,我认为竞争比连贯一致性更为本质。”连贯一致性
是个幻想,因为在一个复杂的世界里,经验的连贯一致性是没有保障的。但对于与自己
所处的环境玩游戏的作用者来说,竞争是永恒的。“另外,除了经济学和生物学对竞争
有所研究之外,我们还没有提炼出何为竞争之主要特质来。”对于竞争的丰富多采性,
我们只刚刚开始认识。想一想神奇的竞争能够产生出合作的巨大推动力,某些作用者为
获得相互支持而自发结为联盟,相互形成象征性的关系。这种情形发生在所有复杂的适
应性系统的每一个层次,从生物、经济到政治。“竞争和合作看上去也许是对立面,但
在某种深层次上,它们是相同事物的两个方面。”
为实现竞争的机制,荷兰德决定把张贴布告变成某种拍卖活动。他的基本想法是,
不要把分类器当作是计算机指令,而当作对在特定情况下张贴什么布告最好的假设和推
测。通过每一条假设的数值来衡量其道理和力量,这样就有了一个叫价的基础。在荷兰
德的布告张贴观念中,每一个循环开始时就像以往一样,所有的分类器都在扫描布告栏,
寻找与自己相关的布告。它们就像以往一样,一发现与自己相关的分类器会站起来,准
备张贴自己的布告。但与以往立即张贴自己的布告不同的是,每一个分类器都会先量力
叫价。一个对“明天太阳会从东边升起来”的经验确信不疑的分类器也许出价一千,而
一个确信“猫王还活着,晚上出现在华拉华拉汽车旅店6号”的分类器也许出价一。然
后这个系统就会收集所有的出价,用抽彩给奖法选择一组赢家,叫价最高的最有可能赢。
中选的分类器就会张贴它们的布告,就这样循环往复。
复杂吗?荷兰德不予否认。而且,这种拍卖就是以任意可信值取代任意争议解决战
略。但现在让我们假设这个系统能够从这些可信值中吸取经验,那么这种拍卖就会排除
中央仲裁人,从而让荷兰德获得他正想要的东西。并不是每一个分类器都能够赢:布告
栏非常大,但却并非无限大。也并不是跑得最快的就一定能赢。如果时来运转的话,即
使“猫王还活着”也能得到张贴自己的布告的机会。但一般来说,总是那些最强健的和
可信值最高的假设获得系统表现的控制权,而那些离谱的假设时不时出现只增加了这个
系统的一点儿自发性。而且如果有一些假设相互矛盾,那也不应该成为危机,而应该是
一个机会,一个让系统决定谁的可信度更大,从而吸取经验的机会。
所以,我们又返回到学习这个问题上来了:分类器怎么来证明自己的价值,又怎么
为自己获取可信值呢?
对荷兰德来说,最显在的答案就是采用一种赫伯式的强化作用。每当一个作用者做
对了什么事,从环境中得到了一个正反馈,它就应该强化那些与此相关的分类器。而每
当它做错了什么事,它就同样应该削弱相关的分类器。无论采取强化的方法,还是采取
削弱的方法,它同时应该不去理会那些不相干的分类器。
当然,关键是要弄明白这些分类器所起的作用。作用者不能奖赏那些在颁奖的时候
正巧表现活跃的分类器。那就会像把得分的一切功劳都归于那个凑巧带球冲过底线的队
员,而对操纵全局、把球传给他的四分卫,对拦截了对方进攻、为他开路的前锋,或任
何替他传球的队员的功劳一笔勾销了。这也像把赢得一盘国际象棋的全部功劳都归于将
住了对手的国王的最后一步棋,而无视为获得全局胜利而布局中的许多关键的棋步。但
还有其它替代办法吗?如果作用者为了奖赏正确的分类器而必须预期回报,在没有被编
入程序的情况下立该怎么做呢?在事先一无所知的情况下,作用者如何得知这些布局的
价值呢?
这确实是一个问题。不幸的是,赫伯式的强化作用是一个过于广泛的一般性概念,
无法提供解答。荷兰德感到非常困惑,一直到有一天他偶然回想起他在麻省理工学院上
的基本经济学课程,那是著名的经济学教科书撰写人保尔·塞缪尔森上的课,他才意识
到他几乎已经解决了这个问题。他的布告栏前的拍卖已经为他在系统中建立了某种市场
机制,通过允许分类器量力叫价的办法,他已经创造出了通货。所以,为什么不采取下
一步行动?为什么不创造一个完整的自由市场经济,让强化能够在利益驱动下发生作用
呢?
确实,为什么不呢?当他终于看到了这一点,就发现这与经济非常相似。荷兰德认
识到,如果把张贴在布告栏上的布告当作是上市叫卖的货物和市场上提供的服务,那么
就能把分类器想成是生产这些产品和提供这些服务的公司和厂家。当一个分类器看到有
一个布告满足了它的“如果条件”,它就会叫一个价,那么就可以把它想成是一个正在
求购生产所需供应的厂家。为使这一相似性更加完善,他要做的是,必须要使每一个分
类器对自己消耗的供应付出报酬。他决定,当一个分类器赢得了张贴自己的布告的权力,
它就得将自己的一部分力量转给供应商,也就是那些触发其张贴布告的分类器。在这个
过程中,这些分类器就会被削弱。但在下一轮拍卖中,一旦它的布告上市,它会有重新
聚集力量的机会,甚至能够获利。
但这些财富究竟是从何而来的呢?当然是从最终消费者而来的:环境就是系统的所
有报偿之源。荷兰德认