思维科学探索-第33章
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
另一符号; 删
误差,在链的两个相连符号之间插入一个新的符号。于是用这
三种误差的数目,或者这三种误差加数后的和来作为两条链
之间的距离度量。这充分体现出句法的结构作用。最初乔姆
斯基在建立语言的生成模型时,由于研究的对象是英语。根
据短语结构语言这一模型来生成英语句子,必须经过一个极
其复杂而又繁琐的过程,为了使生成能力比较强,乔姆斯基
)转换部分;
提出转换生成文法模型。早期的转换生成文法包括三部分:
短语结构部分; 语素音位部分。转换
运算方式主要有五种( 置换:
。(
(复写):
代换:
。在句法模式识别中,模式的结构不象英语句子的结构
那样复杂,对于一条标准模式链所可能发生的畸变,只要考
虑上述五种运算中的后三种即可。用代换、删除、插入三种
误差的数目作为距离度量称为列维施坦距离,至于求二条链
之间的列维施坦距离可以用动态规划方法来解决,在此基础
上可以用误差校正句法分析来解决模式类有部分重叠的问
题。这部分内容过于专门这里就不介绍了。
六、词意句法方法 模式识别中的统计方法和句法
方法各有优点和弱点,前者不能描述复杂模式的结构以及
子模式与子模式之间的关系,后者在利用数值信息方面又往
往无为力。如何把两者有机地结合起来就是一个值得研究
的课题。这个新方向中主要就是利用词意信息。这一点与认知
心理方面的实验结果相吻合,人的视觉信息如何存储到长时
记忆中去是心理学上比较困难而又谜惑不解的问题,例如一
个方形存在我们的记忆中,也许在我们脑中实际有的不是那
~
第 316 页
是产
中
? ?
其中每个是终止符和非终止符组成的
链。对于每个定义它的属性
的属性用表示,那么与中的每个产生式
就有相应的词意关系式
) , 这个关系组成词意部分, 此外词意部分还
个方形的形状,而是一些节点和链(实际上也可能不是这
样,只是想象而已)。同样,如果一个东西的意义存储在脑
话彼此之间的关系
中,肯定说,它不是几个字或一句话存进去,可能是一句
又如中文, 存在我们脑中的不
是一个个的汉字,而是与这些汉字有关的意义。总之除了构
成句子的句法这个重要的因素外,对于记忆与认识说来句子
所包含的意义可以说也是非常重要的。在模式识别方面句法
方法有其局限性,需要加入词意。最近几年来的研究取得了
进展,在一般短语结构文法的基础上加入词意信息扩大为属
一词意、句法方法〔
性文法。用属性文法把句法方法和统计方法统一起来取长补
短成为一种新的方法〕。现在的研
究结果已经为建立词意、句法模式识别迈出了一大步。
性文法(
是非终止符有限集,
是一般文法的扩
是终止符有限集,
都定义相应的词意是起始符,
生式集。产生式的形式包括两部分:句法部分和词意部分。
句法部分是短语结构文法中的上下文无关文法形式,即:
包括与之间的连接关系, 用下面符号表示
?
一个
大。其中
的每个符号
其中表示运算符号表示相应的词意。由于文法是上下文
, 、
( ) = ), =
第 317 页
。统计模式识别是只考虑词意部分的特殊情
。
无关的,每产生一条链,就有相应的树状表示(导出树),
树从叶到根往上计算,就可以得到与这条链的起始符相对应
的属性,也就是描述模式的链的词意。这种词意可以是确定
的也可以是随机的。
属性文法的重要性质之一是在句法部分和词意部分两
者之间可以有一个折衷关系,即如果使词意部分变得复杂
杂一点,那么就可以使句法部分变得简单一些,反之亦然。
实际上句法模式识别和统计模式识别可以看成是属性文法
的两种特殊情
,而不考虑句法, 的属性
维特征向量
况,把整个模式当做一个单元
是一个
至于句法方法就是只考虑句法而忽略了词意。用词意、句
法方法是自然而又合理的,根据句法和词意能够折衷,将
会使问题变得简单。这里我们用一个例子来加以说明。前者
提到克尔希产生一个等边直角三角形用的是上下文敏感的文
法。描述一类边长分别为
({
的直角三角形{
必须用下述上下文敏感文法
属性文法,那么同样一类图形,用下列描述
对上述文法进行句法分析是比较困难的。如果采用
, , 其中分别表示线段
,{ },
第 318 页
这里是一个参数,是正整数
可以看出文法的形式是很简单的有限状态形式。这就大大有
利于进行句法分析,实际上可以定义包含词意信息的距离度
量,然后用最小距离准则来进行模式识别。
七、结束语 模式识别作为一门技术科学它的发展经厉
了统计模式识别、句法模式识别及词意句法模式识别三个阶
段,这也反映了人们对它的认识由浅入深的过程。它有关的工
程技术是人工智能技术,计算机模拟技术⑤,而它的基础是形
象思维学。词意句法模式识别一方面起到了把科学语言学与
模式识别沟通的作用,另一方面又把统计模式识别和句法模
式识别有机地统一起来。可以承认词意句法方法在某种程度
上体现了人识别模式的一些特点,但目前还未达到成熟的阶
段,从词意句法模式识别上升到形象思维学就更有一大段距
第 319 页
《模式识别原理及
离要走。随着词意句法模式识别的进一步完善与发展将会有
助于用计算机来建立人脑信息加工的模型,为探讨人脑的奥
秘与思维的规律作出贡献。
参 考 文献
钱学森: (
钱学森:
傅京孙(戴汝为、胡启坯译)
《哲学研究》
《自然杂志》
哈里斯: 自然杂志》,
戚两村,徐振远:《自然杂志》,
会科学出版社,
乔姆斯基,(邢公畹等译):《句法结构》,社
西蒙: 心理科学通讯》,
其应用》,科学出版社,
第 320 页
思维系统的开放特性
收后新的知识结构,则〕=
何 吉成
(山西省科学技术委员会
以期获得对思维
世界是过程的集合体。自然和社会是过程的集合,思维
同样也是过程的集合。本文试图以模糊集合和耗散结构理论
的基本思想为借鉴,探讨思维过程的机制,
过程更深层次的认识,进而探索提高思维效率的有效途径。
思维系统是由人的感觉器官、思维器官构成的实现激励
和创造的有机整体。系统特性的描述和量度称之为状态。人
的思维状态可以用诸如记忆能力、反应速度、创造能力、知
识结构的有序度、知识结构的惯性和思维势的大小等一组描
述思维特性的量来描述。
系统状态的变化即是过程。思维系统状态的变化,首先
表现在思维者知识结构的变化。让我们以英国著名图书情报
学家布鲁克斯引入的信息与思维者知识结构的函数关
系为基础来深入描述知识结构的变化。
按照布鲁克斯的观点,如果用
〕表示原有的知识结构,
表示思维系统的信息输
入, 〕表示信息吸
〔〕表示了信
第 321 页
,思维主体的知识结构依次,
〕,则将
息元与知识结构的作用。如果在一个思维过程中,思维系统
依次获得的信息是
由〕变为〕, 〕,
上式求和可得
就描述了一个完整的思维过程。从思维机制上来认识上式的
意义,信息加信息决不等于更多的信息。而是信息加信息等
于更有序的信息,使思维主体知识结构有序性地进化。知识结
构有序性地进化,使用于思维的信息产生重组效应,不断产
生思维势的激励。创造性思维中常有灵机一动和恍然大悟的
情景,往往是信息输入和重组引起思维势突发性变化的结果。
因此,信息有序化的连锁反应是思维过程的实质表述。
从上述的分析可知,思维系统与环境之间存在着大量的
交换,因而它是一个开放系统。同时,由于思维过程中,信
息的输入及其有序化,思维系统可以成为一个耗散结构,熵
是系统无序程度的度测。思维系统的思维熵可以描述思维系
统的有序化程度。思维熵的变化就是思维势的度测。按照耗
散结构的理论,思维熵的变化可以分解为两部分:一部分称之
为思维产生,记作
另一部分称
,它描述思维过程中由于杂乱信息输
入和思维主体知识结构的惯性引起的思维紊乱
之为思维负熵流,它描述思维系统与外界进行有序的信息交
换,有序的信息使思维主体知识结构产生二次有序化的程
度,它记作。思维过程中思维熵总的变化为:
要提高思维效率和思维能力必须使
第 322 页
思维过程的不确定性
由上式可知必须使> ,即要求环境向思维系
统输入足够的负熵流。输入的负熵流中除包括维持思维器官
(如大脑)活动的物质和能量之外,提高输入信息的有序度
是增加负熵流绝对值的最有效手段。
二是事物本身发生是确定的,人们对事物的认识
自然和社会现象中存在着的不确定性,通常包括两个方
面:一是事物本身按照某种概率发生时所具有的不确定性,
即随机性
是不确定的,这种由于认识主体方面所产生的不确定性,通
常称为模糊性。思维过程包含着随机性和模糊性两方面的不
确定性。让我们利用思维过程与通讯过程的相似性把思维过
程划分为与通讯过程相似的滤波和功率放大两个阶段来分
析。
思维过程的第一个阶段发生在思维系统与环境之间,在
这个阶段中,思维系统的感觉器官要从环境中输入大量的信
息,并且要根据已有的经验以一定的方式和规则,在相关的
限度内选择和组合所收集的信息,以便有效地产生激励,从而
使思维势产生跃迁,思维势跃迁的表象是思维主体知识结构
的变化导致的新知识和新信息的产生。这有点相似于通讯中
对信号的平滑滤波,即信息信号与噪声信号的分离。与信息
比相似,思维过程第一阶段的效率可以用思维系统的信息选
择性来描述。
思维过程的第二个阶段类似于通讯过程中的功率放大。
识结构状态发生从
经思维系统滤波后的信息与原有的知识结构产生作用,使知
的变化,从而使思维系统的思维
~
第 323 页
思维过程的数学表述
势发生从
姆士认为,人类的思维活动是一种斩不
的跃迁。思维势之差是思维主体创造力的表
述。如果我们引入时间的因素,完成相同数量级思维势跃迁
所需时间较短者,可认为其有较大的思维强度。思维效率则
应以使用最少的信息而使思维势产生最大的变化来描述。从
这个意义上讲,它与通讯中的功率放大有很大的相似性。美
国心理学家威廉
流”,断的而不是片断的衔接。信息的作用是“部分地”
“渐渐地”完成的,思维主体的知识结构的变化,除极少量的
突发性变化之外,大部分也是“部分地”“渐渐地”完成的。
而且每一项信息的语义内容与思维主体之间的关系并不象经
典集合中那种非此即彼的关系,而是一种模糊关系。思维过程
是凭借着模糊信息作出“准确的”或“部分准确的”判断的
过程。在此过程中,随着系统的思维熵变小,思维主体知识
结构状态变化与思维目标之间的不确定性“尽可能地”被消
除。思维过程不同于一般机器对机器的机械识别。两者本质
的区别是:在机器对信息的识别中,信息的表述必须是确定
的,识别结果的表述必须是确定的;但是在思维过程中,信
息可以是模糊的信息,对知识状态变化的判断也可以是模糊
的。现实世界中用于思维的信息大都与思维主体的知识结构
具有相似性,而不是相等性。因而以模糊信息为基础的学习模
型在思维科学中的应用是一个十分引人入胜的课题。
思维过程的自然语言描述具有一定程度的局限性。为了
形象而直观地研究思维过程,我们应赋于其以数学化的内
容。
第 324 页
表示与
表示
元向量可表示思维主体知识结构的状态是一个
有机的整体。知识元之间也存在着模糊相关关系。设
为知识对其本身影响程度的加权因子, 表示对
对影
影响的加权因子,
我们先来定量描述思维主体的知识结构。思维主体的知
识结构是由不同学科门类的知识以不同的比例组合而成的。
设为组成某一知识结构的知识元, 知识
元在与之有相似点的信息作用下可发生动态变化。则一个
影响的加权因子?余类推表示的加权因子。
对
与相似的语义信息影响的加权因子??
相似的语义信息影响的加权因子,则
相似模糊的语义信息
对
表示与对
的状态变化可表示为:
同理
?
。
程
将上述个等式写成矩状的形式则可得知识结构的状态方
。
第 325 页
表示思维主体的知识结构,
表示思维信息向量,它对知识结构的变化产
、
生作用。
为知识结构矩阵,它表示
知识结构中各知识元之间的内部联系。
写成向量的形式
其中
向量
为信息矩阵,表示信息与
知识结构之间的关系及信息结构状态对知识结构状态作用的
强度。
~
第 326 页
我来描述思维势。思维势是思维能力的描述,它与知
识结构有序程度的变化有关。如果我们用
变化到
表示思维势,则
当思维主体知识结构从时,思维势对应从变
到。思维势增加的宏观表述是与有关的,
新的信息的产生,从而产生动作与激励。则我们可得到:
上式称之为思维反应方程。为思维反应矩阵,它表示知识
结构有序性变化对思维势影响的强度。
综上所述,思维过程的方程可表述为:
(知识结构状态变化方程)
(思维反应方程)
(初始条件)
、
都应是模糊矩阵矩阵中的元素都应是统计推断与综合评
思维过程具有不确定性,因而它为一模糊过程,
判的结果。
第 327 页
提高思维效率的途径
理论研究的目的在于指导实践,思维过程定量化研究要
以认识思维机制并利用其提高思维效率为目标。从思维过程
的方程式中我们可以看出,知识结构及其有序性是思维跃递
的基础,增加知识元之间的相关性是提高知识有序性的途径
之一。因此,在当前科学技术飞速发展,学科间横向关系愈
来愈密切的情况下,不论是自然科学工作者还是社会科学
工作者,一定要顺应发展重建和更新自己的知识结构,特别
是自然科学工作者要增加社会的知识元,社会科学工作者要
增加自然科学技术的知识元,那对提高思维效率是十分重要
的。
在思维过程中,知识结构发生变异,知识结构有序度的
提高是和作为思维基础的信息流的有序性有关的。然而信息
的自发产生和分布是杂乱无序的,这就给信息的有效利用造
成了困难。解决这种困难的途径是各种信息系统对信息施加
的空间有序一一分类,和时间有序一一分级。经过分级分类预
处理的信息由于其有序性的提高,会使思维主体对信息利用
成倍提高。那就要求思维主体掌握经过预处理的二次信息的
规范化的著录和编排方式,学会使用各种信息检索工具,各种
思维工具的有效运用,将会成倍地提高思维效率。
第 328 页