数字化生存-第14章
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
起来,在词组或句子的层次上,加上整体的节奏和语气,是非常困难的事情。然而这样
做非常重要,不仅能让电脑说的话好听,而且还能根据说话的内容和意图表现出不同的
色彩、表情和语调。否则,电脑发出来的声音就好像醉酒的瑞典人在喃喃自语一样单调
得让人倒胃口。
我们现在开始看到(听到)有些系统正把语音合成和声音存储两种方式结合在一起,
随着数字化越来越普遍,最终的解决方案将是两者合一。小型化的趋势
在下一个千年里,我们会发现我们和机器说的话,与我们和人类说的话一样多,或
甚至比跟人类说的话还要多。和没有生命的物体说话时,人们最感困扰的似乎是自我意
识问题。我们跟狗和金丝雀讲话的时候,觉得非常自在,但是和门把手或灯柱说话,就
会觉得怪怪的(除非你烂醉如泥)。难道我和烤箱说话的时候会不觉得傻乎乎吗?大概
跟对着电话应答机讲话半斤八两吧。
小型化(miniaturization)的趋势将使今天的语音输入比过去更遍及于每一个角落。
电脑正变得越来越小,昨天还占据了整个房间的电脑设备,今天已出现在你的桌面上,
明天你更可以把袖珍型电脑戴在手腕上。
许多桌上型电脑用户都不能充分认识过去10年来电脑体积的缩小幅度,原因是电脑
体积的变化包含不同的方面,例如键盘的尺寸仍然尽可能保持不变,而显示器反而变大
了。因此,今天桌上型电脑的整体大小仍和15年前的苹果型机不相上下。
如果你已有很长时间未曾使用调制解调器,调制解调器大小的变化更足以说明真正
的变化有多大。不到15年以前,一个速率1200波特的调制解调器(价格约1000美元)几
乎像一个侧躺的烤箱一样大。当时,速率9600波特的调制解调器就像一个放在架子上的
大铁笼子一样。然而到了今天,你可以在一块智能卡上找到速率为19200波特的调制解调
器。即使已经把调制解调器做成倍用卡般大小,我们仍然有许多空间没有好好利用,现
在的设计有相当部分纯粹是为了外型的缘故(为了填满插口,或是大得让我们能握住,
而不会随便弄丢)。我们所以没有把像调制解调器这样的东西装在“大头针头”上,主
要不是技术上的原因,而是因为我们很容易把大头针随手乱放,再找起来很困难。
一旦挣脱了手指张开幅度的束缚(手指张开的幅度决定了一个舒适合用的键盘的形
状和大小),电脑的大小就会更多地受到衣兜、钱夹、手表、圆珠笔和其他类似物品的
体积的影响。在这种种形式中,信用卡很接近我们想要的最小尺寸,显示器很小,因此
图形用户界面变得没有多少意义了。
笔形的系统很可能被视为笨拙的过渡期工具,既太大,又太小。按钮式的设计也不
理想。看看你的电视机和录像机遥控器,你就会明白按钮的局限所在:按钮式装置完全
是为手指纤细、眼力极佳的年轻人设计的。
由于以上种种原因,小型化的趋势必然会推动语音制造和语音识别技术的提高,并
促使语音识别成为附在小型物体上的电脑的占支配地位的人机界面。实际的语音识别系
统不需要一定装在袖扣和表链中。小型装备可以通过通信而提供帮助。关键在于,小型
化了以后,就必须靠声音驱动。打电话,传心曲
很多年以前,霍尔马克卡片公司(Hallmarkcards)开发部的主任告诉我,他们公司
主要的竞争对手是AT&T。“打电话,传心曲”的广告词说的是,透过声音,传达感情。
声音的渠道不仅传递了信号,同时也传递了所有伴之而来的理解、深思、同情或宽容。
我们会说,某人“听上去”很诚实,这个论点“听起来”不怎么可靠,或某件事“听起
来”不像那么回事。声音中潜藏了能唤起感觉的信息。
同“打电话、传心曲”一样,我们会发现我们也将能通过声音把我们的希望传达给
机器。有些人会表现得像教官一样未教导他们的电脑,另一些人则会用理性的声音。说
话和授权密不可分。你会不会对七个小矮人发号施令呢?
有可能的。20年后,你可能对着桌上一群八英寸高的全息式助理说话。这种预想一
点也不牵强。可以肯定的是,声音将会成为你和你的界面代理人之间最主要的沟通渠道。
北极星书库|| ebook007/ 6、少就是多老练的英国管家
1980年12月,魏思纳和我在鹿内信隆(《产经新闻》、富士电视台前会长)可爱的
乡间别墅作客。别墅位于日本的箱根地区,离富士山不远。我们深信,参与媒体实验室
的创建将使鹿内先生的报纸和电视传媒王国获益良多,因此他会乐于资助媒体实验室的
创办。我们更进而相信,鹿内先生个人对现代艺术的兴趣,将和我们试图融合科技与艺
术表现、把新发明与对新媒体的创造性应用结合在一起的梦想不谋而合。
晚餐前,我们一边散步,一边欣赏鹿内先生著名的户外艺术收藏,这里在白天是箱
根露天美术馆。当我们与鹿内夫妇一起共进晚餐时,鹿内先生的私人男秘书也在一旁陪
同。鹿内先生对英文一窍不通,他的秘书却能说一口漂亮的英语,在我们的沟通中担任
重要的角色。魏思纳先打开话头,说他对卡尔德的作品很有兴趣,然后介绍了麻省理工
学院和他自己与这位大艺术家的渊源。秘书听完整个故事后,再从头到尾用日文翻译一
遍,鹿内先生仔细聆听。最后,鹿内先生沉吟片刻,然后抬起头来,看着我们,好像幕
府将军一样发出“喔——”的声音。
秘书于是翻译道:“鹿内先生说,他也很欣赏卡尔德的作品,他最近买到的作品是
在……”且慢,鹿内先生说过这些话吗?
整个晚餐中,这样的情形一再出现。魏思纳先说几句话,秘书把它全部译成日文,
鹿内先生的回答差不多都是千篇一律的“喔喔——”,但秘书却有办法译出一大堆解释
来。那天晚上,我告诉我自己,假如我要制造一部个人电脑,它一定要跟鹿内先生的秘
书一样能干。它必须具有能细致入微地了解我和我身边环境的功能,能够自动引申或压
缩信号,因此大多数场合,我反而成为多余的了。
关于人机界面,我所能想到的最好的比喻就是老练的英国管家。这位“代理人”能
接电话,识别来话人,在适当的时候才来打扰你,甚至能替你编造善意的谎言。这位代
理人在掌握时间上是一把好手,善于把时机拿捏得恰到好处,而且懂得尊重你的癖好。
认识这位管家的人比一位全然的生客多占了许多便宜。这真是不错。爱因斯坦都帮不上
忙
能够享受到这种人性化代理人服务的人寥寥无几。我们平日更常见到的一种类似角
色是办公室的秘书。假如秘书很了解你和你的工作,他就能非常有效地充当你的代表。
假如有一大秘书生病了,临时工介绍所即使把爱因斯坦派来,也会于事无补。因为重要
的不在于智商,而在于彼此之间有没有共识,以及当秘书运用这种共识时,能不能为你
的最佳利益着想。
一直到最近,使电脑具备这样的功能仍是遥不可及的梦想,因此许多人并没有把这
个概念当成一回事。但是,情势瞬息万变。现在,有不少人认为这样的“界面代理人”
是可行的构想。因此,过去问者寥寥的“智能型代理人”构想现在摇身一变,成为电脑
界面设计领域最时髦的研究课题。很显然,人们希望委托电脑来执行更多的功能,不想
事事都亲自操作。
我们的构想是设计一个知识丰富的界面代理,它不仅了解事物(某件事情的流程、
某个感兴趣的领域、某种做事的方式),而且了解你和事物的关系(你的品味、倾向,
以及你有哪些熟人)。也就是说,这部电脑应该有双重特长,就像厨师、园丁和司机会
运用他们的技能来迎合你在食物、园艺和驾驶方面的品昧和需求一样。当你把这些工作
交由别人执行时,并不表明你不喜欢烹饪、园艺或开车,而是表明你可以选择在你想做
的时候做这些事情,并且,这是因为你想做,而不是不得不做。
我们和电脑之间的关系亦是如此。我实在没有兴趣在上网之后先进入一个系统,再
通过一堆通信协议,才能找到你的互联网络地址(address)。我只想把讯息传递给你。
同样地,我不希望只为了确认没有错过什么重要信息,就被迫阅读几千个电子公告牌。
我希望让我的界面代理为我代劳。
会有许多数字化管家,他们有些住在网上,有些就在你身边,还存在于组织的中央
系统和外围设备中(无论组织是大是小)。
我跟别人讲过,我有二台心爱的智能型寻呼机。它能用完美无缺的英语句子适时地
给我传递重要的信息,简直聪明极了。我的办法是,只让一个人拥有寻呼机的号码,所
有的信息都通过他来传递,只有他才知道我在哪里、哪些事情比较重要,以及我认识哪
些人(和他们的代理人)。智慧来自系统的数据转发器(headend)而不是外围,也不在
寻呼机身上。
但是,接收端也应该具有智慧。最近,一个大公司的首席执行官和他的助理来访。
这位助理带着老板的寻呼机,他会在最适当的时机,提醒老板一些急事。这位助理这种
老练的、懂得把握时机和慎谋善断的本事,将来都会设计到寻呼机的功能中。《我的日
报》
想象一下,假若电子报纸能以比特的形式传送到你的家中,假设这些比特都传送到
一个神奇的、像纸一样薄的、有弹性的、防水的、无线的、轻巧明亮的显示器上,要想
为这份报纸设计界面,可能需要借助人类多年在制作标题、设计版面上的经验、印刷上
的突破、图像处理上的经验及其他许多技术,来帮助读者浏览阅读。做得好的话,它可
能会成为一种伟大的新闻媒体;做得不好的话,就会惨不忍睹。
我们可以从另外一个角度来看一份报纸,那就是把它看成一个新闻的界面。数字化
的生活将改变新闻选择的经济模式,你不必再阅读别人心目中的新闻和别人认为值得占
据版面的消息,你的兴趣将扮演更重要的角色。过去因为顾虑大众需求而弃之不用、排
不上版面的文章,现在都能够为你所用。
想想看,未来的界面代理人可以阅读地球上每一种报纸、每一家通讯社的消息,掌
握所有广播电视的内容,然后把资料组合成个人化的摘要。这种报纸每天只制作一个独
一无二的版本。
事实上,我们在周一早上读报的方式和周日下午截然不同。在工作日里,早上7点钟
测览报纸只是过滤信息,从传送给成千上万人的共同比特中,撷取符合个人需要的部分。
大多数人对整版整版的报纸,会看也不看一眼就丢进垃圾桶,对剩下的一些版面稍作浏
览,真正细看的部分寥寥无几。
假如有家报业公司愿意让所有采编人员都照你的吩咐来编一份报纸,又会是什么情
景呢?这份报纸将综合了要闻和一些“不那么重要”的消息,这些消息可能和你认识的
人或你明天要见的人有关,或是关于你即将要去和刚刚离开的地方,也可能报道你熟悉
的公司。在这种情况下,假如你确信《波士顿环球报》能提供正好符合你需要的信息,
你可能愿意出比100页的《波士顿环球报》高得多的价钱,来买一份只有10页、但专门为
你编辑的《波士顿环球报》。你会消耗掉其中每一个比特。你可以称它为《我的日报》
(TheDailyMe)。
但是,到了星期天下午,我们希望以比较平和的心情来看报纸,了解一些我们从来
不知道自己会感兴趣的事情,玩玩填字的游戏,看看好笑的漫画,顺便找找大减价的广
告。这可以称为《我们的日报》(TheDailyus)。在一个阴雨绵绵的星期天午后,你最
不希望看到的,就是有个紧张兮兮的界面代理拼命想帮你去掉看似不相干的信息。
这并不是非黑即白的两种截然相反的状态。我们往往在这两极之间游走,我们会根
据手头有多少时间、这是一天中的哪个时刻,以及我们的心情,希望获得较少或更多的
个人化信息。设想一个报道新闻的电脑显示器上面有个旋钮,你可以像调节音量一样,
调整新闻内容个人化的高低程度。你可以有许多不同的控制钮,包括一个可以左右滑动
的钮,让你在阅读有关公共事务的报道时,可以调整报道的政治立场(偏左或偏右)。
如此一来,这些控制钮就改变了你观看新闻的视窗,视窗的大小及其表现新闻的风
格都将发生变化。在遥远的将来,界面代理将阅读、聆听、观看每则新闻的全貌。而在
不久的将来,这种过滤的过程将借助于信息标题(也就是关于比特的比特)来完成。值
得信赖的数字化亲戚
在美国,《电视导报周刊》(TVGuide)的利润居然超过所有四家电视网利润的总和。
它所代表的意义是,关于信息的信息,其价值可以高于信息本身。当我们考虑新的信息
发送方式时,我们的思维总是拘泥于“随意例览信息”和“来回转换频道”这样的观念,
这些观念现在行不通了。当我们有1000个频道的时候,假如你从一个台跳到另一个台,
每个台只停留3秒钟,你就几乎要花1个钟头的时间,才能把所有频道从头到尾扫一遍。
还没等你判断出哪个节目最有趣,节目早就播完了。
当我想出去看场电影时,我不是靠读影评来选片,而是问我弟媳的意见。我们都有
像这样的亲戚朋友,他们对电影很内行,同时也很了解我们。我们现在需要的就是一位
数字化的亲戚。
事实上,这种体现为人帮人的“代理人”观念,常把专业知识与对你的了解揉合在
一起。好的旅行代理人会将其对饭店、餐厅的了解和对你的了解结合起来(线索通常来
自于你对其他饭店和餐厅的观感)。房地产代理人会从一系列或多或少能够满足你口味
的房子中,推测出你喜欢的家居模式。现在,来想象一下电话应答代理人、新闻代理人
或电子邮件管理人吧!他们的共同点都是能够模仿你做事的方式。
这不只是填一份调查问卷或对你有一个固定把握那么简单。界面代理人也必须像人
类的朋友和助理一样,不断学习和成长。这也是说起来容易,做起来难的事情。直到最
近,我们才稍稍了解,应该如何让脑模型学习有关人的事情。
当我谈到界面代理人时,经常有人问我:“你指的是人工智能吗?”答案是“没错”。
但是这个问题中夹杂着些微的怀疑,主要是因为过去人工智能给人们许多虚无的希望和
过高的承诺。此外,很多人对机器能够拥有智慧这样的观念,仍然深感不安。
大家公认阿伦。图宁(A1anTuring)在他1950年发表的论文《计算机器与智能》中首
次认真地提出机器智能这个概念。后来,马文。明斯基等先驱继续在纯粹人工智能的研究
上进行深入的探讨。他们向自己提出许多问题,诸如如何识别文本、了解情绪、欣赏幽
默,以及从一组隐喻推出另一组隐喻。比如在0,T,T,F,F这一连串英文字母之后,根
据内在逻辑,应该接哪些字母?