首页 -> 2005年第12期

从复杂的信息流中获取真知

作者:周晓林




  我们被淹没在信息的海洋里,却因缺乏知识而挨饿。
  ——约翰·奈斯比特
  (John Naisbitt)
  
  法式油炸食品含致癌物质吗?
  据2002年瑞典的一项研究报告,淀粉类食物,比如说法式油炸食品、薯片、大米、谷类等包含丙烯酰胺的食物可能与癌症有联系。你看到这个结论以后,会从此不吃这些食物吗?如果你真的不吃,你可能会吃惊地发现,在九个月以后的后续实验中,研究者们又发现这些食物虽然包含丙烯酰胺,但是并不致癌。
  打击仍在继续:“研究发现,油炸食品DNA成分变异。”这是路透社2003年6月17日的头条新闻。在标题之下,报道解释道,丙烯酰胺产生变异,破坏了DNA。但是几个星期以后的7月5日,路透社另一头条新闻显示:“研究发现,煮熟的土豆片与癌症没有联系。”
  你还会吃土豆吗?对以上这些报道,你或许仅是读读而已。你如何筛选这么复杂的信息?
  在经过多年只吃低脂或无脂食物的痛苦之后,你会发现,最近研究表明,食物中的反式脂肪酸和不饱和脂肪酸会增加患心脏病和癌症的风险。这些发现的研究者们推荐未被加工的脂肪,比如橄榄油、黄油甚至猪油。这样的话,这么多年来你在面包上涂抹人造黄油,深受其害,又是为了什么呢?
  明天会出现什么新的研究?你如何从虚妄中区别出事实真相?你应该完全停止吃那些“危险”食物吗?你会开始抽烟吗?毕竟,总会有某个研究在某天跳出来告诉你,那些东西并不真的那么可怕。
  我们每天被各种建议、研究和信息流轰炸。你如何从中分辨出最重要的并按之行事?你如何发现那些意味着你需转变心智模式和行为的信息,剔除大量无用信息而不被其淹没?在这里,我们将探讨从复杂的信息流中获得有用信息的策略,包括一个拉近镜头看细节和拉远镜头看全局的过程。
  我们正被信息淹没着。加州大学伯克利分校的一项正在进行的研究评估发现,世界正以每年1千兆兆~2千兆兆(1千兆兆也就是1018)字节的速度制造信息。换句话说,整个星球上每一个男人、女人和儿童的人均负担大约为2.5亿字节。电子邮件以每年610亿封的速度在我们之间传送。到2000年,大约有21万亿字节的静态网页,并以每年100%的速度递增。更多的人每天都在写“blogs”—— 一种观察日常生活的在线日记,可与数百万人共享,但谁有时间把它们全部读完呢?
  理查德·沃尔曼指出,一份平日的《纽约时报》的信息量与17世纪一个普通英格兰人一辈子所接触到的几乎一样多。知识大约每十年翻一番。过去30年里产生的新信息,比过去5 000年所产生的信息总量还要多。
  如此复杂的信息洪流很快就会冲垮我们感知世界的能力极限。我们需要从复杂的信息中筛选出所需要的,以改善这种状况。
  
  什么是知识
  
  知识本身的意义在不断地变化着。我们都知道如何编纂一部百科全书。首先,你召集成千上万的、来自不同领域的顶尖专家,然后请他们介绍本领域内的专业知识。这种编纂百科全书方法的最好实例是《大不列颠百科全书》第11版(1911年出版)。这可能是最后一次以这种方式来集中全世界的知识,用出版者的话来说,这部百科全书是“人类知识的总和——包含所有人类思考过的问题、做过的事情以及达到的成就”,或者是“知识之树的一个树干剖面”。这是一个人们真正可以把知识看作一棵树,而不是被流沙包围的丛林和爬行着各种动植物的灌木丛的时代。(大约比这早十年,美国专利办公室建议国会关闭这个办公室,以节省经费,因为所有能被发明的东西都已经被发明了。)
  “人类知识的总和”由各个专业的条目积聚而成。比如,一个历史学家撰写美国大革命的相关条目,一个艺术历史学家撰写关于米开朗琪罗(Michelangelo)的条目,一个物理学家对牛顿定律作出评论。在主编的帮助下,这些作者将人类庞大的知识库集合为简练的条目,并存放到一摞书中或一张光盘里。这种方式世代沿用,将这个世界的知识以一种严谨而有效的方式整合在一起。
  但如今,出现了一种与传统大相径庭的知识组织体系——维基百科(www.wikipedia.com)。这里没有撰写条目的专家,而是完全采用一种来自民间的自发组织系统来建立知识体系。任何一个人都可以加入条目,并将此条目与其他条目链接起来。如果添加的条目正好是错的,那么某个知识更渊博的人就会加以改正。维基百科有一些基本原则,但这个系统是完全开放的。那些对条目的增添作出贡献的人,一直保持匿名状态,与他人共享知识。随着时间的流逝,众人一起编纂的这个百科全书的内容越来越丰富,越来越全面,越来越准确。而这个互联网系统内部也建立了链接。
  同样地,像Google一类的搜索引擎已经从依靠机器在网络中寻找信息,转变到通过人类专家组了解四处蔓延的网络,再到如今依靠志愿者跟踪特定领域的知识。这个“开放目录计划”(http://dmoz.org)依靠全球的志愿者建立经过人工编辑的网络目录,这些志愿者们只对某个特别的领域感兴趣。通常,商业目录网站会以低报酬聘用相关专业的职员来充实内容,应付网页不断增多的情况。而志愿者计划则有效利用了众人的热忱,能“提供一种方法让网络进行自我组织”。
  这些有关信息组织的观点迥然不同。哪一种观点更好一点呢?从一个传统的百科全书编辑的角度来看,维基百科的方法是无法想象的:你如何相信并非来自专家的信息?从维基百科的角度来看,大量的人关注信息,无疑会更快地找出并纠正错误;而且,在一个知识更新如此迅速的世界,即使顶级的专家有时也会出现偏差,历史也有可能被重写。而维基百科所采用的是最为灵活的适应变化的方法,能够反映各式各样的观点,打造一个更广阔、更丰富的知识基础。收集知识的不同方法会产生不同的结果。
  例如,在定义“community”(社区)这个词的时候,《大不列颠百科全书》第15版的解释将重点放在这个词的生物学意义上,而维基百科作为一个在线社团,对这个词进行了更为广泛的解释。解释包括好几部分:比如说“主体”和“虚拟社团”。而另一方面,维基百科对“transformation”(变换)一词下定义时,把其用作分子生物学和数学中的精确术语,而不是看作用来描述商业或人的变化的词。《大不列颠百科全书》有“insight”(洞察力)这个条目,而维基百科对此没有专门的条目。每一种百科全书都有自己的盲点,两者都没有特别关注“mental models”(心智模式)这一概念。为了公平起见,我们必须注意到,我们比较的是在线的“维基百科”和纸版印刷的“大不列颠百科全书”,所以我们应该认识到,信息的不同格式也会影响我们与之相互作用的方式。例如,在线模式更易于进行定向搜索,而印刷模式则更便于浏览。
  还有其他组织和了解知识的方法。《牛津英语字典》通过引用著作中词语的用法来记录单词含义的演化过程。(《牛津英语字典》也采用了与“维基百科”类似的开发过程,字典中的许多条目都是由志愿者提供的,其中最多产者之一是一名英国监狱里的杀人犯。)普林斯顿大学的心理学教授乔治·米勒以他对记忆过程的研究成果为基础,开发了名为“WordNet”的网络项目。比起一般的字典辞典,它列出了更多的定义,提供了更为广阔的视角。除了列出更多定义(例如“community”一词有八个定义)、同义词和反义词,WordNet也不像其他辞典一样按字母顺序排列,而是按照词的语义结构进行排序,在解释某个词时集合了该词的“上位词”或词汇所代表的属类(例如,狗是一类犬齿动物,是一类食肉动物,是一类哺乳动物,是一类动物,是一类生物)、“下位词”或词汇的具体实例(例如,杂种狗、宠物狗、哈巴狗、达尔马提亚狗、纽芬兰狗)以及“组成关系”或词汇的构成部分(如“flag”指狗的尾巴)。
  

[2]