首页 -> 2008年第7期

图书馆个性化信息检索探讨

作者:李英梅




  [摘要]本文对图书馆个性化信息检索的内涵j及特点进行了分析。对个性化信息检索的相关技术——用户建模技术、智能Agent技术和个性化推送技术等进行了讨论,并提出了个性化信息检索的功能模型。
  
  近年来,Internet发展迅速,已经覆盖了几乎全世界的各个国家,据统计,连接的网络主机已达上亿台并且以每年15~20%的速度增长。Internet是目前世界上规模最大、覆盖面最广、用户最多的信息网络,通过它人们可以方便地获取大量的信息。因特网的空前繁荣使其信息量以指数规模迅速增长,信息量急剧增大。对那些对专业信息有迫切需求的专家学者、科研人员等用户来说,如何从海量信息中迅速获得个性化信息呢?借助个性化信息检索是解决这个问题的有效方法之一。本文对个性化信息检索的内涵进行了阐述和分析,对个性化信息检索的相关技术——用户建模技术、智能Agent技术、个性化推送技术等进行了讨论,同时还提出了个性化信息检索的功能模型。
  
  (一)个性化信息检索的内涵与特点
  1.个性化信息检索的含义。个性化的含义是使事物具有个性,或使其个性凸显,有两层含义: 第一,个性需求经过培养而形成,这个过程称之为个性化个体的过程;第二,个体总是具有一定的个性,让这种个性得到了解、认可,并在一定的空间中得以体现、展示,是每个个体都有的潜在需求。这个过程称之为个体个性化的过程。
  个性化信息是能够满足用户个性需求的信息。个性化信息检索是指根据用户的兴趣和特点进行检索、返回与用户需求相关的检索结果。它是一种能体现用户个性化特征、满足个性化需求、培养个性化趋势的检索方法。在个性化检索中,检索结果与用户查询经历有关,既可以是内容检索,又可利用与其它事件的关系来检索;既是以用户检索行为为中心的检索,也是个性化检索与一般文档检索的区别。个性化检索是为用户定制的检索,检索结果切合用户的特定需求,能有效地为用户提供检索服务。
  2.个性化信息检索的特点。
  (1)个性化。这是个性化信息检索的首要特点。要进行个性化信息检索,首先要了解用户的个性特征,其次要培养不具明显个性特征的用户趋向于某个性群特征。不同个性群之间相互学习得以共享信息,即达成个性化与群体化的融合。个性化信息检索是以用户的实际需求为出发点,以用户的个性化特征为参照,以个性化手段和方式来服务,提供个性化的资源结果。
  (2)智能化。个性化检索是从人的认识能力出发的检索方法,其设计离不开人工智能技术的支持。如建立用户模型、自动收集知识及系统的学习功能等。个性化检索中智能代理技术Agent,可用于帮助用户确定所需信息。
  (3)以用户为核心。个性化信息检索从信息需求的提出到给出检索结果,完全以用户为核心。用户始终占主导地位,具有支配权和选择权。这种自主性的特点体现在个性化检索的设计上是以自然语言为接口、交互式问答、理解用户的系统。在数据库和知识库的设计上也是按用户需要而定。同时个性化信息检索是一个整体、一个系统,不能将检索过程的各个环节分散处理。它应包括了用户特征(user profile)系统、查询系统、检索定制系统、结果处理系统、反馈系统等的一个综合集成系统,并且还能与个性化资源系统进行集成和互操作。
  
  (二)个性化信息检索的相关技术
  个性化信息检索涉及多种技术的主要相关技术如下:
  1.用户建模技术。为不同的用户提供有针对性的服务,需要对用户的兴趣、习惯和历史行为等方面进行分析从而获取其个性化信息。对用户信息进行结构化描述,构建反映用户特点的需求模型,这一过程称为用户建模。用户建模是实现个性化检索服务的基础和核心。不同的用户面临着互不相同的检索问题。不加区分地给不同的用户提供相同的结果,必然满足不了用户的特定检索需求。
  为用户建模可以有效解决不同用户对相同提问信息的不同深度和广度的要求。在加入用户模型之后,传统的检索流程变更为带着用户个性需求查找的特定过程,同时反馈流程也将针对用户的意见进行,以提供更加准确的检索服务。
  建立用户模型,可以管理用户的背景信息。如教育背景、年龄层次和职称职业等信息。在查询一些跨领域信息的提问时,考虑用户背景信息,有助于更加对口地提供用户真正关心的信息。通过用户模型对用户兴趣进行描述,同时记录用户的查询行为,对用户的查询历史和兴趣进行有效管理。
  2.智能Agent技术。Agent代理是指在分布式系统中持续自主地发挥作用的计算实体。由于Agent具有独立性、主动性、协作性、移动性等特点,人们常用它解决搜索引擎中个性化检索的问题。Agent具有主动性,能够主动地根据用户的个性化模式描述从Web上检索出相应信息,能监控信息源的变化,及时报告给用户。Agent具有协作性,Agent之间可以共享和交流信息,从而使一个用户的Agent从具有相同兴趣的用户Agent那儿获得有用信息成为可能。Agent具有移动性,可以把用户的查询交给多个文档数据库,以获得最符合用户兴趣的文档。
  3.个性化推送技术。信息推送技术是指依据一定的技术标准和约定,自动从资源中选择信息,并通过一定的方式(如电子邮件)有规律地将信息传递给用户的一种技术。其实质是借助一种特殊的软件系统。该软件能够根据用户事先向系统输入的信息请求。这包括用户的个人信息档案、用户关心的信息主题、信息类型等,系统能主动地按照特定要求在网上搜索并给出与用户需求相符合的这些相关信息,再经过筛选、分类、排序,然后按照每个用户的特定要求,在适当的时候传递至用户指定的“地点”。目前,常见的推送技术主要采用两种模式:一是频道式推送技术。即将某些网页定义为浏览器中的频道,用户可以像选择电视频道那样去收看感兴趣的、通过网络播送的信息。二是邮件式推送。即用电子邮件方式主动将有关信息发布到列表中的用户。推送技术的应用打破了传统的信息获取方式,减少了用户上网搜索的工作量,将个性化的信息直接送给用户,提高了用户获取信息的效率。
  
  (三)个性化信息检索的功能结构
  个性化检索是在对用户的信息需求、兴趣爱好、检索行为和决策方式的理解基础上,针对用户的个性行为进行的检索。其目标是提供个性化检索系统。该系统由用户个性信息模块、个性学习模块、个性检索代理模块、查询模块、结果处理模块、反馈模块等构成。系统的功能结构图如下:
  
  用户个性信息模块与用户个性学习模块的功能是与用户交互,自动发现,了解和获取用户信息需求和用户检索行为、兴趣习惯、检索历史、学科领域等情况。其目标是创建用户信息需求库。
  个性检索代理模块的功能是根据用户的个性信息与当前的信息需求,给用户提供可由用户自己选择定制的检索方法,或由系统智能分析后提供检索策略。在个性检索代理模块的协助下,查询模块完成个性化查询,提交一个结果交由反馈模块处理。用户对结果进行处理,形成用户选择结果,再由反馈模块进行分析和统计。对反馈模块分析、统计的结果进行处理,根据情况调整相应数据,个性检索代理模块也做出相应调整,如此反复循环,直至用户得到满意的结果为止。
  信息检索是人类获取信息和知识的重要手段。信息检索的本质是一个匹配的过程,即用户的需求和一定的信息集合的匹配和选择的过程。个性化信息检索是在需求集合中加入了与用户个性特点密切相关的个性元素。用户模型是把握用户兴趣、习惯、历史检索行为的好的手段,是构建个性化检索模型不可缺少的元素。个性化检索技术的不断发展,必将给用户获取信息资源带来更大的便利,同时也给图书馆信息检索服务带来了新的挑战。
  
  参考文献:
  [1]丁浩,林云.Internet上的个性化信息服务[J].软件世界,2000,(3).
  [2]赵静.个性化信息检索及功能模型[J].图书与情报,2004,(1).
  [3]应晓敏等.一种面向个性化服务的无需反例集的用户建模方[J].国防科技大学学报,2002,(3).
  [4]滕跃.基于用户兴趣的个性化WEB检索[J].清华大学,2004.