当前位置: 首页 > >

数字图书馆信息集成模型研究

发布时间:

龙源期刊网 http://www.qikan.com.cn 数字图书馆信息集成模型研究 作者:张琳娜 来源:《河南图书馆学刊》2011 年第 05 期 关键词:数字图书馆;信息集成;XML;Web Services 摘 要:针对“基于用户信息服务”的数字图书馆体系结构下信息集成过程中存在的普遍问 题,本文提出一种基于 XML 和 Web Services 技术、复制集成和模式集成相结合的信息集成模 型,重点分析了该模型的结构、各组成部分的功能以及模型的运行机理,并简单说明了该模型 在数字图书馆中的应用方式。本文的研究思路对数字图书馆信息集成技术的实现有一定的借鉴 意义。 中图分类号:G250.76 文献标识码:A 文章编号:1003-1588(2011)05-0083-03 业界根据数字图书馆建设的基点、体系形式和所解决的关键任务等,将数字图书馆的发展 确定为从“基于数字化资源”向“基于集成信息服务”以及“基于用户信息服务”三个阶段[1]。数字 图书馆信息集成服务是基于用户需求,无缝集成数字图书馆资源、技术、组织、服务等要素, 使用户得到在时间和空间上一致的、动态的、面向主题的信息服务[2]。 近十年来,对信息集成服务技术的研究以某一集成目标下,特定数据资源的整合技术研究 为主。如利用 OPAC 系统提供的其他电子资源链接的接口表,存储相应的数字资源信息的 URL 链接,实现已购电子图书资源如超星、书生等与 Malines 系统的整合[3];利用开源软件 PKPHarvester2 对数字资源进行基于 OAI-PMH 协议的元数据收割,实现对提供 OAI 接口的数 据资源的整合研究[4];通过自建资源系统接口二次定制开发实现自建资源与 OPAC 系统数据 整合的研究[5]等等。这些研究成果对“基于集成信息服务”数字图书馆的发展有一定推动和示范 作用,但其立足于“基于数字化资源”建设成果本身,属于自底向上的研究方式,有一定的局限 性。本文采用自顶向下的研究思路,从“基于用户信息服务”数字图书馆的体系结构出发,针对 信息集成过程中存在的普遍问题,提出了一种信息集成模型,旨在为数字图书馆建设提供通用 的集成模型依据。 1 数字图书馆体系结构 在数字图书馆建设中,系统与资源是基础,集成是手段,“一站式”门户是平台,提供全面、 标准、个性化的信息服务则是数字图书馆建设的最终目标。因此,数字图书馆的体系结构应该 由 N 个系统与资源,一个信息集成平台加一个“一站式”门户组成,即概括为 N+1+1 的结构 (如图 1 所示)。 龙源期刊网 http://www.qikan.com.cn 系统与资源包括馆内外的各类管理系统和数字图书馆前期建设过程中形成的数字化资源。 这些系统和资源都是依据各自业务逻辑和数字化标准而建的,之间往往没有统一的接口和数据 标准。 “一站式”门户是用户访问数字图书馆的统一入口。通过门户,用户就可以获得如统一检索、 资源链接与全文获取、馆际互借、咨询与帮助,以及针对用户的个性化服务,如信息推送服 务、定题服务等。 信息集成平台为各个管理系统的集成和数字资源的融合提供一系列的整合服务,使得各系 统及资源之间能够有效地实现数据交换与共享、应用的相访以及接口的标准化开放,确保应用 的即插即用。 2 存在的问题与解决的方案 2.1 存在的问题 “基于用户信息服务”的数字图书馆是一个十分复杂的信息系统,其信息集成过程需要面对 以下问题:①分布性。数字图书馆的信息资源往往是异地分布的,存在网络传输的性能和安全 等问题。②异构性。这些信息资源通常是独立开发的,软硬件平台环境和数据格式、模式的异 构问题是集成过程需要面对的最大的问题。③自治性。信息资源和服务往往由各自组织独立维 护和管理,在被集成的同时,其内部运行不能受集成所干扰,需具备高度自治能力。④透明 性。如软硬件平台的透明,对数据存储位置、数据模型和数据语言的透明等。其与系统解决异 构性的程度和能力相关,决定了系统的功能和使用的方便程度。 2.2. 解决的方案 目前常用的信息集成方案大体可分为模式集成和数据复制两种[6]。模式集成是将信息资 源的数据视图集成为虚拟的全局模式,通过将用户在全局模式基础上提出的查询请求映射成各 信息源在本地可以执行的请求操作,从而达到集成目标。该方法的映射算法具有一定的复杂 性,对网络依赖性强,但透明度高、实时一致性好。数据复制是将各信息源数据复制到数据仓 库中,并维护整体一致性,提高信息共享利用效率的集成方法。该方法的查询访问方式简单、 集成性能高,但需负担数据仓库的创建及数据传输带来的额外代价。 2.3 XML 和 Web 服务技术 网络的迅速发展使数据信息由原来的结构数据扩展到半结构数据或者无结构数据。XML 作为半结构数据模型,能够用来描述互联网上的任何数据和实体[7]。XML 将数据、结构和格 式独立开来,XML 表示数据,DTD 或 XML Schema 规定文档结构,CCS 或 XSL 定义文件显 示格式,XSLT、XQuery 作为 XML 的转换语言、查询语言。其在数据模式描述,屏蔽数据异构 性,实现无缝集成上都有已有技术无法实现的优势。Web 服务技术构建在 XML 之上,通过使 用统一的标准(服务通信 SOAP、服务描述 WSDL 和服务发现 UDDI),封装数据、消息和行 龙源期刊网 http://www.qikan.com.cn 为,让其他的应用程序在无需考虑具体应用环境的情况下调用并得到响应。其是一种松散耦合 的集成方式,真正实现异构信息源的无缝集成。XML 和 Web 服务技术框架可以较好地适应分 布式系统的服务分散性和资源异构性等特点,非常适合用于资源整合[8]。 3 信息集成模型 针对“基于用户信息服务”数字图书馆中信息集成存在的普遍问题,结合已有方案和技术, 本文提出一种基于 XML 和 Web 服务技术、复制集成和模式集成相结合的信息集成模型 (Information Integr



友情链接: