基于数字图书馆元数据知识本体语义互操作

时间:2024-02-11 点赞:47305 浏览:94993 作者原创标记本站原创

本文关于数据及语义及信息系统方面的免费优秀学术论文范文,数据方面有关论文范文集,与基于数字图书馆元数据知识本体语义互操作相关毕业论文格式范文,对不知道怎么写数据论文范文课题研究的大学硕士、本科毕业论文开题报告范文和文献综述及职称论文的作为参考文献资料下载。

【摘 要】本文从数字图书馆元数据本体对语义互操作实现需要出发,提出了实现数字图书馆语义互操作必要性和可行性,通过对元数据知识本体、元数据映射、元数据数据的转换和语义关联进行分析和剖解,论述了元数据本体在数字图书馆语义互操作是如何实现.

【关键字】数字图书馆 元数据 本体 语义互操作

实现数字图书馆语义互操作,能够使异构信息系统之间的信息交流和共享的过程高度自动化和智能化,以提供知识交流、共享和长期保存功能和服务的图书馆,作为分布式网络环境下异构资源和服务的互操作层,具备语义互操作功能,随着用户对信息服务质量的要求不断提高,语义互操作必然成为数字图书馆的核心使命.有助于实现在不同空间、时间上的各类用户及计算机对同一元数据结构理解的一致性,实现语义结构上的互操作,从而有效的实现数字图书馆元数据本体语义互操作准确性、可靠性和可行性.

1.基于元数据知识本体语义互操作

1.1 元数据为数字图书馆提供语义基础

元数据是数字图书馆用来解决语义互操作的主要工具,一个完整规范的元数据体系,包括元数据格式、元数据应用刚要、元数据注册、元数据方案、元数据抽象模型,该体系共同作用为数字图书馆提供语义基础.

1.1.1 元数据与元数据元素

元数据是关于数据的数据.从整体上看,元数据对于信息系统来说,具有描述、定位、发现、证明、评估、检索等作用,其中元数据的描述功能是通过提取资源重用特性,并且规范的术语—元素或元素修诗词对资源的特性进行规范和描述来实现的.元数据具有描述性元数据、管理性元数据和保存性元数据能够全面描述与资源相关的各类特征和属性,包括静态特征、状态特征、管理特征以及系统实现功能过程中所要求的语义信息等.

1.1.2 元数据格式

元数据应用于不同的领域,形成了不同的格式应用最广的当然是DC、MARC、档案的EAD等这些元数据格式都不是在各个领域中长期形成的元数据元素集,如DC,因此就需要一套更为丰富的规范来控制各种元数据格式的重要和与其他领域的元数据之间的映射和转换.

1.1.3 元数据应用纲要

元数据应用纲要是由DCMI制定的一种得到共识的属性提取的组合规范,而不仅仅是元数据元素的简单集合.元数据应用纲要由来自一个或多个命名空间元素组成,元数据应用纲要虽然有助于一般性的数据模型得到重用和共享,但仅仅停留在术语层次上.

1.1.4 元数据注册

元数据注册是对元数据的定义信息、置标、映射、应用等规范进行发布、登记、管理和检索的一套机制,目的是支持开放环境元数据规范的元数据的发现、识别、调用以及在此基础上的元数据映射、挖掘和复用.

1.1.5 元数据方案

元数据应用于不同的系统,形成元数据方案,元数据方案从各个具体的方面保证元数据应用的完整性、正确性和系统性,确保元数据作为数字图书馆予以基础的功能得以实现,元数据用一定的置标方案置标,建立数据模型,从而提供了资源的微观结构和语义基础.

1.1.6 元数据抽象模型

元数据模型为元数据的形式化提供标准化的框架和数据模型.主要目的是提供一个参考模型以便对各类专门DC编码规则进行对照和转换.

1.2 元数据结构转换与语义关联

在不同的领域有不同的元数据体系,这些不同的元数据及所定义的域的个数及其属性不尽相同,从而是不同种类的元数据集之间的互不兼容,为元数据的互操作带来困难.为了解决这个问题,目前的方案是基于本体的元数据映射,将特定领域内不同结构的元数据进行转换,使领域内的元数据实现互操作.

1.2.1 数据转换

数据转换是指已生成的元数据记录一种格式转换为另一种格式.在转换过程中,最重要的问题就是将面临数据失真或丢失.如果转换过程中包含了数据值,当目标格式比源格式包含更多细节元素时,就必须将源元数据记录分录分解为更细小的单元,如从DC到MARC的转换,会导致数据失真;反之则会造成数据丢失.

1.2.2 语义关联

领域内的元数据转换后,需要将元数据与领域本体进行语义关联.基于本体的元数据语义关联就是通过将本体模型提供的提供的通用语义扩展到特定领域的元数据中,实现不同元数据之间的多对多互操作,通过对包含特定元数据的事件及其变化进行建模,将实体的整体生命周期转化为一个事件及其变化集合,通过建立事件的属性将分布在不同元数据描述中的实体信息关联起来,即通过事件在元数据描述的属性之间建立联系.语义关联之所以可以用于元数据的互操作,是因为它打破了传统元数据的存在形式,不再局限与某一模式或应用框架中,而是将元数据标准中的每一元属多用RDF三元组的方式进行描述描述,利用元素之间的关联,通过OAI协议进行整合.要想进行信息整合或是集成检索,就不必再考虑不同元数据标准之间差异,只需要将符合检索要求的RDF三元组进行集成就可获取想要的信息资源.

1.2.3 元数据体系之间映射

数据体系之间的映射一般包括语义映射和结构映射.语义映射主要针对不同的元数据描述体系,利用元数据元素对照表,实现元数据格式之间的转换.元数据映射又称元数据对照,是指两个元数据标准的元素之间直接转换,通过一对一、一对多、多对一及多对多等多种映射方式、解决语义互换及统一检索问题.

1.2.3.1 映射细粒度

细粒度是指随着元数据描述和揭示程度的不断加深,强调对数字对象具体特征的全面描述和各元素内在关系的深度揭示,而更倾向与面向具体元素级与结构级的关联.根据本体映射的粒度可以映射方法分成元素级与结构级.元素级匹配只考虑本体中独立的概念、属性或关系面不考虑它们之间的联系,概念时不会考虑它的父概念和子概念,以及其他与之相连的概念,而结构级匹配不光要考察它的单独概念,还要考虑这些概念元素之间的联系(如层次结构,语义邻居关系等).概念 之间的语义关系有多种:上位关系、部分与整体关系.这些关系可以用语义邻居来表示,以该概念之间的亲属关系.结构级映射可能是完全映射也可能是部分映射,这取决于要求的完整性和准确性. 1.2.3.2 去格式化

去格式化是与细粒度相辅相成,在对数字对象描述深入细致的要求下,元数据互操作正在经历有形式到内容的转变,即将对格式一致、兼容、转换的关注逐渐转移到元数据元素描述的可读性与规范化.

1.2.4 数据复用与集成

数据复用与集成属于元数据记录极互操作,主要发生在元数据记录生成之后,按需要将不同元数据源的这些单元组合在一起或重新应用,都将产生新的元数据记录.该方式覆盖面广,不仅涵盖各种标准、应用规范,还包括了来自不同项目的元数据记录.

2.基于知识本体形式化语言对语义互操作技术支持

目前对数字图书馆中的语义互操作技术支持有XML/DTD/Schema、RDF/Schema各种形式化语言(如OWL)及工具如(Protege)以及Web Services相关技术.

在形式化方面,XML为结构化的文档提供的句法,但却不能对这些文档的意义进行语义上的约束,XML Schema是一种对XML文档的结构进行约束的语言,它扩展了XML数据类型.RDF是一种对象及其相关关系的数据模型,为该模型提供简单的语义,而且这些数据模型能够以XML句法表示.RDF Schema是一个词表,用来描述资源的属性和类,带有这些属性和类的一般上下位关系的语义.本体是领域术语和其相互关系的规范表达,本体形式化语言将这种规范表达形式化,提供丰富的机器能读懂的语义.

2.1 知识本体形式化语言

RDF Schema可以看作是一种简单本体形式化语言,可以表示对象之间简单的关系和逻辑,主要的目的是对结构化的元数据进行编码,交换以及重用,RDF本身不对各种不同的元数据能力进行定义,支持在各个不同的元数据方案之间的互操作能力.RDF是本体形式化语言的基础.

2.2 OWL语言

OWL建立在RDF和RDF Schema的基础上,标准的OWL交换语法是RDF/XML,OWL在设计时保持与RDF和RDF Schema的最大兼容性.OWL有个体、属性和表达这三个重要的概念.

OWL语言提供三种表达能力依次增强的子语言,设计子语言的目的是用于具体的实施者和用户体.

(1)OWL Lite.支持用户是那些需要一个分类体系和简单约束功能的人.

(2)OWL DL.支持用户想获得最大表达能力完全计算能力以及确定性.

(3)OWL Full.支持用户是想获得最大的表达能力完全但不确定是否需要计算性并RDF句法上的自由的用户.

3.基于知识本体为数字图书馆提供语义互操作核心能力

3.1 知识本体

在信息系统中不同实体对象可能采用不同的元数据方案,不同的实体对象之间的关联关系非常复杂,本体能够对这些情况进行很好的规范和描述,从而为信息的组织、管理以及检索、查询提供模型和方法,并且,本体的本质就是领域知识的共享和重用,本体还能够为信息系统之间的语义互操作提供很好的工具.

3.2 异构

异构是指系统或资源在某些方面的不同,如在领域概念体系、数据结构、操作系统、数据库系统、应用系统、命名方式、元数据格式和元数据方案,系统结构模型、调用协议、用户界面等各个方面有所不同或完全不同.

3.3 语义互操作

语义互操作就是解决系统交互过程中语义异构问题,解决信息数据共享时着重解决信息语义差异性,从而保证系统交互过程中信息的准确性,达到彼此之间最大限度地获取有用的信息.解决语义异构问题必须解决两个基本问题:(1)判断两个对象是否相关,以及它们是如何相关的.(2)具有语义不一致问题进行处理,即支持语义映射和转换,包括识别语义矛盾和解决语义不一致的过程和技术.

元数据本体互操作是指不同元数据格式的间的信息共享、转换和跨系统检索等相关问题,为用户提供一个统一的检索界面,确保系统对用户的一致性服务.不仅要求系统之间进行数据、信息的交换,重要的是交换的信息能够被双方理解和使用.语义互操作能使两个服务单元或者系统间具有交换精确含意数据的能力,并且接受方能够准确的翻译或转换所传递的内容,即信息、知识能够被理解,是不同系统内或系统间模块之间实现语义知识的共享和重用.

3.4 语义互操作协议

语义互操作协议是指在网格中的组织通过一种联盟的形式,彼此约定同一规则,遵守相同的协议,在应用层面上进行数据的发布和检索.支持元数据操作协议有很多种,如OAI-PMH、Z39.50、ZING(SRU/SRW)等,对于资源异构,目前比较的一种解决方案就是采用开放文档先导OAI协议是语义互操作.据资料统计显示:70%的馆藏支持OAI-PMH协议,27%的馆藏支持Z39.50协议,3%的馆藏支持SRU协议[6].


OAI-PMH协议(Open Archives Initiative)[7]是一个旨在促进网络信息资源发布与共享的合作组织,意在开发文档先导,由国际组织提出的基于元数据的互操作框架方法,在其框架中主要有数据提供者DP(Data Provider)、服务提供者SP(Service Provider).用公用元数据格式DP将其表达,并通过OAI协议提出统一的标准化接口,向外部揭示自身的元数据,SP则通过OAI协议获一步的信息增值服务.此方法通过元数据收获模型,可解决各资料库在元数据格式上的异构性问题,以实现资源的整合检索.旨在促进网格信息资源开发、发布与共享的合作组织.OAI的起因是为了加强以学术交流为目的的对电子印刷文档的访问,以及保证科学数据在将来被访问的需求.OAI的目标是通过元数据采集模型实现在网格信息的不同组织之间的互操作,提供一个应用无关的元数据互操作框架.OAI通过简单的开放式元数据传输协议,来实现各图书馆之间的语义互操作.

相关论文

数字文化资源的元数据格式

本文是一篇图书馆论文范文,图书馆方面有关研究生毕业论文开题报告,关于数字文化资源的元数据格式相关在职毕业论文范文。适合图书馆及数据库。

有关财会信息资源元数据标准的

本文是一篇数据论文范文,数据有关专升本毕业论文开题报告,关于有关财会信息资源元数据标准的相关毕业论文开题报告范文。适合数据及数据库及。

分布式本体语义综述

本文是一篇本体论文范文,本体类有关专科毕业论文开题报告,关于分布式本体语义综述相关研究生毕业论文开题报告范文。适合本体及分布式及语义。

云计算机数字图书馆的安全防护

本文关于图书馆及可靠性及系统方面的免费优秀学术论文范文,图书馆类论文范文检索,与云计算机数字图书馆的安全防护相关学士学位论文范文,。