学术期刊文献数据库计量功能的开发

时间:2024-03-04 点赞:46688 浏览:92526 作者原创标记本站原创

本文是一篇数据库论文范文,关于数据库相关本科论文开题报告,关于学术期刊文献数据库计量功能的开发相关毕业论文开题报告范文。适合数据库及参考文献及学术性方面的的大学硕士和本科毕业论文以及数据库相关开题报告范文和职称论文写作参考文献资料下载。

[摘 要]首先基于对期刊文献资源特点与价值的认识,提出期刊文献数据库计量分析功能的开发问题;然后,分别从简单计数统计、历时性分析、共时性分析、引用关系聚类分析、基于期刊专业性指标的计量分析等5个方面,比较全面系统地阐述了期刊文献数据库计量分析功能的构想及其不同的开发实现策略;最后,对计量分析功能及其实现问题进行简单总结.(关 键 词]学术性期刊期刊文献数据库计量分析引文分析[分类号]G350

1 引言

期刊是一类非常重要的连续出版物,具有内容新颖、报道及时、出版连续、信息密集、形式一致等特点.对于学术性期刊来说,由于它刊载有大量的、原始性数据资料和原创性观点及成果,在近现代以来的科学研究与交流活动中一直扮演着极其重要的角色,并因此成为信息资源开发利用的重点对象.目前,国内外数据库生产商和服务商都高度关注以学术性期刊文献为收录对象的信息服务系统的研制与开发.

例如,美国ISI公司开发的享誉世界的期刊引文数据库系统WebofScience(简称WOS),EBSCO公司开发的期刊信息服务系统EBSCOonline与EBSCO,荷兰著名学术期刊出版商Elsevier、Kluwer等公司推出的期刊全文数据库系统ScienceDerictOnSite(简称SDOS)和KluwerOnline,德国Springer公司的电子系统springerLinkt等;而在国内,清华同方公司、万方数据公司和重庆维普资讯公司等,更是在中文期刊资源的开发与服务上展开了激烈的市场竞争.

纵观这些国内外的期刊数据库服务系统以及对它们的使用分析,我们不难发现,除了比较传统的浏览、查询、全文阅读与下载等基本功能外,对期刊及其刊载论文开展深入的定量分析、充分挖掘其蕴涵的学科知识与学术价值,已经引起了广大数据库生产商和服务商的高度重视.WOS系统及其配套的计量分析工具JournalCitationReports(简称JCR)、EssentialScienceIndicators(简称ESI)等的成功应用也充分证明,对高品质的学术性期刊信息资源进行计量分析,不仅可以有效提高学术资源的利用效率,而且对学术评价、科研管理与决策等工作也具有十分重要的价值.

基于上述背景,本文拟对期刊文献数据库的计量分析功能进行全面系统的探讨,以便为此类数据库系统的开发和增值服务提供有益的参考与指导.

2 计量分析功能的整体构想

从宏观角度来说,围绕期刊及其学术论文资源进行全面的、深入的计量统计和挖掘分析,主要可从以下5个方面来考虑:简单计数统计;历时性分析、共时性分析、引用关系聚类分析、基于(期刊)专业性指标的计量分析.

2.1 简单计数统计

“简单计数统计”主要基于简单的加和计算思想来进行,功能易实现,其分析对象涉及范围较广,可供选取或用户感兴趣的统计对象主要有:期刊、学术机构、著者、论文、关 键 词/检索词、基金/项目等.

在具体的统计(或计量)指标的选取方面,则主要有:(用户的)点击次数、订阅量、下载量、检索/浏览次数、数/推荐数、评论数等;(某期刊的)载文数、被引用次数等;(某论文的)参考文献数、被引用次数、相关文献数等.这些指标数据的收集或来自期刊文献数据库本身,或来自数据库服务系统的日志文件.在对这些指标数据进行处理时,一般可按所选定的统计周期(例如日/周/月/季/年等)来收集不同分析对象的相关数据,然后通过简单的加和(累加)计算,即可产生对应的排序列表.而人选排序列表的条件(或标准),则可使用“前N条”或“前n%”等方式(具体的N或n值,需要根据实际情况加以确定).

“简单计数统计”可以得到的结果主要表现为动态性(或时效性)很强的“排行榜”形式,例如:每周热门论文排行;每周热点检索词排行;每月期刊浏览排行;年度著者引用排行,等等等.

另外,还有一些简单计数统计的分析结果,如(某论文的)参考文献列表、相关文献列表(又可细分为基于论文关 键 词、分类号、耦合强度、共引强度等不同类型)、推荐文献列表等,可考虑与期刊数据库服务系统的浏览检索功能进行集成,以超链接方式予以发布或提供(见3.1中的实例说明).

 2.2 历时性分析

所谓“历时性分析”,即通常意义上所说的“纵向分析”.不论是期刊、学术机构、著者,还是学科专业、论文、关 键 词/检索词等,都可以作为历时性分析的对象.

历时性分析是在对期刊信息进行统计/计量时经常采用的一种分析策略.它主要基于“时间”坐标,通过比较合理的时间段划分,来考察分析对象各项指标(基本上同2.1节中的指标)随时间变化而产生(或形成)的演变轨迹、发展趋势等,例如文献老化、学科发展演变、机构变迁等.

历时性分析具有回溯性,通常要求分析对象的数据收集必须要积累并达到一定的规模,否则便没有必要或无法进行.这种分析可能产生的成果(或产品)形式主要有:某(子)学科发展演变轨迹与研究重点变迁;期刊主题领域的扩展或改变;学科核心期刊(表)的演变;学科文献老化速度(或半衰期)等等等.以WOS系统中的SCI数据库为例,其收录的期刊数据目前已回溯至1900年,因此可对它展开大规模的历时性分析,并可据此描绘出自然科学一个世纪以来的发展与演变历程.

2.3 共时性分析

所谓“共时性分析”,即通常意义上所说的“横向分析”.开展共时性分析时,要求选取一批具有共性(或可比性较强)的分析对象来进行,例如期刊、学术机构、学科/专业、著者、论文等.一般来说,对于不同的分析对象,例如学科、机构、期刊等,其共时性分析所需要拟定的(比较性)指标集合可能有很大的差别.

共时性分析可能产生的成果(或产品)形式主要有:相同主题论文的影响力排名与比较;同类学术机构之间研究方向与研究优势比较;某学科与其他相关学科的联系与比较;不同学术机构影响力排名与评测;等等等.

2.4 引用关系聚类分析

“引用关系聚类分析”功能,主要是基于学术论文写作时由作者创建起来的论文之间引用和被引用关系(网络)而进行的深度定量分析,从中可得到一系列隐藏在期刊论文内部的重要知识关联和学科发展联系,而这则是“简单计数统计”等分析方法无法实现的.

基于引用关系的聚类分析所选取的分析对象通常有:期刊、论文、关 键 词、著者及其所在的学术机构等,使用的分析(或计量)指标有:期刊关联因子(引证率与被引证率)、文献耦合强度、文献共引强度、作者共引强度、(关 键 词)共现频率等,而能够得到的结果(或产品)形式则有:核心期刊关联(或相似)矩阵;学术机构/著者/论文的关联网络图;关 键 词聚类网络图;学科研究前沿方向/领域预测;等等等.

由于是深度的量化分析,聚类分析功能一般要利用矩阵等数学工具以及已有的一些统计软件包,自动从期刊文献数据库中抽取样本数据,并对它们进行各种加工变换、等级(或非等级)聚类、可视化显示等处理,必要时还需要自行开发一些专用软件来完成分析任务.

2.5 基于期刊专业性指标的计量分析

这是一种专门以“期刊”为对象的专业性计量分析,具体采用的计量指标主要是期刊的一些年度性指标,例如载文量、参考文献量、篇均参考文献量、被引用次数、影响因子(ImpactFactor)、快引指数(ImmediacyIndex)、自引率(Self―CitationRatio)、自被引率(self-CitedRatio)、引用半衰期(ci―ringHalfLife)、被引用半衰期(CitedHalfLife)等.

通常,在针对上述计量指标对期刊进行专门化的计量分析时,需要有较大数量和较长时间跨度累积数据的支持(或保障).对于期刊文献数据库来说,这种计量分析功能将在科研管理、学术评价等活动中发挥重要作用.

3 计量分析功能的开发策略

以上从5个方面比较全面地分析、论述了期刊文献数据库的计量分析功能,不同的用户对象对这些计量分析功能的需求是不尽相同的.例如,对于普通的个人用户来说,他们主要专注于系统的浏览检索功能,以有效获取自己所需的学术信息,因此一些计量分析功能需要考虑与系统所提供的浏览检索功能的有机结合;对于期刊编辑部门来说,为完善、提高期刊的编辑质量和学术水平,它们则比较注意基于期刊专业性指标的计量分析功能;而对于科研管理和决策部门来说,为了科学、合理地指导、规划、评价学术研究活动,它们对以学科、机构、基金/项目等为计量对象的量化分析功能可能具有更加迫切的需求.有鉴于此,一个学术期刊文献数据库系统对其计量分析功能的开发,需要考虑并密切结合不同的用户需求,采用不同的策略予以开发和实现.

3.1 集成策略

所谓“集成策略”,是指将期刊文献数据库的某些计量分析功能与数据库系统的基本服务功能进行有机集成及无缝链接,把它们恰当、巧妙地嵌入到传统的浏览、查询等核心功能之中.目前,这种实现策略在实践中已得到广泛应用,并取得了很好的效果.

根据笔者的实地调查,美国的WOS系统和EiCompend―exWeb系统、国内同方公司的CNKI系统以及网络搜索引擎GoogleScholar等,都基于集成策略提供了比较丰富的计量分析功能,并具有很好的示范意义.例如,WOS系统在其检索结果页面上,通过设置“References:”/“CitedRefs”、“Citedby:”/“TimesCited:”、“RelatedRecords:”、“SharedRefs”、“AnalyzeResults"等超链接按钮,将某一检索结果文献的参考文献集合、来源文献集合、(基于书目文献耦合关系的)相关文献集合及相关文献集合的结果分析等一系列计量功能进行了有效的展示.而清华同方公司的CNKI系统在检索结果页面上方的“知网节”工具条也提供了“引证文献”、“共引文献”、“同被引文献”、“二级引证文献”等链接与计量功能,并随后在该结果页面的下方依次对每项链接与计量功能的具体结果给予详细的展示.上述WOS和CNKI对文献计量分析功能的集成化处理策略,极大地提高了用户对相关文献的查询及获取效率.

需要说明的是,当今数据库服务系统的一个重要发展趋势是集成化,并主要表现为产品集成化和功能集成化.除上述基于文献引文分析方法而实现的超链接与计量分析功能外,通过将其他更多的扩展性功能,例如用户在线评价与添加标签、可视化、机器翻译、各种专用管理工具等集成到系统的核心功能之中,已成为功能集成化开发的重要内容.

 3.2 独立策略

集成策略比较

本文是一篇数据库论文范文,关于数据库相关本科论文开题报告,关于学术期刊文献数据库计量功能的开发相关毕业论文开题报告范文。适合数据库及参考文献及学术性方面的的大学硕士和本科毕业论文以及数据库相关开题报告范文和职称论文写作参考文献资料下载。

适宜本文2.1节讨论的“简单计数统计”计量分析功能的实现.而对于期刊文献数据库系统中其他类型的一些计量分析功能(例如2.5节讨论的内容)来说,由于其计量指标的专业性及复杂程度,则应该采用独立策略进行开发.

所谓“独立策略”,是指在期刊文献数据库系统之外研制开发可以单独使用的期刊文献计量分析工具(或软件),这些工具(或软件)可以作为期刊文献数据库的重要衍生产品来使用,并发挥其独特作用.

以2.5节讨论的专门针对“期刊”的计量分析功能为例.期刊作为一种重要的学术交流媒介,基于期刊自身以及由其刊载学术文献而产生的各种数据(包括编辑出版数据、使用反馈数据、学科/机构/国家与地IX/年代等分布数据、学术影响力数据等),通过拟定的一系列专业性计量指标(见2.5节)的统计分析,可以在核心期刊确定、期刊老化规律研究、期刊管理、科研评价等诸多方面发挥不可替代的作用.若以独立策略来开发实现这些计量分析功能,将会产生用于科技期刊评价、揭示科学研究活动和科学发展规律的重要分析工具.

目前,由美国WOS系统衍生、分化而来的JCR工具就是以独立策略开发实现的最成功范例,它已成为广受国际学术界和期刊界推崇的独一无二的期刊评价分析工具.在国内,近年来由中国科学院文献情报中心的中国科学引文数据库(简称CSCD)系统和由南京大学的中文社会科学引文索引数据库(简称CSSCI)系统等派生的期刊专用计量分析工具也已得到逐步开发,并投入了实用(基于它们形成的期刊引证报告已按年出版).


3.3 策略

所谓“策略”,主要是指基于期刊文献数据库形成、积累的计量指标数据,按照不同用户提出的特殊需求,开发、提供有针对性的计量分析功能.

从原则上来讲,凡不宜通过集成策略和独立策略进行开发的计量分析功能(如2.2―2.4节内容),均可通过策略予以灵活实现.例如,通过历时性分析和共时性分析的有机结合,分别针对期刊编辑部、图书馆、科研管理部门等,按需提供(或)年度性计量分析报告;或根据专业性教育与研究机构的要求,以定期或不定期方式,分学科(或专业)提供比较有深度的专项挖掘/计量分析报告,对学科的内部结构、研究水平、发展趋势、前沿热点等给予全面的解析和展示.

基于策略的计量分析功能如果能够形成品牌化和系列化,将对学术期刊文献数据库系统的功能优化和增值服务具有重要的意义.

在目前的实践中,不同期刊文献数据库系统计量分析功能的开发可以说是各具特色,但整体上都较薄弱,有待加强和完善.限于篇幅,基于实例的详细分析不再展开.

4 结语

从本文上述的讨论分析不难看出,对于期刊文献资源来说,通过不同的实施策略进行多方面的计量分析,可使其蕴涵的知识与价值得到深入的挖掘利用,并可极大地提高期刊文献数据库系统的增值服务能力.并且,期刊的学术品质越高,其计量分析功能所能产生(或辐射出)的增值效应越显著.

对期刊文献数据库的计量分析功能再并强调以下意见:

确保计量分析指标的科学性和合理性以及统计数据获取的可靠性.为此,需要制定一个健全的期刊文献数据库底层结构标准或元数据标准(包括来源文献和参考文献自身的描述以及它们的使用、引用与被引用、共引与耦合等信息的描述),以便为计量分析功能的不断扩展和逐步完善提供稳定、可靠、充足的数据来源保障.

宜严格遵守“只客观提供计量数据,不对计量数据进行主观评价”的原则.期刊文献数据库的计量分析功能应以“第三方”身份提供客观数据为主,并逐步形成或树立起自身的公正性与权威性.如何基于这些客观数据形成特定的评价结论,可由用户(或需求者)自己来判断和论证.

宜采用逐步推进的方式以不同策略实现或开发日益全面的计量分析功能.

相关论文

中国学术期刊全文数据库,万方数据库

本文是一篇数据库论文范文,数据库类有关大学毕业论文,关于中国学术期刊全文数据库,万方数据库相关硕士学位毕业论文范文。适合数据库及信息。

检索库,中国学术期刊全文数据库

本文是一篇数据库论文范文,数据库方面有关函授毕业论文,关于检索库,中国学术期刊全文数据库相关毕业论文提纲范文。适合数据库及核心期刊及。

我国远程教育学术期刊文章的计量

本文是一篇远程教育论文范文,关于远程教育方面毕业论文开题报告,关于我国远程教育学术期刊文章的计量相关学士学位论文范文。适合远程教育及。

中国学术期刊全文数据库

本文是一篇参考文献论文范文,关于参考文献类毕业论文范文,关于中国学术期刊全文数据库相关本科毕业论文范文。适合参考文献及学术期刊及黑体。

国际学术期刊回溯数据库市场概览

本文是一篇数据库论文范文,数据库类有关在职毕业论文开题报告,关于国际学术期刊回溯数据库市场概览相关毕业论文开题报告范文。适合数据库及。