档案学高被引文引用情感类型

时间:2024-01-24 点赞:45218 浏览:87784 作者原创标记本站原创

本文是一篇档案学论文范文,关于档案学相关函授毕业论文,关于档案学高被引文引用情感类型相关毕业论文参考文献格式范文。适合档案学及引文及档案馆方面的的大学硕士和本科毕业论文以及档案学相关开题报告范文和职称论文写作参考文献资料下载。

摘 要:基于引文内容分析的档案学高被引论文引用特征研究方法,文章界定三种引用情感类型,实证研究基于引文内容的主题识别和情感类型识别.揭示档案学高被引论文反映的引用主题和引用行为动机.

关 键 词:引用情感类型分析;档案学;高被引论文

Abstract:Weproposeahighlycitedpaperscitationevaluationanalysiethodinarchivessciencebasedoncitationcontext,definethethreetypeofcitation.Thepapercontributestotheexternalfeaturesandcontentfeaturesofhighlycitedpapersbyempiricalstudycitationsubjectandcitationmotivationbasedonarchivessciencepapers.

Keywords:Analysisofcitationemotiontypes;Archivesscience;Highlycitedpapers

1引言

1927年[1],引用首次被用来对科研进行评价,经过数十年的发展,引文分析的理论和方法体系逐步健全.然而,随着研究和实践应用的深入,引文分析存在的问题也逐渐暴露,如,引用的规范性、引用动机以及只注重被引频次而忽视引文内容导致的引用不规范和引文评价的不科学等问题[2].随着文本挖掘技术和全文提取技术的出现,基于引文内容分析是引文分析的新方向[3].引文内容分析可以弥补单纯以被引频次数量评价的不足,将引文的数量和质量结合起来,更好地揭示文献之间的关联性.

虽然国外已经有关于引文内容分析的实证研究,但国内基于引文内容分析,尤其是基于档案学引文内容分析的研究目前还不多.鉴于此,本文以档案学高被引论文内容分析为基础,深度揭示档案学高被引论文反映的引用主题和引用行为动机研究,对于揭示档案学引文特征具有意义.

2数据来源

本文以档案学高被引论文为样本,样本选择方法为:以CNKI数据库的“中国学术期刊网络出版总库”为数据源,选择“档案学、档案事业”学科领域,不设检索条件加以检索,检索结果按照被引频次递减排序,剔除非学术文献和不相关文献,得到档案学被引频次最高的前100篇论文.检索日期截至2013年底.百篇高被引论文分布于18种期刊中,其中《档案学通讯》最多,有51篇文章,占总数的51%.《档案学研究》12篇.

3引文内容特征研究

引文内容分析指基于引文内容层面的语义关联,对引用句或引用上下文的内容进行关联性分析,以揭示被引文献对施引文献的作用.目前,相关研究主要包括引文类型识别、情感倾向分析和引文主题识别.


3.1引文主题识别研究.引文主题识别是从引文文本抽取代表引文的主题词,利用主题分布来揭示被引文献的被引原因以及被引文献对施引文献的主要作用或贡献.

本文主题识别是通过抽取高被引论文的关 键 词来实现.百篇高被引论文共有691个关 键 词,出现频次大于4的关 键 词有34个,累计频次277次,占总频次的40%.出现频次最高的档案工作者19次,档案管理18次,电子文件17次.

表1高频关 键 词

利用共词分析方法将我国档案学高被引论文研究主题分为四个主题知识群,一是档案学基础研究与档案事业,包括来源原则、档案学、现行文件、人事档案、档案事业、档案管理、档案工作者、纸质文件、信息安全、文化、政府信息公开关 键 词.二是电子文件和文件运动理论,包括电子文件管理、电子文件、电子档案、电子文件归档、文件运动和文件生命周期关 键 词.三是档案信息化与资源开发利用,包括办公自动化、数字化、档案信息化、信息化、数字档案馆、档案信息、档案信息资源、资源开发、利用、档案开放利用关 键 词.四是档案工作与档案馆,包括档案工作、虚拟档案馆、传统档案馆关 键 词.

3.2引用情感类型研究.引用情感类型识别是通过对施引文献引用被引文献的文本内容,从引用动机和情感倾向分析挖掘施引文献作者对被引文献的观点、态度或立场,主要分为肯定、中立和否定三种基本类型.本文以档案学高被引论文引用情感倾向识别档案学引用情感类型.

本文根据引用内容,将引用情感类型分为三类,正面引用、负面引用和中性引用.正面引用指施引文献中对引文的观点、结论或方法的肯定和赞同,还包括在引文基础上展开后继工作,或者应用引文中的理论方法和数据以及引用他人的方法或结论和自己研究进行对比等.

负面引用指施引文献对引文中的观点、结论或方法持否定态度.多是指有商榷性质的文章,或者指出引文研究的不足、缺陷以及目前没有涉及的而本文将要研究内容,主要表述两篇文章研究的不同.

中性引用指施引文献对引文内容没有表示赞同或反对观点,只做内容论述和在综述研究中出现的引用.情感类型界定如表2.

表2情感类型及界定

由于百篇档案学高被引论文总被引三千多次,涉及施引文献数据量巨大,数据处理困难,本文采用分层抽样调查的方法,保证研究的可行性和科学性.在上述引文主题类型中,依据上述主题分类,在四个主题类团中各抽取一篇代表性文献作为样本研究.研究样本的选择具有代表性:一是涵盖了所有的研究主题,避免因主题不同而产生引文特征不同;二是选取不同作者,既有业界权威,也有不同身份代表,避免权威效应带来研究偏差;三是不同期刊和年代;四是不同层次的被引频次.

表3抽样样本数据

从上述四篇不同主题的文章被引的情感倾向来看,档案学论文多是正面引用,占63%,不含感彩的中性引用占35%,只有不到4%的引用是否定性质的.说明在多数情况下,档案学界对所引用文献都是持肯定态度,或是对引用文献高度评价,或是应用引用文献的理论和数据,只有极少数是指出引文不足.进一步分析正面引用大部分是理论应用、在别人研究基础上的进一步研究和利用别人的研究理论、数据进行实证研究,或者是自我对同一问题的深化研究.因此,理论性强的文章正面引用的可能性更大.如裴友泉[4]等在文章中引用“正如《刍议》所说,目前‘信息孤岛’、项目资金浪费等问题正面临深化的风险等笔者想说是:《刍议》是篇好文章,不仅较系统地梳理了我国电子文件客观存在的问题,给人们以警示与反思”表明对引文的正面肯定.

实践性的文章和综述性质的文章多是在文章开头的理论综述和研究综述中引用,因此,中性引用的可能性大.如马海群[5]等在文章中引用“由图4可见,数字时代的档案信息资源管理已成为2006年~2007年学者们关注的研究热点之一,冯惠玲(2006)从国家战略的层面上指出:我国电子文件管理战略应借鉴发达国家的先进经验,走上顶层设计、全面规划和集中控制的发展路径”表明对引文没有感彩的中性综述引用.

反面引用的文章很少,说明档案学界在理论争鸣和商榷中不是太活跃,而这仅有的几篇反面引用也不是对于观点的否定,只是指出引文和施引文献研究问题的不同,或者不全面.同时,理论性的文章由于有观点表述更有可能反面引用.如安小米[6]在文章中引用“第一篇《电子文件管理国家战略刍议》,首次提出了我国电子文件管理国家战略研究的问题等该文肯定了电子文件管理问题的严重性,但未对什么是电子文件管理国家战略进行明确解释,由于缺少分析框架,对国外电子文件管理国家战略的研究有待系统和深入”,文章指出引文的不足和缺陷,进而提出本文要研究的内容.同时,学位论文的引用会涉及施引文献对被引文献的多次引用,主要包括在文献综述中的中性引用以及在具体的问题和策略中的正面引用.

4结论与展望

本文提出了一种基于引文内容分析的高被引论文引用特征研究,并以档案学高被引论文为数据源,研究了基于引文内容的主题识别和情感类型识别.指出档案学高被引论文主题既有传统基础理论内容的继续研究,但更多地已关注网络环境下新的理论和应用.具体表现为:一是基础理论和应用研究依旧,新的应用理论逐渐增多.二是信息化催生的档案工作新变化,以及基础理论的应用得到拓展.技术催生电子文件产生、政府信息公开、电子政府、档案网站的建设和数字档案馆等.三是档案工作为社会服务的关系越来越密切.档案学的引用情感类型以正面引用为主,综述性和实践性的文章多是中性引用,而具有商榷性和争鸣性的反面引用文章很少.

虽然本文从引文内容方面研究了高被引论文的引用特征,但也存在局限.一是引文样本选择的局限.鉴于数据量大,在引文类型研究中,只选择了每个主题中的4篇论文进行研究.二是引文内容分析也只对主题和情感类型进行识别,况且主题识别只选择关 键 词,没有从标题、摘 要甚至全文信息中提取主题标识.未来要在文本挖掘技术和大数据技术下,进行大样本引文内容分析和主题识别.同时,指出引文内容特征还具有学科特征.

相关论文

基于民族声乐的高被引文学术影响力

本文是一篇音乐类论文范文,音乐类相关专升本毕业论文开题报告,关于基于民族声乐的高被引文学术影响力相关在职毕业论文范文。适合音乐类及声。

编辑学高被引文陕西作者群载文情况

本文是一篇编辑学论文范文,关于编辑学函授毕业论文,关于编辑学高被引文陕西作者群载文情况相关毕业论文开题报告范文。适合编辑学及统计分析。