如何修改文相似度大学生

时间:2024-01-26 点赞:50274 浏览:100721 作者原创标记本站原创

本文是一篇数据库论文范文,关于数据库方面学年毕业论文,关于如何修改文相似度大学生相关毕业论文题目范文。适合数据库及图书馆及知识方面的的大学硕士和本科毕业论文以及数据库相关开题报告范文和职称论文写作参考文献资料下载。

招标需求

1.本项目建设内容为舟山海洋数字图书馆中心平台一期建设项目——统一知识发现系统项目.

2.中标人应与采购方就此项目签订合同.

3.采购方有权在签订合同时对产品数量和工程量作适当增加或减少,相应总费用随单价调整.

一、建设目标

紧紧围绕舟山市"十二五"发展规划,服务"智慧舟山"建设,着眼浙江舟山群岛新区建设需要,以服务海洋经济发展为前提,以完善公共文化服务网络为基础,以建设丰富的海洋数字资源为重点,根据舟山海洋数字图书馆建设总体规划方案与"国家数字图书馆推广工程"要求,软件平台建设旨在数字图书馆统一资料检索系统的基础上,开发海洋知识本体数据库和统一知识发现系统,并为进一步建设舟山海洋数字图书馆的情报服务,在线培训服务,海洋科普服务,咨询服务,COP社区服务,创新与众包服务,智慧中心,知识服务业支持奠定基础.

二、建设原则

舟山海洋数字图书馆不仅需要现代化的信息技术基础设施,运行平台和强大的功能,更需要现代化的理念和周到的适应性服务.海洋数字图书馆统一知识发现系统作为整个海洋数字图书馆的核心其综合性能指标至少要达到国内先进,省内一流的水平.

1,先进性:各个系统均采用先进成熟的,业界主流的技术和产品.使整个系统在一段时间内保持技术的先进,并具有良好的发展潜力,以适应未来信息化发展和技术升级的需要,

2,实用性:舟山海洋数字图书馆是一个国内经济较发达地区的专业性数字图书馆,系统的设计和实现都要考虑到舟山海洋数字图书馆的定位,特点,服务对象,目前和未来的实际需求,建立一个可用性强,有舟山区域特色和海洋专业特色的信息系统,

3,安全可靠性:包括设备,软件和数据安全.要确保各种设备运行稳定和容错,当发生故障时整个系统或主要应用系统能保持运行和服务,要建立完善的安全保障体系确保软件系统的正常运行,故障恢复和数据资源的容灾,

4,可扩展性:系统必须是可扩展的,当业务发生变化或发展后无论是硬件设施,还是软件系统都能在原有投入的基础上进行扩展,知识体系相关功能可方便地从海洋经济向其他相关领域的扩展.

5,开放性和互连性:网络系统要具备与多种协议计算机通信网络互连互通的特性,确保网络系统基础设施功能的充分发挥.应用软件系统和数据库系统要遵循开放性原则,以便实现系统间的数据共享和整合,以便进行应用功能的二次开发,系统应采用基于构件的开发方法,以提高模块的可复用性和可替换性,支持系统的演化式开发,

6,经济性:应以较高的性能价格比构建整个系统,使资金的投入产出比达到最大值.能以较低的成本,较少的人员投入来维持系统运行,提供高效能和高效益.尽可能保留并延长系统的投资,减少资本与技术投入方面的浪费,

7,易用性:整个系统应该是使用方便,维护简单.网络系统等硬件系统具有高性能的管理软件,以便进行系统检测,监控,和系统维护,应用软件系统具有良好的人性化界面,和很高的自动化水平,

8,标准化:系统必须满足或遵循相关的国际标准,国家标准和行业标准.

9,高度集成:本系统不是孤立的或完全独立的,它和现有系统之间存在着各种关联性,通过集成和整合技术,形成一个多层次的,关联的整体.

三、建设内容

整个知识发现系统的主要建设内容如下图所示,它包括以下内容:

图1统一知识发现系统的架构

海洋知识本体数据库

本项目基于本体(Ontology)

知识体系(BodyofKnowledge)是由特定专业领域专家定义的一个知识框架,表明该专业领域合格人才应掌握的基本知识和技能,涉及相关产业的重要流程活动和关键性技术.为确保海洋数字图书馆的海洋知识组织的科学性和完整性,本项目采用基于领域知识体系的资源组织建设方针.

知识图谱(knowledgegraph)是刻画了现实世界中的实体以及他们之间的相互关系的知识网络.例如海洋鱼类知识图谱描述了各种海洋鱼的分类,生态,地域,营养,历史,使用采用本体技术对海洋知识进行描述RDF(S)和SKOS进行海洋本体描述OWL是一种通用本体描述方法,这种方法不仅包含了类,属性与个体的定义,还包括了基于之上的逻辑推理机制,由于提供的机制过于庞杂,用于描述海洋知识体系,需要海洋本体描

海洋本体拟包括以下元素:

(KnowledgePoint):指的抽象.

实例(instance):代表现实中的一个个存在的实体.

之间的层次关系(taxonomy):通过层次结构更好的组织领域知识.

属性(attribute):属性是概念或实例的特征,采用三元组形式表示<,object-attribute-value>,,属性分为对象属性(objectproperty)和数值属性(datatypeproperty),属性都有其对应的域范围(domain)和值范围(range).

,实例和属性的别称(alias):同一实体的不同称谓.

,实例和属性的(label):同一实体.

数据类型:简单类型包括整数,浮点数,字符串,集合类型包括Bag(无序,可重复),List(有序,可重复),Set(无序,不可重复),对象类型.

的高级约束关系:交(intersection),并(union),补(plement).

实例的高级约束关系:等同关系(equality),不等关系(inequality).

属性的高级约束关系:函数关系(functional),反向关系(inverse),等同关系(equivalent),对称关系(symmetric),反对称关系(asymmetric),不相交关系(disjoint),传递性(transitive).

介绍(introduction):每个或实例有相应的文字简介.

在知识统一发现系统中,各类服务,模块和工具常常要访问海洋知识本体数据库.本模块为它们提供了一致的知识本体存取服务,包括知识点的查询,知识点各本体元素的获取,知识子树的获取,上一级和下一级知识点的获取,相关知识点(属性相关)的获取,知识点的新增,知识点的删除,知识点或知识子树的迁移,知识点的修改等等.

知识本体自动学习引擎

要构建海洋知识本体库是一件工作量很大的任务,结合手动编辑和自动构建两种方法构造海洋本体库

知识本体自动学习引擎能基于半结构化数据本体学习采集海洋知识方面的百科,术语等知识,自动生成初级的海洋本体库

知识本体协同编辑工具

知识本体自动学习引擎生成的海洋本体库仍需要专家进行完善和改进,知识本体协同编辑工具支持专家在网上在线地进行海洋本体库的编辑,包括知识点的重新组织,知识点的增加,删除,修改和查询.

知识本体协同编辑工具采用图和表相结合的方式提供知识本体的协同编辑,应具有良好的易用性.

知识点自动标注工具

根据资源的元数据(包括中图分类号,关 键 词,摘 要,书目等)对资源进行知识点标注(Annotation),又称本体标注或语义标注,是实现知识统一发现的关键技术之一.依据标注方法的自动化程度不同,可以将知识点标注划分为自动标注和手工标注两种.其中手工标注是指用户通过一个手工标注的环境,人工创建知识点信息,从而实现对文档的语义标注.诚然,手工标注拥有众多的优点,例如强大的灵活性,但是同时也存在着以下不足:①手工标注相比自动标注往往需要更多的人工参与,花费更多的时间,②用户手工标注容易发生误操作而导致标注错误,③资源信息成指数级增长,手工标注的速度远远不能满足它们的需求.因此,实现自动知识标注是迫切需要的.

本项目采用基于预定义规则的标注方法,开发一个知识点自动标注工具.用户首先通过分析元数据提取出标注规则,然后该工具根据这些规则对元数据进行语义自动标注.

知识点手工标注工具

若发现知识点自动标注工具的自动标注结果出错时,知识点手工标注工具将支持用户手工地完善和改进知识点标注,包括增,改和查操作.

知识点手工标注工具采用表格方式提供知识点标注功能,应具有良好的易用性.

统一知识发现引擎

海洋数字图书馆采用元数据仓储技术,实现了资源的统一检索.本项目在此基础上,建立了海洋知识本体库,并进行了元数据知识点标注,建立知识索引.用户输入一个关 键 词,就可以检索到对应的知识点及其资源,同时可以浏览到相关联的其他知识点和资源,有效地实现资源的深度揭示和深度融合

在统一知识发现结果的展现上,不仅有对应知识点的简要描述,知识点的资源排序,还有知识子树的浏览.知识点的资源应按合适的相关性排序

知识导航模块

用户可以直接在本模块中浏览知识体系和知识图谱,找到自己感兴趣的知识点,再查阅其相应的资料.

知识的浏览应具有良好的用户体验,可以沿着知识主干上下,也可以沿着知识关联线左右,可以zoomin,zoomout等操作.

知识个性化主动推荐引擎

在用明确自己所需要信息的情况下,搜索可以非常好满足的要求,它将内容相符的信息根据信息的重要性排序,并呈现给使用者.而推荐则是在内容匹配的基础上,加入了对于用与信息之间关系的考虑.根据当前用户的兴趣,历史行为记录等信息对用户可能感兴趣的内容进行较为准确的预测通过推荐得到的信息,除了内容上相关之外,更加具有针对性,契合用户的需求,而非单纯的文本内容比对,更重要的是,它能够在用户需求不清的情况下,启发式地将信息呈现给用,这是搜索方式无法做到的.使用collaborativefiltering算法和content-basedfiltering算法进行知识资源的个性化推荐

与现有数字图书馆信息系统的集成

本项目所开发的统一知识发现系统应与现有的数字图书馆门户,资源统一检索系统,国图数字资源统一标识系统相集成,从门户层,业务逻辑层,数据层进行集成.

在门户层,集成统一知识发现,知识导航和知识个性化推荐三个知识服务,在业务逻辑层,增加知识点标注,知识索引,知识本体存取服务,知识本体自动学习和协同编辑,在数据层,增加海洋知识本体数据库,并对元数据仓储的结构进行知识扩展.

四、总体要求

(一)总体技术要求

舟山海洋数字图书馆项目以数字图书馆建设标准规范为依托,以图书馆信息化基础设施为服务基础和性能保障,以图书馆馆藏资源,电子资源和外部资源为服务内容,以各种应用子系统和功能组件为服务实现方式,通过门户网站对外提供海洋数字图书馆各建设成员单位的资源和应用服务,为用户提供登录认证,资源检索与获取,读者个性化等服务.

1.项目须满足舟山海洋数字图书馆各业务系统应用集成,基于图书馆硬件环境搭建相应的应用系统,并实现其整合集成服务,

2.采用三层架构,基于Web方式实现全域应用和管理,实现图书馆本地系统部署与服务,

3.支持XML技术标准,支持多种数据开放接口,

4.提供多种数据共享方式(HTTP,WebService等),

5.数据和知识的快速检索能力,

6.如需集成其他公司软件产品,需有原厂商项目授权,

7.要求软件系统厂商自正式运行起全部免费服务3年以上,含技术支持服务,系统升级维护等.

8.承诺100%的本地部署,承诺提供开发和集成产生的软件源代码,提供2个或以上同类项目建设设计和开发的成功案例,并提供合同原件.

(二)软件系统技术指标

1.系统要求采用全中文界面,且操作简便,同时系统架构要求支持多种语言(至少包括中文和英文)的国际化需求,能在将来方便地进行其他语言的扩展.

2.系统采用纯B/S结构,支持多点同时访问登陆.支持IE6以上,Firefox3.0以上版本等环境,并适应各种分辨率居中显示.

3.跨平台支持:基于JaEE技术架构体系,支持主流的UNIX,Linux,Windows系列平台.

4.扩展及二次开发:要求项目能够进行

本文是一篇数据库论文范文,关于数据库方面学年毕业论文,关于如何修改文相似度大学生相关毕业论文题目范文。适合数据库及图书馆及知识方面的的大学硕士和本科毕业论文以及数据库相关开题报告范文和职称论文写作参考文献资料下载。

快速开发,提供成熟的二次开发平台,工具,文档以及相应的培训.

5.系统可根据未来数据量及用户并发访问的增长进行分布式集群扩展部署.

6.系统架构采用RESTfulWebService技术,支持将来方便地开发移动应用.

(三)主要性能指标

1.浏览界面支持至少10000用户同时登录与访问,编辑界面支持1000个用户同时编辑.

2.在网络稳定(带宽10M)的环境下操作性界面单一操作的系统响应时间小于5秒.

3.系统提供7*24连续运行,平均年故障时间小于1天,平均故障修复时间小于30分钟.

4.所有系统提供开放的应用编程接口(API),系统按基于构件的方法开发,具有适应业务变化的能力,当系统新增功能或现有功能改变(界面的改变,业务流程变化,规则的改变等)时,应尽可能的保证业务变化造成的影响局部化.

五、软件包详细需求

本项目分为三个软件包:知识本体软件包,知识标注软件包,知识发现和推荐软件包.本章将说明各软件包的详细需求.

要求根据对需求的理解和应用情况,提供现场的项目方案的PPT讲解或系统演示,时间为45分钟.

5.1知识本体软件包的详细需求

本软件包应具有良好的可扩展性,允许随技术发展对知识本体进行动态调整和扩展,并支持将来方便地从海洋经济向其他相关领域的扩展(需要进行描述,以评判可扩展性).

(一)海洋知识本体数据库

海洋知识本体的数据库解决两个问题,一个是使用何种知识表示方式来描述海洋知识体系框架和知识图谱,二是实现数据库存储.

本次招标过程的海洋知识表示,不一定是完全通用的知识表示,而是能够充分根据海洋知识的特点,在现有标准的基础上,进行合适的剪裁.要求兼顾前沿性与实用性.

同时,海洋知识具有网状特点,数据量也并不庞大,数据库不需要支持交易,因此,希望知识本体数据库可以做到"小而美",以方便不同应用的访问,以及未来的系统管理.

主要功能需求如下表所述.

序号需求描述1★设计一种适合海洋知识描述的本体描述,描述语言基于OWL2.0,能被主流OWL2.0兼容的编辑器打开.2★本体描述需要支持概念,属性,实例,实例关系,上下位关系.能够处理同名概念,相似概念.3★建立存储海洋知识本体的数据库,并能对专家建立的Word格式的海洋经济知识体系框架,进行准确的文本抽取和分析,全部存入该数据库中.准确率应超过95%.4★提供基础的数据管理接口与数据管理图形化界面.提供高速索引机制,在千万级节点情况下,单个知识点查询<,10毫秒.5★支持高速数据备份机制,提供图形化备份管理界面,要求整体海洋知识平均备份时间低于5分钟.6面向海洋知识需求,支持小规模多媒体数据,包括图片,声音,视频等.7根据海洋知识的特点,设计部分推理功能.

(二)知识本体存取服务模块

知识存取服务为海洋知识本体数据库提供了开放的接口.接口的开放性,完整性,易用性与性能是重点考量的目标.此处特地要求提供基于RESTful的Web服务接口,主要为了本标书中的其他模块以及未来第三方应用可以方便地远程访问知识库.

主要功能需求如下表所述.

序号需求描述1★支持知识节点的增,删,改,查与穿梭.2★支持两种不同的数据接口:本地JaAPI与RestFulWeb服务接口.3★提供利用各类节点关系,在不同节点之间进行穿梭的接口.穿梭可以基于上下位关系,实例关系与属性关系.4★在千万级数据量,可以支持1000个用户同时访问,每个用户响应时间低于500毫秒.支持对知识本体库的并发修改,并同时保证数据的完整性.5支持批量数据的导入导出接口.

(三)知识本体自动学习引擎

知识本体自动学习引擎主要提供三大功能:

1)生成知识本体库.在知识本体库部署初期,基于专家撰写的知识体系文档,互联网以及部分海洋资料库数据自动生成初始的海洋本体知识,避免从零开始录入数据,如此可以极大减少领域编辑的手工工作量.

2)辅助领域专家编辑.在知识本体库编辑过程中,为了方便领域专家编辑,可以通过工具自动找到词条(概念)以及概念相关内容,辅助领域专家决策.

3)资料统计分析接口.面向海洋领域高级知识工作者,将通过可交互的统计分析结果,得出某些结论.

其中,自动学习过程的算法在概念与概念关系上的查全和查精是自动学习引擎的核心,有两个指标:准确率为学习到的结果中正确的数目除以结果总数,在某一特定阈值下的召回率为在当前阈值下得到的正确结果数目除以在所有不同阈值时得到的正确结果的总数.

★要求:

准确度召回率概念学习≥90%≥85%概念层次关系学习≥90%≥80%属性关系学习≥85%≥70%同义关系学习≥95%≥85%主要功能需求如下表所述.

序号需求描述1★支持自动学习语料采集.可以采集互联网上的百科,互联网网页等各类语料.提供可配置的采集策略,可以配置采集目标,采集时间周期等..2★公开语料管理规范.语料规范至少包括对百科,网页与舟山自有资源的支持.支持多种格式语料,至少包括PDF,HTML与Word.可以增加,删除语料集合.3★支持自监督/无监督知识本体学习,学习过程可以不用标注语料.4★支持从百科半结构化信息中获取知识本体,支持从舟山数字图书馆的海洋术语表等资料中自动抽取本体.5提供人工干预接口,支持学习过程中,将人工干预结果作为标注语料进行迭代学习.6★支持知识体系和知识图谱中概念的学习,同义关系的学习,上下位关系的学习以及属性关系的学习.对于每种学习,内置学习规则5条以上,要求将规则方法与统计方法结合起来.7支持与知识本体协同编辑工具的接口.8支持与统一知识发现引擎的接口.可以基于用户选择的文档,图书,时间段,目标等,对文本进行统计,分析等.

(四)知识本体协同编辑工具

在生成海洋知识本体库的过程中,专家的编辑和审批必不可少.但是,专家资源是有限的,因此,如何合理设计编辑工具的使用流程与使用方法,方便专家的编辑,是考量的重点.与此同时,也要求工具实现版本管理,用户管理等常见功能.

主要功能需求如下表所述.

序号需求描述1★支持多人协同编辑,支持不同的级别的编辑与审批权限,如初审,审核通过.2★支持图形化所见即所得的编辑,支持多种编辑视图,如展现所有概念的树状视图,展现各类关系的关系视图,以及展现特定节点的详细视图.3★支持对概念节点,同义关系,属性,上下位关系与实例的编辑.支持对自定义属性的编辑.4支持用户管理,用户组管理,角色管理,权限配置,系统参数配置,日志管理等系统管理功能5★支持HTML5.6★支持与自动学习引擎之间的接口,可以将编辑的过程与结果推送给学习引擎,亦可导入学习引擎的结果.在增加概念以后,可以实时抽取在百科,搜索引擎上的相关概念定义.7支持编辑数据的导入与导出.导出结构应为XML格式.8★支持本体数据的版本管理,用户可以查看节点的历史版本.

(五)相应的系统集成要求和接口要求

本软件包的系统集成要求主要包括与现有系统的集成以及软件包间的集成.

序号需求描述1★门户集成.

要求遵循现有的统一用户管理与认证,

要求知识本体自动学习引擎和知识本体协同编辑工具与专家门户集成,以良好的用户体验方式展现用户界面.2★本软件包与知识标注软件包,知识发现和推荐软件包的集成.3★提供知识本体存取服务的API接口,

★提供基于RESTfulWebService的移动应用开发API接口.

5.2知识标注软件包的详细需求

本软件包应具有良好的可扩展性,允许将来知识导航服务方便地从海洋经济向其他相关领域的扩展.

(一)元数据的知识点自动标注工具

资料库数据量较大,进行标注可以方便资料阅读者快速俯瞰资源.与传统的标注不同,此处的标注基于海洋知识本体.由于海洋知识本体库的词汇比传统图书馆更为丰富,完全人工标注会比较困难.人工标注不但需要比较多的时间与人力,而且在标注粒度,精准度和对新领域,交叉领域的标注上,将受限于人的知识和阅读速度.

因此,知识点标注工具不但需要兼顾原有图书馆标注方法,同时必须能够充分使用海洋知识本体,以方便统一知识发现引擎为最终用户提供更为细粒度的搜索与发现服务.

知识点自动标注工具有准确率和召回率两个指标:准确率定义为标注的知识中正确的数目除以标注的总数,召回率则定义为标注正确的知识数目除以应该标注知识的总数.通常采用抽样评估的方式:首先选取一定量的知识,统计其中应该标注知识的总数,然后统计自动标注算法中结果数目和正确的结果数目,以计算准确率和召回率.★本工具要求准确率为≥90%,召回率为≥80%.

主要功能需求如下表所述.

序号需求描述1★支持对不同来源以及不同的数据类型进行标注,包括网络数据,购买的资料数据,格式为带元数据的HTML,PDF以及WORD等.2支持基于元数据的重新标注,此功能适合于对非本馆馆藏资源.3对图片,视频数据进行标注.4★自动标注算法基于海洋知识本体,而不仅仅是关 键 词的出现.5★标注算法必须向图书馆公开.

(二)元数据的知识点手工标注工具

标注过程将采用自动标注为主,手工标注为辅助的方法,手动标注工具将支持用户手工地完善和改进知识点标注,包括增,改和查操作.标注工具的易用性,与其他工具的集成性是重点考察的目标.

主要功能需求如下表所述.

序号需求描述1★提供基于Web的,图形界面的,所见即所得的标注方法.2★在工具中提供标注辅助功能,至少包括知识本体信息以及自动标注的结果,还可以包括资料在其他图书馆的元数据信息等.3提供内置的工作流或审批机制.4★支持HTML5.5★提供用户管理,日志管理信息以及版本休息,以记录标注历史的修改.

(三)知识导航模块

本模块将海洋知识通过用户友好的方式展现给最终用户.最终用户可以通过在海洋知识体系和知识图谱中穿梭,轻松地学习海洋知识.

主要功能需求如下表所述.

序号需求描述1★支持HTML5.0.可以基于Web,移动终端等多种设备的知识导航.支持知识体系图形的放大与缩小.2★支持知识导航的多种视图展示,要求能够清晰地展示节点以及节点不同的关系,包括层次关系,网状关系,概念与实例之间的关系,实体与实体之间的属性关联关系等.支持在一张视图上能展示4层以上的关系.3★支持通过不同的方式在知识体系和知识图谱上穿梭,包括概念与关系搜索,在当前节点通过上下文关系,属性关系,实体关系等进行穿梭.4可以对知识体系和知识图谱进行评价,以及建议修改方案.前台对修改的建议可以通知到专家.5支持声音与视频的播放.

(四)相应的系统集成要求和接口要求

本软件包的系统集成要求主要包括与现有系统的集成以及软件包间的集成.

序号需求描述1★门户集成.

要求遵循现有的统一用户管理与认证,

要求知识导航模块与读者门户集成,以良好的用户体验方式展现用户界面,

要求知识点自动标注工具和手工标注工具与后台管理门户集成,以良好的用户体验方式展现用户界面.2★数据集成.要求与知识本体数据库,元数据仓储整合,以支持实现知识点标注.3★本软件包与知识本体软件包,知识发现和推荐软件包的集成.4★提供知识导航的API接口,

★提供基于RESTfulWebService的移动应用开发API接口.

5.3知识发现和推荐软件包的详细需求

本软件包应具有良好的可扩展性,允许将来知识发现方便地从海洋经济向其他相关领域的扩展.

(一)统一知识发现引擎

统一知识发现引擎提供语义搜索功能与知识发现功能,面向普通用户,最终用户提供语义搜索,系统不仅仅提供基于关 键 词的全文检索,而是利用海洋知识体系,知识图谱,用户交互信息与历史信息,不断识别和探测用户需求,对用户进行导引,提供语义检索,聚合搜索结果,并可以基于知识体系进行穿梭.面向专家级用户,可以通过统计,分析,文本挖掘等功能,发现研究热点,热点变化,引文关联,实体关联等.

主要功能需求如下表所述.

序号需求描述1★搜索过程充分利用海洋知识体系与相关标注体系,形成语义搜索机制,而不是仅仅支持关 键 词.2★搜索结果的展现需要

本文是一篇数据库论文范文,关于数据库方面学年毕业论文,关于如何修改文相似度大学生相关毕业论文题目范文。适合数据库及图书馆及知识方面的的大学硕士和本科毕业论文以及数据库相关开题报告范文和职称论文写作参考文献资料下载。

与知识体系,知识图谱以及推荐结合起来.3提供"LearningtoRank"功能,对日志挖掘功能,根据其他用户的搜索结果,自动修正搜索结果.4★资料来源可以包括图书,期刊,报纸,学位论文,网页,专利等.也可以利用其他图书馆的各类元信息.5面向高级用户,提供知识发现功能,包括研究热点分析,人物实体,组织实体之间的关联关系等.

(二)知识个性化主动推荐引擎

本项目使用collaborativefiltering算法和content-basedfiltering算法进行知识资源的个性化推荐,通过这两种算法的结合互补地进行推荐度的计算,以期达到更好的效果.它既考虑系统中用户对知识资源的评价,同时也会考虑知识资源或用户之间的相似度.这种折中的方法相较于collaborativefiltering算法可以缓解数据稀疏问题,在没有足够或完全没有推荐项的情况下,将内容相似度高的知识资源呈现给用户,相较于content-basedfiltering算法可以针对不同用户的兴趣和历史行为等,提供更加个性化的推荐.


在content-basedfiltering推荐算法中,知识资源的语义相似度计算是关键.本项目利用基于本体的语义相似度计算方法来找到内容相关的知识资源以进行推荐.本体能够准确描述概念含义和概念之间的内在联系,在进行计算之前需要提前定义本体,也就是特定领域内所有术语构建的树形结构,结点深度越是大,其代表的内容越精确,结点深度越低,其内容就越抽象.在计算语义相似度的过程中,根据两个结点间路径的长短,以及构成路径的代表不同关系的连线来计算两个结点的相似度.

在collaborativefiltering推荐算法中,读者模型的建立是关键.本项目通过记录和分析读者的和关键行为,识别出读者的各种特征,从以下几个方面建立起相应的读者模型:

1)用户档案:即用户的个人基本信息,包括性别,年龄,职业,教育背景,收入,兴趣爱好等.

2)用户借阅记录:即用户在数字图书馆上借阅图书,浏览数字资源,订阅知识资源,学习电子课件等的信息,包括借阅的时间,名称,类别等.

3)用户评分信息:即用户对资源的评分.

4)用户的虚拟社区信息:即用户参与或主持了哪些虚拟实践社区.

同时,本项目向管理层提供简单实用的用户知识发现统计分析功能,从用户的职业,年龄等方面来统计分析用户对各资料库的使用情况,为将来采购资料库提供决策辅助信息.

主要功能需求如下表所述.

序号需求描述1★支持使用collaborativefiltering算法和content-basedfiltering算法2★在collaborativefiltering算法★支持使用海洋知识库计算item之间的语义相似度,提高content-basedfiltering的性能.4支持使用海洋知识库的推理机制进行语义推荐而并非仅是相似item的推荐,充分发挥知识库的导航作用.5支持多种推荐方法同时展示,用户可选择浏览不同的推荐方法的结果.6依据用户对推荐结果的点击行为,通过迭代改进推荐算法.7★从用户的职业,年龄等方面来统计分析他们对各资料库的使用情况,以表格和圆饼图等方式展示.

(三)相应的系统集成要求和接口要求

本软件包的系统集成要求主要包括与现有系统的集成以及软件包间的集成.

序号需求描述1★与中国国家图书馆数字资源唯一标识2★门户集成.

要求遵循现有的统一用户管理与认证,

要求统一知识发现引擎,知识个性化推荐引擎与读者门户集成,以良好的用户体验方式展现用户界面.3★业务逻辑集成.要求统一知识发现与现有的统一资源检索的整合.4★数据集成.要求和知识本体数据库,元数据仓储整合,以支持统一知识发现.5★本软件包与知识本体软件包,知识标注软件包的集成.6★提供知识统一发现的API接口,以及统一发现结果界面展现的API接口,

★提供知识个性化推荐的API接口,

★提供基于RESTfulWebService的移动应用开发API接口.

六、项目实施要求

为了保障项目的实施效果,在项目招标前期,承建单位应派遣相应的咨询团队,对图书馆的现状及项目的需求进行摸底调研,并根据调研的结果,确定项目建设的整体规划,确定知识统一发现系统的框架,确定本体定义标准,确定系统与系统之间的集成需要等.

本系统应用软件开发要求采用国际通用的规范化的软件开发,软件工程实施和项目管理方法,对项目实施的全过程进行监控和管理,对项目进度和工程实施进度进行控制,同时必须有详细易懂的系统的安装,运行,验收测试的技术文件,内容包括操作手册,服务流程与规范等,所有的技术文件必须是中文,并且本项目所有文档应该按照所使用的质量管理体系要求编写.

签署合同后7个月内完成平台开发,测试,实施,并进行不少于30天的试运行.承建单位应根据实施方案总体负责软件产品选型,开发,测试,安装,调试,用户培训,验收,投标方案中涉及第三方成熟产品的应用需原厂商提供安装,调试及相关技术支持.承建单位协同原厂商共同完成对本项目所有软件产品的测试,并提交相应测试报告和试运行方案,经由建设方认可后,方可进行试运行.承建单位在项目的实施过程中,必须服从建设方的协调,在实施方案设计,软件配置,技术支持,运行维护等方面相互配合.在工程执行过程中,双方可根据工程的进展情况及时召开工程技术协调会,讨论工程的技术问题及合同执行情况等重大问题.承建单位必须服从于建设方选定的监理公司或人员的管理与监督.

承建单位应向用户提供下述文档:

1.技术文件:软件需求,设计,安装,运行,使用,测试,诊断和维护的技术文件.

2.过程文档:承建单位需对项目实施过程跟踪记录,并提供过程记录文档.

3.变更文档:承建单位需对项目实施过程中的变更情况包括项目计划,项目内容,招投标双方对变更举行会议的情况等进行记录,并提供变更文档.

七、项目管理要求

1.项目沟通管理:承建单位应遵守建设方项目管理的相关规定的要求,接受项目负责人的领导,指定负责人(项目总监,项目经理和技术经理)与建设方项目管理机构或项目负责人沟通和协调工作.承建单位应建立项目例会制度,定期对项目实施情况进行沟通协调.每周召开一次的项目例会,回顾本周工作内容,向建设方提交项目周报,内容包括:项目进展报告,存在的问题和相应的解决方案,下周工作计划,所需的支持.每个月或按项目阶段完成标志,召开项目专题例会,向建设方项目管理机构或项目负责人汇报本项目的进展状况,存在的问题,需要协调的主要事项,下一阶段工作计划.

2.项目人员管理:建设方有权在项目进行过程中对参与项目的承建单位人员进行调整.在项目实施过程中,承建单位必须保证稳定的驻场实施工程师团队.未经建设方同意,不得擅自变更,调离人员,如由于特殊的原因,在征得建设方同意的情况下调离项目组人员时,承建单位应及时安排相当水平的人员接替,并作好交接工作.承建单位项目经理必须全程参与.在项目实施过程中,如遇有属于本工作说明书中范围内的,本项目组人员无法解决的技术难题时,承建单位有责任调动协调其它技术资源及时加以解决.为了确保有序,高效,顺利地进行项目实施,承建单位应在整个项目周期的不同阶段投入足够和适当的人力和资源.

八.售后服务要求

在软件产品投入运行后,若发现软件存在功能缺陷,承建单位有义务免费对软件产品进行较大规模(大于原有代码三分之一的工作量)修改完善.承建单位在服务期内,如对软件产品的功能进行改进,应免费提供包含改进功能的最新版本软件产品给建设方使用,并保证升级后的系统能够稳定的运行.

1.根据工程需要,承建单位应详细提供软件产品格式和根据建设方要求更改其软件产品格式.

2.承建单位对所提供的软件产品应实行保免费服务,免费服务期及质保期至少为项目验收后3年.在此期间,承建单位应无偿并迅速解决软件产品运行中的故障和问题.

3.承建单位应最大限度地提供技术指导及技术支持,在系统设备试运行期和保修期间,根据需要,承建单位有责任派高水平技术人员持续驻场维护,直到满足用户的运行需要.

4.承建单位应为本项目提供"7×24"的响应技术服务,用户认为必要时承建单位24小时内提供现场支持服务.遇重大故障时,承建单位应即时响应,专业人员4小时内到达现场.

5.服务范围包括系统软件产品安装配置,软件升级,性能调优,系统管理,安全和数据保护等.

6.项目培训要求:承建单位应根据项目的实施进度,制定详细培训计划,对平台团队,各业务部门代表用户进行培训,培训时间,地点由我方根据实际情况确定,培训场地由我方提供.采用集中面授培训的方式,若人数较多,可分期培训.培训内容应覆盖管理培训,操作培训,系统运维和产品标准培训等.具体分为三类培训.

面向人员培训目的培训内容高层人员培训让图书馆各级管理层深刻了解该项目给图书馆带来的好处.系统目标

设计理念

前台使用维护人员系统日常维护系统目标

系统维护编辑专家专家可以协同编辑系统系统目标

编辑使用7.项目实施时必须同时考虑到信息安全等级保护工作配套.要求产品不同软件部件,如用户浏览部件,专家编辑部件等,根据信息安全要求不同,分离部署.

九.★项目成果及其知识产权要求(需承诺)

1)源代码公开给舟山图书馆.

2)学习算法与标注算法公开给舟山图书馆.

项目要求递交:

1.软件安装包和安装说明

2.源代码和程序文件说明

3.构件和API的接口说明

4.系统的架构设计文档

5.元数据仓储和数据库的设计文档,包括表格及表格间的关系,表格字段,索引,存储过程,触发器等的说明

以上系统及程序开发的合法性由开发商负责.除采购的成熟软件产品与开发商原有系统之外,本项目设计与开发(含二次开发)所形成的软件的源代码,接口,技术文档由开发商和舟山市图书馆共同持有.如在设计与开发过程中有或侵犯其它软件公司版权,所有责任由开发商负责.

相关论文

如何修改文重复率大学生

这是一篇关于参考文献方面开题报告范文,与如何修改文重复率大学生相关毕业论文提纲。是参考文献专业与参考文献及开题报告及毕业论文方面相。

如何修改文重复率大学生

本文是一篇参考文献论文范文,参考文献类有关毕业论文开题报告,关于如何修改文重复率大学生相关专科毕业论文范文。适合参考文献及开题报告及。

修改文数据江苏,修改文数据学校

关于科学技术及论文及参考文献方面的免费优秀学术论文范文,科学技术有关论文摘要,关于修改文数据江苏,修改文数据学校相关论文范文检索,对。

如何修改文重复率

本文是一篇参考文献论文范文,参考文献相关硕士毕业论文,关于如何修改文重复率相关专科毕业论文范文。适合参考文献及参考文献引用及算法方面。

网上修改文软件工程硕士

为您写参考文献毕业论文和职称论文提供参考文献有关毕业论文题目范文,与网上修改文软件工程硕士相关论文范文数据库,包括关于参考文献及继续。

修改文英语小学,关于举行中小学英语

本论文是一篇参考文献有关论文提纲范文样本,关于修改文英语小学,关于举行中小学英语相关毕业论文的格式范文。免费优秀的关于参考文献及情感。

自动修改文小学,音乐年会文评比的

该文是本科论文专业计算机论文范文,主要论述了关于计算机硕士论文开题报告,与自动修改文小学,音乐年会文评比的相关论文范文素材,适合计算。