本文是一篇网络新技术论文范文,关于网络新技术类电大毕业论文,关于基于CIM的相似度综合评价算法相关函授毕业论文范文。适合网络新技术及答案及问答方面的的大学硕士和本科毕业论文以及网络新技术相关开题报告范文和职称论文写作参考文献资料下载。
〔摘 要〕相似度计算是自动问答领域里的重要内容.为了保证候选答案集中各答案能具备合理的排序,解决传统自动问答系统不能高效的综合评价相似度问题,提出利用综合指数法对关 键 词相似度、语义相似度等进行综合评价,得到综合相似度.并针对部分候选答案冗余信息过多,不利于答案提取的情况,设计了衰减相似度参数,用来解决句子冗余信息对答案提取的影响.实验结果表明,综合指数法的相似度算法能够有效的提高问答的正确率.
〔关 键 词〕自动问答;答案抽取;相似度;综合指数法
网络新技术的迅速发展,使得一些搜索服务可以帮助用户迅速跳过所有不相关的信息.其中有一项服务是自动问答技术[1],该技术提供精确的特定问题的答案.比如提出一个问题,“2012年国内生产总值最高的国家是?”自动问答系统将直接回答一个国家的名称.一段时间以来,很多研究机构都对自动问答技术做了相关的研究,这其中,有关于问句和答案进行相似度对比的算法,逐渐成为自动问答系统中比较重要的内容[2].目前,相似度计算领域提出了很多算法,如文献[3]提出的基于分词的资源整合、文献[4]提出的基于语句相似度计算系统等.这些相似度计算模型解决了答案选取过程中的句子排序问题,提出了相关的解决方案.但是,这些方案提出的备选答案尚待完善,部分作为答案出现的句子或单词在提取后,结果有时并不能让人们满意.