基于动词相似度的特征分类方法

时间:2024-02-27 点赞:50936 浏览:103308 作者原创标记本站原创

本文是一篇数据库论文范文,关于数据库函授毕业论文,关于基于动词相似度的特征分类方法相关本科论文范文。适合数据库及特征及说话方面的的大学硕士和本科毕业论文以及数据库相关开题报告范文和职称论文写作参考文献资料下载。

【摘 要】本文提出了一种新的说话人特征分类方法,基于计算动词相似度理论,建立距离和趋势的评价模型,通过计算特征向量与k-means算法聚类所得的聚类中心的相似度矩阵,将说话人个性特征从MFCC特征域映射到说话人相似度属性空间中,形成新的特征向量集,这样,每个说话人的特征向量将被聚为在距离和变化趋势上最具相似性的k分类.之后,利用GMM模型在属性空间内进行联合概率分析、匹配,建立新的说话人识别系统.本文采用标准TIMIT语音库与NIST语音库在该识别系统中进行一系列实验,结果表明,该基于新的优化特征分类的识别系统,对比传统的说话人识别系统,在等错误率上有很好的提高.

【关 键 词】计算动词相似度;特征分类;GMM模型;说话人识别

AFeatureClassificationMethodBasedonVerbSimilarity

JingyunQiu,LinLi

(DepartmentofElectronicEngineering,XiamenUniversity,XiamenFujian361005,China)

Abstract:Anewstrategyoffeatureclassificationmethodforspeakerrecognitionbasedonputationalverbsimilarityispresented.Ontheevaluationmodelwiththesimilarityfunctionofbothdistanceandtrendinmelcepstraldomain,thenewfeaturevectorsetswereassortedafterparingclusteringcenters,whichwereobtainedbyutilizingk-meansalgorithm.Asaresult,thefeaturevectorsofeachspeakerwereclassifiedintokclusters,andthevectorsineachclusterhadthemostsimilarityinbothdistanceandvariationtrend,butseparatedthoseinotherclusters.Moreover,anewspeakerverificationsystemwasestablishedbyusingGMMmodelforanalyzingandmatchingthejointprobabilityinthenewfeatureclassificationspace.TheexperimentswiththestandardTIMITdatabasesandNISTdatabaseswereimplemented,andtheresultsshowedtheproposedalgorithmachievedgoodclassificationperformance.


Keywords:putationalverbsimilarity;featureclassification;GMM;speakerrecognition

1.引言

对于说话人识别系统而言,一个能有效区分说话人的特征提取和分类方法是非常重要的,因而,在语料中找到能够表征说话人的个性特征及其特定的特征映射空间就显得尤为重要.目前,大多数说话人识别系统所采用的特征参数主要有:表征说话人听觉特性的梅尔频率倒谱系数(MelFrequencyCepstrumCoefficient,MFCC)[1]和表征说话人声道信息的线性预测倒谱系数(LinearPredictionCepstrumCoefficient,LPCC)[2],二者都是说话人识别系统中的主流特征分析方法,并应用于模型匹配如隐马尔可夫模型(HMM,HiddenMarkovmodels)[3]、高斯混合模型(GMM,GaussianMixturemodels)[4].

近年来,为了提高说话人识别系统的性能,在MFCC和LPCC的基础上还增加了一些辅助特征参数,如harmonic结构特征[5]、残差相位信息[6]、高阶统计特征等.相对于众多的谱分析方法,MFCC特征参数符合人耳听觉特性,较好的反映说话人的个性特征,但这种传统的MFCC特征参数包含了大量的冗余信息,在噪声环境下识别性能很不稳定.因此,很多人在特征映射空间和分类器上做了很多改进,如,McIntyre[7]提出一种改进的GP(GeicProgramming)多重分类器,能在增加训练说话人的同时减少系统的训练时间并优化系统的性能.TaoBan[8]提出的分类器是通过构造决定函数的最小距离准则,将单分类器转为多重分类器进行分类.在这些方法都一定程度上改善了特征参数的缺点.

在传统的说话人识别系统的识别阶段,多样化的识别模型被广泛的应用于识别系统中,主流的如矢量量化(VQ,VectorQuantization)[9]、高斯混合模型(GMM)、隐马尔可夫模型(HMM)、支持向量机模型(SVM,SupportVectorMachines)[10]、神经网络(NN)[11]以及混合模型等.

本文提出了一种新的说话人特征分类方法.在传统MFCC特征向量的前提下,结合一阶二阶特征形成一个新的MFCC动态加权参数,之后,采用计算动词相似度理论,将新的动态加权MFCC参数集从传统的梅尔倒谱域映射到一个新的空间,称为“相似度属性空间”,主要由梅尔倒谱域中原参数的距离相似度和变化趋势相似度联合确定.这种参数空间映射首先针对单个或多个说话人分析其特征参数(N维),提取M个共性特征中心作为该说话人属性空间的基坐标(2M

本文的第二部分介绍的是改进算法的核心部分:相似度映射的概念及其应用于说话人识别系统;第三部分是在GMM基础上将核心算法结合动态MFCC特征参数并仿真实验,并对实验结果进行分析.最后是结论.

2.特征参数相似度映射

2.1计算动词相似度定义

计算动词相似度(简称动词相似度)[12][13],是综合考虑频率、距离、趋势、幅值等,作为测量模板特征向量与待测特征向量之间的比较因子,得到一个评估二者相似程度的值,即为相似度.

采用动词相似度的概念,我们可以只考虑能够区分不同说话人的个性特征方面,如频率分布、曲线形状近视程度、二次谱特征等,而忽略掉说话人语音性之处,如背景噪音和声道噪声等,最大限度的区分不同说话人,而转换得到的空间,则是后期模型匹配所在的相似度属性空间.

首先,假设有两个特征向量集,其中,

(1)

则二者间的相似程度计算函数,应该满足:

(2)

其中,为的距离,除了可以利用传统的距离测度外,还可以考虑人类直觉的各类因素如距离、趋势、频率等等,形成复合型的计算动词相似度:

(3)

其中:

表示相似度中两个计算动词间的距离比较;

表示相似度中两个计算动词间的趋势比较;

表示相似度中两个计算动词间的频率比较;

在本文中,根据说话人识别系统的特点,拟用了距离测度和趋势比较两个方面作为相似度计算函数,其中是调节因子:

(4)

其中采用的是欧式距离测度,则是趋势测度:

(5)

(6)

由大量的实验测试结果可得出,取经验值等于1.6~1.8,等于1.6~2.0时,识别精度最好.

2.2相似度映射应用于说话人识别系统

首先,假定有m个待训练说话人样本,经过预处理后变换到mel倒谱域,得到大小为M的MFCC语音特征向量集,假定其维数为N,并采用动态MFCC及其一阶二阶信息,这样,我们可以得到维特征向量:

(7)

其次,采用k-means聚类算法,将已获得的特征向量聚为可表征说话人特征的L类,作为计算相似度的基本坐标向量:

(8)

将L个码书作为相似度空间的基坐标向量,由相似度计算函数(4),将维特征向量通过计算距离测度和趋势测度映射到由确定的属性空间内.这样,即可得到维的相似度矩阵:

(9)

由此,对待测训练样本建立独立的属性空间后,根据比较待训练语音的每个特征向量与基本坐标向量之间的相似度值,将所有特征向量归类于不同的基本坐标向量所属类中,即可得到L类:

(10)

其中,为第i类,聚类数目L由GMM阶数决定.通过计算,便可以得到GMM模型的输入参数:

(11)

其中,为第i类的均值特征向量,为第i类的协方差特征矩阵.

同时,从待训练语音样本中随机抽取大量语音样本训练通用背景模型(UBM),经过同样步骤得到UBM的GMM参数:

(12)

由此,即可得出最终的GMM模型的联合概率密度函数:

(13)

其中,为特征向量,,为类的权重值:

(14)

并且为:

(15)

最后,将最终所得分进行归一化计算:

(16)

3.实验结果及数据分析

本实验中,使用Matlab语音编程,运行环境为matlab7.1.预加重系数采用0.9375,分帧汉明窗长256点(16ms).所采集的说话人语音信号样本集一为标准的TIMIT语音库,样本大小为298人,每人十句话,实验将随机抽取每人的两句话作为训练样本,其余的八句话作为测试样本;样本集二为大小117人的NIST语音样本库.

由实验结果可看出,与传统的基于k-means分类方法的说话人识别系统相比,本文所提出的基于Timit语音数据库的说话人系统的识别精度,即等错误率可达到1%~3%,与传统的相比提高了约12%~15%.同时,基于NIST语音数据库的的等错误率接近25%~27%,较之传统的方法约有%6的提升.这也说明了本文所提出的新的分类方法与传统的k-means分类方法有较好的性能优化.

4.小结

本文所提出的基于新的分类方法的说话人系统,基于MFCCs特征参数的距离和趋势方面确定相似度函数,使得每个说话人语音信号的统计特征以及动态特征得到很好的分类,不同说话人之间的特征向量分类也由实验说明有较少的重叠.

本文基于TIMIT与NIST语音数据库进行实验分析,结果表明所提出的算法能够达到一个较好的识别效果.

本文是一篇数据库论文范文,关于数据库函授毕业论文,关于基于动词相似度的特征分类方法相关本科论文范文。适合数据库及特征及说话方面的的大学硕士和本科毕业论文以及数据库相关开题报告范文和职称论文写作参考文献资料下载。

em(CSSS),pp.2877-2880.

[4]Mousian,SeyedIman,ValiMansoor,Sadeghi,SeyedMohammad,Kabudian,Jahanshah,“AnewmethodforlanguagerecognitionbasedonimprovedGMM”,2011,SignalandImageProcessingApplications(ICSIPA),pp.467-471.

[5]SelviT.,PragatheeswaranJ.,“Efficientspeechenhancementtechniquebyexploitingtheharmonicstructureofvoicedsegments”,2011,RecentTrendsinInformationTechnology(ICRTIT),pp.764-769.

[6]Pati,D.andPrasanna,S.R.M,“SpeakerinformationfromsubbandenergiesofLinearPredictionresidual”,2010,Commun(NCC),2010NationalConference,pp.1.

[7]A.R.McIntyreandM.I.Heywood,“TowardCo-EvolutionaryTrainingofaMulti-ClassClassifier”,2005,FacultyofComputerScience,pp.2130.

[8]TaoBanandShigeoAbe,“ImplementingMulti-classClassifi,ersbyOne-classClassifi,cationMethods”,2006,pp.327.

[9]ChristensenM.G.,MowlaeeP.,“AnewmetricforVQ-basedspeechenhancementandseparation”,2011,Acoustics,SpeechandSignalProcessing(ICASSP),pp.4764-4767.

[10]Keng-PeiLin,Ming-SyanChen,“OntheDesignandAnalysisofthePrivacy-PreservingSVMClassifier”,2010,KnowledgeandDataEngineering,IEEETransactionson,pp.1704-1717.

[11]BoLu,Jing-jingWu,YuWang,Jin-pingLi,“Aspeechrecognitionsystembasedonmultipleneuralworks”,2010,NaturalComputation(ICNC),pp.48-51.

[12]T.Yang,“TheMathmaticalPrinciplesofNaturalLanguages”,2007,MonographsinInformationSciences,Tucson:Yang’sscientifi,cresearchinstitute,LLC.

[13]T.Yang,“Composedputationalverbsimilarities”,June2009,InternationalJournalofComputationalCognition,7(2),pp.24-30.

[14]TomiKinnunenandHaizhouLi,“Anoverviewoftext-independentspeakerrecognition:Fromfeaturestosupervectors”,2009,SpeechCommunication,pp.12-40.

作者简介:

丘敬云(1986—),女,广西桂林人,厦门大学信息科学与技术学院电子工程系硕士研究生,主要研究方向:说话人识别系统的搭建以及DSP平台实现.

相关论文

大学生就业心理特征调适方法

本文是一篇大学生论文范文,大学生类有关毕业论文题目,关于大学生就业心理特征调适方法相关毕业论文格式范文。适合大学生及就业指导及大学生。

医药领域受贿案件的特征侦查方法

该文是医学检验专业医药代表论文范文,主要论述了关于医药代表类本科毕业论文范文,与医药领域受贿案件的特征侦查方法相关论文范文参考文献。

基于LANDSAT/TM遥感影像监督分类方法

本论文是一篇关于地物论文参考文献代码,关于基于LANDSAT TM遥感影像监督分类方法相关大学毕业论文范文。免费优秀的关于地物及可靠性及参考。

县直机关文书档案的分类方法

本文是一篇档案馆论文范文,档案馆有关本科毕业论文,关于县直机关文书档案的分类方法相关开题报告范文。适合档案馆及文书档案及管理费用方面。

碎片图像字符特征提取方法

本文是一篇图像论文范文,图像相关自考毕业论文开题报告,关于碎片图像字符特征提取方法相关硕士毕业论文范文。适合图像及计算机工程及碎片方。

简园林景观建筑设计的特征与方法

本文是一篇园林建筑论文范文,园林建筑类有关大学毕业论文,关于简园林景观建筑设计的特征与方法相关专科毕业论文范文。适合园林建筑及园林建。

NetworkTraffic分类方法比较

本文是一篇网络管理论文范文,关于网络管理学年毕业论文,关于NetworkTraffic分类方法比较相关毕业论文参考文献格式范文。适合网络管理及方法。