一种基于曲线相似度进行业务流量监测的方法

时间:2024-02-23 点赞:48644 浏览:98838 作者原创标记本站原创

本文是一篇统计学论文范文,统计学方面本科毕业论文范文,关于一种基于曲线相似度进行业务流量监测的方法相关电大毕业论文范文。适合统计学及业务及统计分析方面的的大学硕士和本科毕业论文以及统计学相关开题报告范文和职称论文写作参考文献资料下载。

摘 要:提出了一种基于业务流量监测的方法,该方法屏蔽业务系统内部复杂的结构,以业务的有效性为监测的重点.该方法运用了统计学中的相关系数的概念来建立曲线相似度的数学模型.经过实验数据的相关验证,该方法在业务流量监测上非常是有效的.

关 键 词:业务流量监测;相关系数;曲线相似度;增值业务

Abstract:Inthispaper,anewmethodbasedonserviceflowsupervisionispresented.Inthiethod,theplexinternalstructureisshielded,andtheeffectivebusinessisthekeyofmonitoring.Amathematicalmodelaboutcurvecorrelationcoefficientisbuilttotestserviceeffectivenessundertheguidanceofinterrelatedcoefficientinstatistics.Experimentsindicatethatthisapproachiseffective.

Keywords:serviceflowsupervision;interrelatedcoefficient;curvecorrelationcoefficient;value-addedservice

随着电信企业的重组,各运营商间的业务逐渐趋向同质化,而提高服务质量、提升客户满意度是企业取胜的重要法宝.对于网络部的维护人员而言,维护模式也将发生变化,从传统的面向设备的维护模式转变为面向业务的维护模式,即不仅关注设备的运行状况,更要关注用户是否能正常使用承载在设备之上的业务.面向业务的维护模式,客观要求维护部门在用户无法正常使用某业务时,能够快速解决以及先于用户投诉通知部门.

但是在目前的维护工作中,由于承载在网络上的数据业务(如气象通、农信通、通用分组无线服务技术(GPRS))完成一个业务流经的网络设备链条较长,如气象通业务完成一个业务需要流经全球移动通信系统(G)核心网、短信中心、数据通信网络(DCN)、短信网关、移动信息服务中心(MISC),城域网等设备,如图1所描示.因此,在这些设备中任何一个出现故障都可能导致业务出现异常[1-2].

由于在数据业务方面传统异常发现机制存在局限,导致业务异常的发现往往滞后于用户批量投诉,因此引发的投诉具有范围广、历时长、投诉量大的特点.

1基于业务流量的监测

文章探讨了一种新的监测方法,该方法可以屏蔽业务系统内部复杂的结构,以业务的有效性为监测的重点,并将关注点移至与用户的最近端,完全以用户的感受来衡量业务是否正常.整个业务监测包含2个过程:第1个过程为建模过程,在业务流经的最后网络环节选取历史正常值为样本空间,统计单位时间段业务量,构建各业务流量模型,消除重大事件、节假日等情况下异常值的干扰;第2个过程为监测过程,准实时取得业务流量,通过一定的数学算法模型来评估业务及网络是否存在异常状况[3].

根据统计学的原理,某类数据业务的业务流量随着时间段有规律地进行变化.如果业务量在某个时间段突然出现异常变化,一般可以认为业务出现了故障[4].


图2是最简单的、通过业务流量来判断业务是否异常的方法.该方法通过建模环节来获取某类短信业务量的模型,然后通过一定的比例(例如10%)来确定上下限值,最后通过实际测试的数据来进行对比,一旦超过门限值就认为业务流量存在问题.基于上下门限的判断方法虽然在理论上可以实现,但是在实际应用中,数据的上下波动还是非常频繁的,因此需要寻找一种新的、有效的数学方法[5].

2相似度介绍

相似度是用以度量两组数据变化趋势相似程度的一个数值度量,其取值范围为[-1,1].相似度的计算方法可以基于统计学中的相关系数的一些概念.

(1)数学期望

数学期望是指离散型随机变量的一切可能的取值Xi(随机变量)与对应的概率p(等于Xi)之积的和.

X1,X2,X3,等,Xn为随机变量数据,p(X1),p(X2),p(X3),等p(Xn)是随机变量数据的概率函数.

通过证明,得出:

E(X)等于(X1+X2+...+Xn)/n(2)

这说明数学期望就是一组数据的算术平均值.

(2)方差

设X是一个随机变量,若[E{X-E(X)}]存在,则称[E{X-E(X)}]为X的方差,则可得出

D等于[E{X-E(X)}](3)

(3)协方差

协方差分析是建立在方差分析和回归分析基础之上的一种统计分析方法.协方差与方差之间的相关关系为:

[Cov(X,Y)等于E{[X-E(X)][Y-E(Y)]}](4)

(4)相关系数

相关系数是变量之间相关程度的指标.相关系数的取值范围为[-1,1].值越大,误差越小,变量之间的线性相关程度越高;值越接近0,误差越大,变量之间的线性相关程度就会越低.

相关系数又称皮(尔生)氏积矩相关系数,是用来说明两个现象之间相关关系密切程度的统计分析指标.相关系数用希腊字母γ表示,γ值的范围为[-1,1].γ>0为正相关,γ<0为负相关,γ=0表示不相关.γ的绝对值越大,相关程度越高.两个现象之间的相关程度,一般划分为4级:如两者呈正相关,γ呈正值;γ=1时为完全正相关;如两者呈负相关则γ呈负值;γ=-1时为完全负相关.完全正相关或负相关时,所有图点都在直线回归线上,点子的分布在直线回归线上下越离散,γ的绝对值越小.当例数相等时,相关系数的绝对值越接近1,相关越密切;越接近于0,相关越不密切.当γ=0时,说明X和Y两个变量之间无直线关系[6-7].[γxy=Cov(X,Y)/D(X)D(Y)](5)

3基于曲线相似度的业务

流量监测

根据统计学的原理,统计的数据样本数量越大,统计的准确度则越高.

每天运行在移动设备上各类数据业务的数量是非常巨大的.我们设想,如果某一天从某个时间点开始业务曲线与平时的业务曲线相似度低于设定的门限,我们则认为业务出现了异常情况,应及时通知维护人员进行处理.

文章研究的实验平台基于matlab7.0,并采用无异常历史数据作为分析样本,对多项业务数据进行了分析.为了保证监控及检验结果有效,实验计算当前实时监测的业务发送量与相同时刻前5天采集的业务发送量,以及历史平均业务发送量之间的相关系数共6组数据,取其相关系数最大值为参考值.如果参考值低于阈值,则说明当前时刻业务流量出现异常[8-10].

首先以手机报日业务量以及某市GPRS日业务量为例(如图3、图4),经计算,相关系数值分别为0.9692和0.9764.

通过曲线比较以及比较值可以分析得出结论,当前业务发送量异常状况.

下面通过对业务量发送异常状况数据进行分析,说明本方法监控效果的有效性.6月21日WAP网关出现故障,导致某市GPRS业务无法正常使用.计算全天数据与历史数据的相关系数,得出参考值为0.8866.趋势对照图如图5所示.

WAP网关故障发生在10:55左右.我们分别计算了10:30和11:00这两个时间点的曲线相似度,分别为0.9950,0.8430.通过相似度的计算,很容易发现在10:30―11:00,GPRS业务出项了异常情况.趋势对照图如图6、图7.

4结束语

文章提出基于统计学中相关系数的相似度度量方法,通过计算当前时刻业务发送量与历史正常数据之间的相关系数,判定当前业务发送量是否处于稳定状态.当参考值低于正常阈值时系统发出告警,从而完成对业务流量模型的实时监控.通过实验数据的验证,证明本方法是非常有效的.

相关论文

金融租赁业务的会计处理方法

本文是一篇会计核算论文范文,会计核算方面本科毕业论文范文,关于金融租赁业务的会计处理方法相关大学毕业论文范文。适合会计核算及新会计准。

超市配送中心业务流程优化思路方法

本文是一篇库存管理论文范文,关于库存管理类专升本毕业论文开题报告,关于超市配送中心业务流程优化思路方法相关毕业论文的格式范文。适合库。

证券公司经纪业务营销策略

本文是一篇营销策略论文范文,营销策略方面有关毕业论文提纲,关于证券公司经纪业务营销策略相关学年毕业论文范文。适合营销策略及营销渠道及。

作文批改的四种方式

关于作文教学及学生及教师方面的免费优秀学术论文范文,关于作文教学类sci论文润色修改,关于作文批改的四种方式相关论文范文,对写作作文教。