计算机病毒检测中Bayes分类技术探究

时间:2024-02-24 点赞:44717 浏览:87178 作者原创标记本站原创

本文是一篇计算机病毒论文范文,计算机病毒方面有关毕业论文参考文献格式,关于计算机病毒检测中Bayes分类技术探究相关大学毕业论文范文。适合计算机病毒及参考文献及概率统计方面的的大学硕士和本科毕业论文以及计算机病毒相关开题报告范文和职称论文写作参考文献资料下载。

摘 要:贝叶斯分类算法是利用概率统计知识进行分类的分类算法,因此如何获得概率的初始知识是该算法进行分类的一个难点.这类算法利用贝叶斯定理来计算未知类别样本所属类别的可能性.本文分析了计算机病毒检测中应用贝叶斯分类技术的方法.

关 键 词:计算机病毒;检测;Bayes分类技术

中图分类号:TP309.5文献标识码:A文章编号:1007-9599(2011)24-0000-01

BayesClassificationTechniquesAnalysisofComputerVirusDetection

ShiLei

(66483TroopsofPLA,Beijing100093,China)

Abstract:Bayesianclassificationalgorithmistheuseofprobabilityandstatisticsknowledgeclassificationalgorithm,sotheinitialknowledgeofhowtoobtaintheprobabilitythatthealgorithmtoclassifyadifficult.ThetypeofalgorithmusesBayes'theoremtocalculatethepossibilityofunknownclasssamplecategory.ThispaperanalyzestheapplicationofBayesianclassificationtechniquesinputervirusdetectionmethod.

Keywords:Computerviruses,Detection,Bayesclassificationtechniques

贝叶斯分类是结合了统计学和贝叶斯网络的分类方法,它基于如下假定:待考察的变量遵循某种概率分布,且可以根据这些概率及已观察到的数据进行推理,以做出最优决策.贝叶斯分类器可以发现变量问的潜在关系,预测类成员变量的可能性,即给定样本属于某个类的概率.

一、贝叶斯分类的原理

贝叶斯定理成为依赖性很强的独立性假设前提,因此,属性之间的独立性是分类准确与否的另一个难点和重点.同时确定贝叶斯最优假设的计算代价比较大(与候选假设数量成线性关系).

在朴素贝叶斯学习算法中一般用出现频度代替概率,则可知道概率的初始知识,即可进行分类.朴素贝叶斯算法分类的准确度取决于属性之间的独立性,独立性好的准确度高,否则偏低.另外和决策树相比,朴素贝叶斯没有分类规则输出.由于贝叶斯算法过于依赖属性相互之间的独立性,为了减少对独立性的依赖,TAN算法被提出.TAN算法通过发现属性间的关联来减少朴素贝叶斯中对任意属性间独立性的依赖.TAN在朴素贝叶斯网络结构基础上通过增加属性对之间的关联来实现.由于TAN算法考虑了两两属性的关联性,该算法对属性间的独立性依赖有一定程度的减少,但是可能存在的其他方面的关联性并未涉及,因此适用范围有限.

二、基于朴素贝叶斯分类的异常检测方法

设X是类标识号未知的数据样本,如X可以表示为流量异常,H为某种假定,p可以表示为系统当前遭受人侵,则我们可以确定p(H/X).p(H/X)表示当流量异常时,当前系统遭受入侵的概率.p(H/X)是后验概率,即条件X下H的后验概率.p(H)表示系统遭受入侵的概率,p(X/H)表示系统遭受入侵时流量发生异常的概率.p(X)表示流量发生异常的概率.其中p(X)、p(H)、p(X/H)是可以根据历史数据计算得到的,在这种情况下,贝叶斯定理非常有用,我们可以根据这个定理计算出后验概率p(H/X).

贝叶斯算法本身比较简单,下面简单介绍一下贝叶斯算法在入侵检测系统中的实际应用.在入侵检测系统中,数据样本往往具有多个属性,每个属性表示系统不同方面的特征(如流量情况、磁盘I/O的活动情况,系统中页面出情况),如样本X有A1,A2等An,Ai的值为0或者1,0表示正常,1表示异常.i为整数且大于等于l小于等于n.H1,H2分别表示为当前系统正遭受人侵和当前系统正常.这样我们要判断当前系统是否遭受入侵,只要计算p(H1/X)和p(H2/X)的值,如果p(H1/X)大于p(H2/X),则表示当前系统正遭受入侵,如果p(H1/X)小于p(H2/X),则表示当前系统正常.根据贝叶斯定理,我们计算p(H1/X)时,先要计算p(X/H1),而要计算p(Al,A2,等,An/H1),计算p(Al,A2,等,An/H1)的开销非常大,为降低计算p(Al,A2,等,An/H1)的开销,可以做条件独立的朴素假定.即假定条件Al,A2,等,An是彼此独立的,属性间不存在依赖关系.这样

同理,我们可以计算出p(XH/㈠,这样我们就可以根据贝叶斯定理计算出p(H,/X)和p(H2/X)了.需要注意的是,我们在使用这个方法时要对状态数据进行预处理,如网络流量超过一定值时就认为是异常(该属性值记为1),否则为正常(值记为o).

三、方法评价

基于贝叶斯聚类异常检测方法通过在数据中发现不同类别数据集合,这些类反映-厂基本的因果机制(同类的成员比其他的更相似),以此就可以区分异常用p类,进而推断入侵事件发生来检测异常入侵行为.Cheeseman和Stutz在1995年开发的自动分类程序(AutoClassProgram)是一种监督数据分类技术.AutoClass实现了使用贝叶斯统计技术对给定的数据进行搜索分类.这种方怯尽可能地判断处理产生的数据,没有划分给定数据类别,但是定义了每个数据成员.其优点是:(1)根据给定的数据,AutoClass自动地判断决定尽可能的类型数目;(2)不要求特别相似测量、停顿规则和聚类准则;(3)可以自由地混合连续的及离散的属性.统计入侵异常检测对所观测到的行为分类处理.到目前为止,所使用到的技术主要集中于监督式的分类,这种分类是根据观测到的用p行为建立起用p轮廓.而贝叶斯分类方法允许最理想化的分类数、具有相似的轮廓的用p群组以及遵从符合用p特征集的自然分类.但是,该方法比较新,在入侵检测系统中还没有实现测试.自动分类程序怎样处理好固有的次序性数据(如审计跟踪)以及将统计分布特性植入分类中等方面,效果并不是十分明显.当自动分类程序支持处理在线数据时,对新的数据能否递增式地分类或者是否立即需要全部输入数据等这些问题的处理还尚未定论.由于统计的固有的特性,自动分类程序还存在选定合适的异常阈值和用p逐步地影响类型分布能力的困难.


相关论文

关于计算机病毒检测技术

本文是一篇计算机病毒论文范文,关于计算机病毒类毕业论文范文,关于关于计算机病毒检测技术相关学士学位论文范文。适合计算机病毒及计算机及。

计算机病毒检测技术

本文是一篇计算机论文范文,关于计算机毕业论文开题报告,关于计算机病毒检测技术相关毕业论文开题报告范文。适合计算机及计算机病毒及计算机。

常见计算机病毒检测预防

本文是一篇计算机病毒论文范文,关于计算机病毒方面硕士学位论文,关于常见计算机病毒检测预防相关硕士论文范文。适合计算机病毒及计算机及计。

计算机软件安全漏洞检测技术探究

本文是一篇计算机软件论文范文,关于计算机软件相关本科毕业论文范文,关于计算机软件安全漏洞检测技术探究相关电大毕业论文范文。适合计算机。

计算机病毒防范技术的探究

本文是一篇计算机病毒论文范文,计算机病毒相关硕士学位论文,关于计算机病毒防范技术的探究相关毕业论文开题报告范文。适合计算机病毒及计算。

计算机数据库入侵检测技术探究

本文是一篇计算机数据库论文范文,计算机数据库相关毕业论文题目,关于计算机数据库入侵检测技术探究相关本科毕业论文范文。适合计算机数据库。

计算机病毒的分类与防范

为您写计算机毕业论文和职称论文提供关于计算机相关硕士学位毕业论文范文,与计算机病毒的分类与防范相关论文范例,包括关于计算机及计算机病。

计算机病毒技术概述

本文是一篇计算机病毒论文范文,关于计算机病毒相关在职毕业论文开题报告,关于计算机病毒技术概述相关硕士论文范文。适合计算机病毒及计算机。