一种基于改进的密度聚类的区域数据可视化方法

时间:2024-02-28 点赞:50896 浏览:105118 作者原创标记本站原创

该文是电子商务专业电子商务论文范文,主要论述了关于电子商务毕业论文参考文献格式,与一种基于改进的密度聚类的区域数据可视化方法相关论文范文集,适合电子商务及数据及密度方面的的大学硕士和本科毕业论文以及电子商务相关开题报告范文和职称论文写作参考文献资料下载。

摘 要:目前的可视化应用不管动态还是静态可视化,已经存在二维图形展示和点密度展示几种形式,而点密度已经成为作为体现密度特征的最有力手段.但目前的一般手段都只是简单的在特定区域内实现随即点的输出.由于数据本身的密度属性与其所属区域存在内在属性关联,本文在前期通过密度处理分析进行聚类,将数据集进行归类划分后在对应区域进行判断输出实现可视化,实验证明具有更符合区域特征的可视化效果,并且时间和空间复杂度明显小于直接进行点密度可视化输出的算法.

关 键 词 :可视化;点密度;聚类

中图分类号:TP391.41

近年来,随着数据仓库技术、网络技术、电子商务技术等的发展,可视化技术得到了更深入的发展,所谓数据可视化是对大型数据库或数据仓库中的数据的可视化,它是可视化技术在非空间数据领域的应用,使人们不再局限于通过关系数据表来观察和分析数据信息,还能以更直观的方式看到数据及其结构关系[1].

在电力、医学、农业、现代服务业等应用系统中,往往需要把相应区域数据进行可视化展示,以更直观形象的反应区域数据分布问题.区域数据的可视化比较适合于用点密度图来描述,更符合人眼对密度判定的感知与决策.用点密度图来显示区域数据密度图上通常用打上圆点或其它符号在给定的特定区域描绘特有的数据,符号都可以代表一个实体或一个群体.点密度图对表现特有数据时它们通常可以在区域之间进行比较,这些符号或圆点并没有明确的指所在的位置它们通常是代表一定范围之内的多边形区域里的数据.通过对相应行业区域数据进行可视化处理,可以为行业决策分析发展提供更稳定可靠的分析依据.本文提供一种基于密度聚类的区域数据可视化方法,通过该方法得到区域数据密度可视化的直观效果图,可以为行业资源的合理分配、决策分析发展提供更稳定可靠的依据.


1.创建多维区域数据集

创建用于聚类和数据负荷分析的多维数据仓库集D[2],主要包括具有行业代表特征的数据子集、相关联的气象信息数据子集、相关联的地区信息代码子集等,以多维方式建立的数据模型有利于简化业务分析复杂度和提高数据查询性能.

图1 多维区域数据集示意图

图2 三维立体信息数据模型图

2.基于密度计算的聚类模型

(1)对多维数据仓库集D,按照如下聚类目标的估计模型[3]确定聚类中心点: ,xi,xj为数据集D中的数据点.

其中σ选取0.5,选取密度最大的前k个数据作为初始聚类中心点,形成D,D包含k个初始类子集{d1,d2,等dk}.

(2)依次计算初始类子集中每一个对象sl到k个种子点的距离,其中:l等于{1,2,等,n},将sl逐个分派到其最近均值的类中去,重新计算接受新对象的类和失去对象类的均值 (sl∈di).

(3)重复第(2)步,直到各类再无元素进出[4].

3.区域数据可视化

(1)对于一定范围内地理区域,形成相应的不规则多边形的集合V[5],并计算出V中各个多边形Vi(i∈l:n)的边界条件,即多边形Vi各个顶点x,y坐标的最大值和最小值{xmin,xmax,ymin,ymax}.

(2)对于每个di(i∈l:k)中的点P(x,y),读取点P的坐标并遍历集合V,确定点P坐标的范围{xmin

(3)对于点P和V,从P点引出向右射线,判断P与不规则多边形Vi(Vi∈V)边界的交点数,如果焦点个数为0或偶数则点P不在Vi对应区域内.若P点的向右射线恰好过边界顶点,则可以将向右射线顺时针或逆时针旋转一个小角度,继续前述步骤进行判断(但要求移动后的P点属性没有发生变化);

(4)在Vi中打印输出P点,重复本步骤,直到{d1,d2,等dk}中所有数据点打印输出完毕.

图3 区域数据密度点生成流程图

3.结束语

本文中的算法适用于电力、医学、农业、现代服务业中,在商业网络应用中,可就产品线上线下订单及物流分布情况进行特点分析,可有助于相应的产品调度配送方案调整.通过本文中方法得到区域数据密度可视化的直观效果图,可以为行业资源的合理分配、决策分析发展提供更稳定可靠的依据.例如可以在所属地理辖区内实现对任意时刻任意地区的电力负荷信息的总览,便于实现宏观调控和决策.对任意时刻任意地区的电力故障信息的总览,便于实现预防应对和抢修决策.在农业应用领域中,区域数据可视化可以与遥感监测等进行紧密结合,为农作物种植形态的结构规划提供决策服务.

相关论文

一种改进的快速聚类方法

本文是一篇外贸企业论文范文,外贸企业方面有关专科毕业论文开题报告,关于一种改进的快速聚类方法相关毕业论文开题报告范文。适合外贸企业及。

聚类在话务量预测中的应用

本论文是一篇话务量类论文文献综述范文,关于聚类在话务量预测中的应用相关在职研究生毕业论文范文。免费优秀的关于话务量及样本及社会学方。

基于聚类对多个国家空调总需求量的

本文是一篇统计分析论文范文,关于统计分析相关学士学位论文,关于基于聚类对多个国家空调总需求量的相关本科论文范文。适合统计分析及参考文。

基于聚类的学生学习相关性

此文是一篇统计分析论文范文,统计分析类有关论文例文,与基于聚类的学生学习相关性相关毕业论文参考文献格式。适合不知如何写统计分析及大学。

聚类法在市场营销中的应用

该文是仓储管理专业市场营销论文范文,主要论述了市场营销方面本科毕业论文范文,与聚类法在市场营销中的应用相关论文例文,适合市场营销及。