数据挖掘技术在农业生产决策

时间:2024-03-04 点赞:44284 浏览:85293 作者原创标记本站原创

本文是一篇农业生产论文范文,农业生产类有关毕业论文格式,关于数据挖掘技术在农业生产决策相关硕士学位毕业论文范文。适合农业生产及计算机及数据库方面的的大学硕士和本科毕业论文以及农业生产相关开题报告范文和职称论文写作参考文献资料下载。

摘 要:基于农业生产中积累的大量的数据信息,构建了基于数据仓库技术和数据挖掘技术的农业生产决策支持系统.该系统通过数据仓库存储各种与农业生产有关的多维的数据,利用联机分析处理模块实现多维数据分析,然后通过数据挖掘技术中的决策树分类分析、关联分析以及聚类分析等方法从数据仓库中获得决策知识库.

关 键 词:农业生产;数据挖掘;数据仓库;决策支持系统

0引言

我国作为农业大国,三农问题一直是国民经济和社会发展各项工作中的重中之重,随着科技的进步以及计算机技术在农业生产中的广泛应用,农业科技人员在研究过程中积累了大量有价值的农业数据资源,其中包括各种作物的苗情、土情、肥情、病虫害、气象、灾害和市场行情等诸多方面.但是由于农业生产的复杂性,使得这些农业数据资源具有大量、多维、动态、不完整、不确定等特性,使得从这些海量的数据中抽取模式、找出数据变化的规律和数据之间的相互关系、建立农业决策支持系统等工作变得越来越困难,这产生了所谓的“数据丰富而知识贫乏”的现象.[1]在农业生产决策支持系统中引进数据挖掘技术,从这些海量的农业数据资源中挖掘出一些随诸因素动态变化而产生的新的指导农业生产的规律,农业科技人员可以根据这些规律确定正确的农业生产策略,从而推动农业生产,产生更大的经济效益.

1数据挖掘技术概述

数据挖掘(DataMining,DM)[2],就是从大量的、不完全的、有噪声、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道、但又是潜在有用的信息和知识的过程.数据挖掘是一个融合了数据库技术、人工智能、机器学习、统计学、知识工程、面向对象方法等新技术的多学科交叉的研究领域.从商业应用的角度看,数据挖掘是一种崭新的商业信息处理技术.目前,国内外在农业领域数据挖掘的研究涉及面不广,研究还不够深入.对于将数据挖掘技术应用到农业生产决策支持系统的中的研究,关注度较小,有些研究还处于探索阶段,并且对挖掘算法的研究还是不系统、不全面,分析原因,主要是与农业信息化建设的滞后,有着一定的联系.

2数据挖掘技术在农业生产决策支持系统中的应用

决策支持系统(DecisionSupportSystem,DSS)是基于计算机的信息系统,其主要目的是为知识工作者提供奠定明智决策的基础的信息.[3]农业生产决策支持系统主要是指以一个区域的农业经济为研究对象,以农业可持续发展为决策目标,综合运用计算机数据挖掘技术、管理科学、农学、农业系统工程以及运筹学等多种科学知识,针对农业生产中的非结构化或半结构化决策问题,通过对以往农业技术人员积累的大量的数据资源进行模型计算、列举可能方案等方式,为农业生产的管理者做出正确决策提供帮助的计算机管理系统.[4]

2.1农业生产决策支持系统的总体设计

针对农业数据资源的特点,在农业生产决策支持系统中引入数据仓库技术,从而建立基于数据仓库的农业生产决策支持系统,决策支持系统的基本结构如图1所示.用户可以通过客户端子系统登录系统,提出一些农业生产方面的决策问题,通过人机交互形式输入到计算机中,由决策支持系统产生决策规则.农业生产决策支持系统的内部结构主要是:由以往农业生产数据库积累的各种数据资源,经过对数据进行的抽取、清理、转换、载入等操作建立面向农业生产为主题的数据仓库,根据决策的需要,确定挖掘的任务和目的,并应用各种数据挖掘算法对数据仓库中的相关数据进行精简、提取和预处理,最终挖掘出新的、有效的信息、知识或规则加入到知识库中,以便决策者进行查询请求,最后形成决策结果到交互系统中.

2.2农业生产决策支持系统数据仓库模型

数据仓库的逻辑数据模型是多维数据模型,这也正好适合农业生产数据信息的多维性的特性,常见的由星型模型、雪花模型、多主表结构等,操作人员可以根据数据的具体情况选择适合的数据模型.根据对农作物数据库的分析,确定数据仓库的基本主题有:作物生长时间、室外气候、作物生长状态、病虫草害以及田间管理.根据农作物生长的多维数据特点,本文选取星型模型,这种模型建模方便,并且支持用户从多个维度对数据进行查询分析.作物生长时间、室外气候、作物生长状态、病虫草害以及田间管理这些关于农作物的数据信息就构成了星型模型中的事实表,维表则是围绕农作物数据信息的扩展.数据仓库模型见图2.

2.3建立农业生产决策支持系统

首先对于联机分析处理(OLAP)模块的建立,本文利用MicrosoftOLAPAnalysisServices服务端组件,根据星型数据仓库中的事实表和维表,对数据仓库中的数据进行切片、切块、钻取和旋转等操作,从而完成对气候维、生长时间维、生长状态维、病虫草害维、田间管理维的建立和处理.OLAP模块对数据仓库中的多维数据进行数据分析,并能以图形、报表等形式展现分析结果.

数据挖掘系统能够挖掘多种类型的模型,以适应农业生产中农作物星型数据仓库的需求和应用.使用SQLServer2005AnalysisServices(SSAS)创建关于农业生产方面的复杂的数据挖掘解决方案.本系统根据农作物的数据仓库模型的应用需要,对模型进行了决策树分类分析、关联分析、聚类分析等类型的挖掘.

2.3.1决策树分类分析.决策树(decisiontree)是一个类似流程图的树型结构,树中包含三种节点类型:根节点、内部节点以及叶节点.其中树中的每个内部节点都代表着对一个属性的测试,用以区分具有不同特性的记录.叶节点则代表某个类或者是类的分布,最上面的节点就是根节点.决策树构造的输入是一组带有类别标记的数据,往往构造的结果是一棵二叉树或多叉树.在农作物发生病虫草等方面的分析,可以通过决策树分类分析对农作物灾害数据资料中大量的历史数据处理、挖掘出蕴含其中的对防治病虫草害有价值的信息,从而为诊断和防治提供更准确的决策服务.

2.3.2关联分析.若两个或多个数据项的取值之间重复出现且概率很高时,它就存在某种关联,可以建立起这些数据项的关联规则.在大型数据库中,这种关联规则是很多的,需要进行筛选,一般用“支持度”和“可信度”两个阈值来淘汰那些无用的关联规则.在农作物信息数据仓库中,SSAS提供了关联算法,可以根据农作物以往发生病虫草害的疾病和特征分析,挖掘出在一段时间内,气候环境与特定农作物发病之间的关联规则.

2.3.3聚类分析.聚类就是把一组对象按照属性值划分成一系列有意义的子集的过程.它所采用的划分原则是保持最大的组内相似性和最小的组间相似性,即不同的聚类中的数据尽可能地不同,同一聚类中的数据尽可能相似.所以,聚类有助于建立集合的细分.SSAS提供聚类的分段算法,先对农作物数据仓库模型中的关系进行标识,并根据这些发生病虫草害的病例数据分组为包含类似特征的分类组.


3结论

本文对数据挖掘技术在农业生产决策支持系统中的应用进行了研究,构建了基于数据仓库和数据挖掘的农业生产决策支持系统模型,并对该模型进行了介绍.该系统具有一定的辅助决策功能,用户可以通过联机分析处理模块和数据挖掘模块从多角度、多侧面地分析数据库中的数据,通过该系统可以挖掘和发现隐含的信息,对信息作出决策树分类分析、聚类分析以及关联分析等一系列数据挖掘操作,从而获得对农业生产有决策作用的信息,指导人们进行农业生产实践.

相关论文

临床医学中数据挖掘技术的运用

此文是一篇临床医学论文范文,临床医学有关论文范文,与临床医学中数据挖掘技术的运用相关毕业论文参考文献格式。适合不知如何写临床医学及数。

用户关系管理中数据挖掘技术的应用

本论文为关于数据库毕业论文格式范文,关于用户关系管理中数据挖掘技术的应用相关毕业论文,可用于数据库论文写作研究的大学硕士与本科毕业。

软件工程数据挖掘技术

本文是一篇软件工程论文范文,关于软件工程电大毕业论文,关于软件工程数据挖掘技术相关研究生毕业论文开题报告范文。适合软件工程及软件开发。

软件工程中数据挖掘技术的应用

该文为数据类有关学年毕业论文范文,与软件工程中数据挖掘技术的应用相关学术论文集前言,可作为论文前言专业数据论文写作研究的大学硕士与。

电子商务中的数据挖掘技术

本文是一篇电子商务论文范文,电子商务方面有关学士学位论文,关于电子商务中的数据挖掘技术相关函授毕业论文范文。适合电子商务及数据库及技。