MATLAB爱好者论坛-LabFans.com

MATLAB爱好者论坛-LabFans.com (https://www.labfans.com/bbs/index.php)
-   MATLAB新闻聚合 (https://www.labfans.com/bbs/forumdisplay.php?f=12)
-   -   基于MATLAB 的探讨 - 资源网 (https://www.labfans.com/bbs/showthread.php?t=2704)

labfans 2008-04-29 10:50

基于MATLAB 的探讨 - 资源网
 
[FONT=arial,sans-serif]
[/FONT][FONT=宋体]引言[/FONT]
[FONT=宋体]数据挖掘是一种新的从海量数据中进行知识发现的方法,目前多利用专门的数据挖掘工具如[/FONT]Clementine [FONT=宋体]、[/FONT]DBMatlb[FONT=宋体]进行数据挖掘,但利用工程数学软件一[/FONT] Matlb [FONT=宋体]、作为挖掘工具的研究不多。[/FONT] Matlb[FONT=宋体]、其有强大的数据处理功能,应用广泛面对大规模的上地利用现状空间数据,如何快速对其中的数据进行挖掘操作,除了常用的方法外,借助[/FONT] Matlb[FONT=宋体],的强大功能进行尝试计算,不失为一种新的研究途径鉴于此,我们在进行各种尝试的基础上,首先进行关联规则的挖掘尝试二借助[/FONT] Matlb[FONT=宋体]的优秀计算功能,通过在[/FONT]Matlb[FONT=宋体]中编写程序,对平阴县安城乡[/FONT]2004 [FONT=宋体]年的土地利用现状数据进行关联规则挖掘,目的在于根据支持度和置信度得到在低山丘陵区各种主要地类分布与坡度的关联规则,旨在为当地乃至其他类似区域的上地利用规划和结构优化提供决策参考。[/FONT]

1 [FONT=宋体]研究区域和研究方法[/FONT]

1.1[FONT=宋体]研究区概况和数据来源[/FONT]

[FONT=宋体]研究区位于济南市西南部的平阴县安城乡安城乡位于平阴县城东[/FONT]5000m [FONT=宋体],东与肥城市交界,东北与长清区交界,西与平阴镇、北与栗湾乡相邻该乡地处泰山西脉,黄河流域下游,是低山丘陵区,气候属暖温带季风性气候二该乡总面积[/FONT]65km2[FONT=宋体],辖[/FONT]20[FONT=宋体]个行政村,[/FONT]27 [FONT=宋体]个自然村,[/FONT]4379 [FONT=宋体]户,[/FONT]16067 [FONT=宋体]人。[/FONT]2004 [FONT=宋体]年安城乡农用地面积[/FONT]4504km2 [FONT=宋体],建设用地[/FONT]6 . 09km2[FONT=宋体].未利用地面积[/FONT] 14 . 30km2[FONT=宋体]。其中耕地面积占[/FONT]50 . 25 % [FONT=宋体],林地面积[/FONT]12.33 % [FONT=宋体],水利用地而积占[/FONT]1.21 % [FONT=宋体],未利用土地面积占[/FONT]21.86 [FONT=宋体]%。耕地组成特点是旱地占[/FONT]83.92 % [FONT=宋体],水占[/FONT]15 . 38 % [FONT=宋体],菜地占[/FONT]0 .70 %[FONT=宋体]。[/FONT]

1 . 2 [FONT=宋体]研究方法[/FONT]

[FONT=宋体]所用数据来源于[/FONT]2004 [FONT=宋体]年济南市土地利用现状更新调查的成果,为[/FONT]Matlb[FONT=宋体]拓格式数据库结构符合国家有关技术规范地类码标准为[/FONT] [FONT=宋体]《[/FONT] [FONT=宋体]全国上地分类[/FONT] [FONT=宋体]》[/FONT] [FONT=宋体](试用)。全乡有[/FONT]224 0[FONT=宋体]个图斑,每个图斑均包含图斑号、面积、周长、地类码、坡度等字段。[/FONT]

1 . 2 . 1[FONT=宋体]数据预处理和导入[/FONT]

[FONT=宋体]先用[/FONT]MapInfo [FONT=宋体]将数据库从[/FONT] MapInf[FONT=宋体]中转出为[/FONT]*.txt [FONT=宋体]格式,然后将其转为[/FONT].xls [FONT=宋体]文件。以下操作均针对保存后的文件在[/FONT]Matlal [FONT=宋体]主菜单的“[/FONT]*xle [FONT=宋体]”中选择“[/FONT]import data [FONT=宋体]”来完成[/FONT]*.xl [FONT=宋体];文件的导人,建立数组知阵。导人后“[/FONT] data [FONT=宋体]”存放[/FONT]doube[FONT=宋体]型字段,“[/FONT]textdzlta[FONT=宋体]”存放字符型字段。[/FONT]

1 . 2 . 2Matlab[FONT=宋体]下支持度和置信度的计算[/FONT]

[FONT=宋体]关联规则发现就是指从事务中寻找出现概率较高的模式来指导决策。关联规则算法本质上是一种对条件概率、联合概率的方法的简化。[/FONT]

2 [FONT=宋体]结果分析[/FONT]

[FONT=宋体]由上述程序对安城乡的土地利用现状更新数据库进行运算,可得关联规则[/FONT]X => Y [FONT=宋体]的支持度和置信度如表[/FONT]1 [FONT=宋体]所示。[/FONT]

[FONT=宋体]由表[/FONT]l [FONT=宋体]可知,在坡度级[/FONT]O[FONT=宋体]的土地,土地利用类型最为丰富。土地的总面积为[/FONT]29.0lkm2[FONT=宋体],占整个研究区总面积的[/FONT]49.43[FONT=宋体]%。研究区有[/FONT]24 [FONT=宋体]种土地利用类型,其中[/FONT]21 [FONT=宋体]种在坡度上置信度最高,其支持度均在[/FONT]49[FONT=宋体]%一[/FONT]50[FONT=宋体]% 之间。它们分别是菜地、果园、桑园、其他园地、有林地、灌木林地、末成林造林地、苗圃、坑塘水面、晒谷场用地、农村居民点、独立工矿用地、特殊川地、水库 水面、水工建筑用地、荒草地、裸岩石砾地、其他未利用土地、河流水面、苇地和滩涂其中,桑园、未成林造林地、苗囤、坑塘水面、特殊用地、水工建筑用地、河 流水面、苇地和滩涂在坡度级[/FONT]O [FONT=宋体]上置信度达到[/FONT]100 [FONT=宋体]%。其余置信度[/FONT]90 [FONT=宋体]%以上的有其他园地[/FONT]( 98 . 96 % [FONT=宋体])、晒谷场用地([/FONT]95 . 27 % [FONT=宋体])、独立工矿用地[/FONT]( 9541 % [FONT=宋体])、水库水面([/FONT]97 . 57 % [FONT=宋体])和其他未利用上地[/FONT]( 9299 % [FONT=宋体])。置信度[/FONT]80 [FONT=宋体]%以上的有果园([/FONT]88 . 95 % [FONT=宋体])、有林地([/FONT]8871 % [FONT=宋体])、灌木林地([/FONT]89 . 75 % [FONT=宋体])、荒草地[/FONT]( 88 . 89 % [FONT=宋体])和裸岩石砾地([/FONT]80 . 28 % [FONT=宋体])。耕地和农村居民点在坡度级。上置信度分别为[/FONT]7380 [FONT=宋体]%和[/FONT]63 . 01 %[FONT=宋体]。[/FONT]
[IMG]http://www.lrn.cn/bookscollection/magazines/maginformatization/2008maginformatization/xinxihua200802/200804/W020080429378866138084.jpg[/IMG]
[FONT=宋体]由以上结果可知,该地区人们的生产和生活多集中在坡度蕊[/FONT]2o [FONT=宋体]的土地卜而在坡度级为[/FONT]0[FONT=宋体]的土地上,荒草地的面积最大,占总面积的[/FONT]35 . 24 % [FONT=宋体];其次是有林地,占总面积的[/FONT]2171 [FONT=宋体]%。[/FONT]

[FONT=宋体]水浇地在坡度[/FONT]2o[FONT=宋体]一[/FONT]6o[FONT=宋体]上的置信度最高为[/FONT]58 . 74 % , [FONT=宋体]其支持度为[/FONT]22 . 57 [FONT=宋体]%二旱地在坡度[/FONT]60[FONT=宋体]一[/FONT]100[FONT=宋体]上的置信度最高为[/FONT]3647 % [FONT=宋体],其支持度为[/FONT]45.15[FONT=宋体]%。畜禽饲养地在坡度[/FONT]100[FONT=宋体]一[/FONT]5o[FONT=宋体]上的置信度最.高为[/FONT]51 . 93 % [FONT=宋体],其支持度为[/FONT]17 . 59 %[FONT=宋体]。[/FONT]

[FONT=宋体]在坡度>[/FONT]250[FONT=宋体],早地的分布面积.片整个旱地的[/FONT]3.23 [FONT=宋体]%。说明该地区应该将这部分地退耕还林,以利水土保持并且林地,有林地和疏林地在坡度级[/FONT]4[FONT=宋体]、[/FONT]5[FONT=宋体]上均零星分布,说明该乡的植树造林工作还需加强。[/FONT]

3 [FONT=宋体]结论和建议[/FONT]

[FONT=宋体]利用[/FONT]Mallal[FONT=宋体]进行数据挖掘与利用专门的数据挖掘具相比,基于[/FONT]Mallal[FONT=宋体]、的数据挖掘提高了数据处理的速度和效率,增强了[/FONT]Matlab[FONT=宋体]的分析力,拓宽了[/FONT]Mallal[FONT=宋体]的应用面,也能让数据挖掘有效利用更大范围的数据,得到更具有普遍意义的规则和模式以供决策.[/FONT]

[FONT=宋体]参考文献:[/FONT]
[1][FONT=宋体]郑新奇,李新运.数据挖掘软件现状特点与发展趋势[[/FONT]EB/OL[FONT=宋体]][/FONT] [FONT=宋体],中国科技论文在线,[/FONT]2005 [FONT=宋体]一[/FONT]06 [FONT=宋体]一[/FONT]13 .
[2][FONT=宋体]胡智文,邓铁如.余增亮等.在[/FONT]Vll [FONT=宋体]应用程序中集成[/FONT]MATLAB[J] [FONT=宋体].计算机工程与应用.[/FONT]2003 , ( 7 ) : l04[FONT=宋体]一[/FONT]l06
[3][FONT=宋体]中华人民共和国国土资源部.全国上地分类(试行)[/FONT][Z]
[FONT=arial,sans-serif][SIZE=-1][/SIZE]
[/FONT]

[URL="http://news.google.cn/news/url?sa=T&ct=cn/0-0&fd=R&url=http://www.lrn.cn/bookscollection/magazines/maginformatization/2008maginformatization/xinxihua200802/200804/t20080429_224775.htm&cid=0&ei=Co0WSLKDGY7a6APow9WXDQ&usg=AFrqEzcQJATwJetB3K_OYT_Y32_l2IZaSA"]更多...[/URL]


所有时间均为北京时间。现在的时间是 11:23

Powered by vBulletin
版权所有 ©2000 - 2025,Jelsoft Enterprises Ltd.