地理空間數(shù)據(jù)挖掘技術(shù)在果樹生態(tài)區(qū)域選擇中的應(yīng)用
一、前言
近年來,隨著“數(shù)字空間區(qū)域”的建設(shè)和地理信息系統(tǒng)(Geography Information System,GIS)技術(shù)的快速發(fā)展,積累了大量與空間位置相關(guān)的基礎(chǔ)地理空間數(shù)據(jù),如數(shù)字線劃圖(DLG)、數(shù)字高程模型(DEM)、數(shù)字正射影像圖(DOM)等數(shù)字產(chǎn)品。如何從如此海量的空間數(shù)據(jù)庫中挖掘和派生出更有價值的信息,為科學(xué)研究和生產(chǎn)實踐服務(wù),成為當(dāng)前空間數(shù)據(jù)挖掘技術(shù)研究的重要課題。
二、數(shù)據(jù)挖掘
2.1數(shù)據(jù)挖掘(Data Mining)
又稱為數(shù)據(jù)庫中的知識發(fā)現(xiàn)(Knowledge Discovery in Database,KDD),就是從大量數(shù)據(jù)中獲取有效的、新穎的、潛在有用的、最終可理解的模式的非平凡過程,簡單的說,數(shù)據(jù)挖掘就是從大量數(shù)據(jù)中提取或“挖掘”知識。數(shù)據(jù)挖掘是一個由數(shù)據(jù)庫、人工智能、數(shù)理統(tǒng)計和可視化等多學(xué)科與技術(shù)交叉、滲透、融合形成的交叉學(xué)科。
2.2地理空間數(shù)據(jù)挖掘(Geospatial Data Mining)
地理空間數(shù)據(jù)挖掘是指從地理空間數(shù)據(jù)庫中抽取隱含知識、空間關(guān)系或非顯式存儲在數(shù)據(jù)庫中有意義的特征或模式,挖掘地理空間要素的空間特性,如地理位置、方位、距離、幾何拓?fù)潢P(guān)系、空間屬性等。該技術(shù)在理解空間數(shù)據(jù)、獲取空間與非空間數(shù)據(jù)間的內(nèi)在關(guān)系方面具有重要的實用意義。
地理空間數(shù)據(jù)包括矢量和柵格兩大類型。矢量數(shù)據(jù)(如DLG)包括地理空間數(shù)據(jù)和屬性數(shù)據(jù)及相關(guān)的拓?fù)潢P(guān)系;柵格數(shù)據(jù)(如DOM、DEM)有規(guī)則網(wǎng)格(矩形及TIN格網(wǎng))和離散網(wǎng)格兩種數(shù)據(jù)集。
2.3地理空間數(shù)據(jù)挖掘的幾種典型方法
(1)地理空間統(tǒng)計方法
地理空間統(tǒng)計是指分析地理空間數(shù)據(jù)的統(tǒng)計方法,主要是利用了空間中鄰近的要素通常比相距較遠(yuǎn)的要素具有較高的相似性這一原理。該模型可以分為三類:地統(tǒng)計、格網(wǎng)空間模型和空間點(diǎn)分步形態(tài)。如DEM、DOM的直方圖、平均值、均方差、最大最小值統(tǒng)計等。
(2)地理空間聚類方法
地理空間數(shù)據(jù)聚類是按照某種距離度量準(zhǔn)則,在大型、多維數(shù)據(jù)集中標(biāo)識出聚類或稠密分布的區(qū)域,從而發(fā)現(xiàn)數(shù)據(jù)集的整體空間分步模式。該方法主要分為四類:分割法、層次法、基于密度的方法及基于網(wǎng)格的方法。如主導(dǎo)因素法、模糊聚類法。
(3)地理空間關(guān)聯(lián)分析
地理空間關(guān)聯(lián)分析是利用空間關(guān)聯(lián)規(guī)則提取算法發(fā)現(xiàn)空間數(shù)據(jù)庫中空間目標(biāo)間的關(guān)聯(lián)程度,從而進(jìn)行空間數(shù)據(jù)關(guān)聯(lián)分析的知識發(fā)現(xiàn)研究,其核心內(nèi)容是挖掘空間關(guān)聯(lián)規(guī)則。如最佳路徑、最短路徑分析;鄰近分析、包含落入分析、緩沖區(qū)分析等;DEM的坡度、坡向、坡位分析、視域分析等。
(4)地理空間分類與預(yù)測分析
地理空間分類與預(yù)測是根據(jù)已知的分類模型把數(shù)據(jù)庫中的數(shù)據(jù)映射到給定類別中,進(jìn)行數(shù)據(jù)趨勢預(yù)測分析的方法。人工神經(jīng)網(wǎng)絡(luò)可以作為該方法的典型技術(shù)應(yīng)用于實際研究中。如影像的監(jiān)督及非監(jiān)督分類、專家分類法、基于知識的分類法、植被指數(shù)提取等。
(5)異常值分析
顧名思義,異常值分析即將數(shù)據(jù)庫中與通常的行為或數(shù)據(jù)模型不一致的數(shù)據(jù)提取出來的分析方法。通過這種方法可以提取出數(shù)據(jù)庫中的異常信息或噪聲數(shù)據(jù),有時也會導(dǎo)致隱藏的重要數(shù)據(jù)丟失。異常值分析方法主要有三種:基于統(tǒng)計的異常值分析、基于距離的異常值探測、基于偏差的異常值探測。
三、地理空間數(shù)據(jù)挖掘與實際應(yīng)用的結(jié)合點(diǎn)
通過農(nóng)業(yè)部門的研究,果樹生長與陽光、空氣、水分、土壤(肥料)等基本要素有著密不可分的關(guān)系。果樹的生長環(huán)境又與地理緯度、海拔高度、生長季節(jié)有很大的關(guān)系,尤其是冬季凍害對果樹的生長、開花、結(jié)果有很大的影響,而冬季凍害的分布與地理因子有很大的內(nèi)在聯(lián)系。
數(shù)字高程模型(DEM)含有地理坐標(biāo)(經(jīng)度和緯度)和海拔高等地理信息,通過對DEM數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,采用地理空間關(guān)聯(lián)分析法,提取與果樹生長環(huán)境密切相關(guān)的信息,如坡度、坡向、坡位、果樹生長地理緯度、離海洋的距離等地理因子。通過對農(nóng)業(yè)氣候生態(tài)及其地理分布特征的研究,結(jié)合歷史氣象資料、實地考察、現(xiàn)實種植等相關(guān)情況,進(jìn)行GIS技術(shù)的空間疊置分析,實現(xiàn)果樹種植生態(tài)區(qū)域選擇和規(guī)劃,指導(dǎo)果農(nóng)進(jìn)行名優(yōu)果樹種植。該應(yīng)用具有很重要的科學(xué)意義和潛在的經(jīng)濟(jì)價值。
四、應(yīng)用實例
福建地處東南沿海,范圍在北緯23°30′~28°20′,東經(jīng)115°50′~120°45′之間;面積約12萬多平方公里,地勢由西北向東南傾斜,屬亞熱帶海洋性季風(fēng)氣候,年平均氣溫在-9.5℃~43.2℃之間,呈典型的溫暖濕潤氣候特點(diǎn),適合種植熱帶和亞熱帶果樹。閩東南沿海是著名的水果之鄉(xiāng),盛產(chǎn)龍眼、荔枝、蜜柚等亞熱帶水果。由于地理位置的不同,閩東北沿海年平均氣溫比閩東南沿海年平均氣溫相對低2.8℃~3.5℃之間,但受海洋性溫暖氣候影響,個別區(qū)域也可種植晚熟的熱帶、亞熱帶水果(如龍眼、荔枝等)。
通過與福建省農(nóng)科院土肥所的合作,決定在福建省閩東北地區(qū)(福鼎—霞浦一帶,北緯26°25′~27°26′之間)進(jìn)行晚孰熱帶和亞熱帶果樹(如龍眼、荔枝等)生態(tài)種植區(qū)域選擇試驗。
本試驗采用的基礎(chǔ)地理空間數(shù)據(jù)包括全縣范圍的DLG和DEM數(shù)據(jù)。通過對DLG和DEM數(shù)據(jù)進(jìn)行挖掘,提取符合條件的地理因子(見表1),并進(jìn)行GIS空間疊置分析,選擇出適宜種植晚孰熱帶和亞熱帶果樹的生態(tài)區(qū)域。
4.1篩選條件
表1 區(qū)域選擇條件
指 標(biāo)
地理因子
適 宜
不 適 宜
設(shè) 置 意 義
坡 度(slope)
slope <=25
slope >25
坡度大于25°易造成水分、土壤、肥料等流失,不適宜種植,故取25°以下。
坡 向(Aspect)
Aspect=東南、正南、西南向
Aspect=西北、正北、東北向
朝南方向陽光充足,更適合果樹生長,防避冬季凍害。
凍害指標(biāo)(TD)
(溫度模型)
TD >-2
TD <=-2
考慮地理緯度、離海距離等地理因素對當(dāng)?shù)仄骄鶜鉁氐挠绊懀瑥亩绊懝麡涞纳L和冬季凍害
坡位為相對高差50%-80%區(qū)域
50%-80%
0%-49%
&81%-100%
基于對果樹凍害的考慮。山頂易受冷空氣影響,形成凍害;山腳易沉積冷空氣,形成凍害,因此取相對高差50%-80%部分(經(jīng)驗指標(biāo))。
4.2 數(shù)據(jù)預(yù)處理
(1)DEM數(shù)據(jù)預(yù)處理
進(jìn)行換帶和投影變換,把21度帶的數(shù)據(jù)投影轉(zhuǎn)換為20度帶的數(shù)據(jù),以縣級區(qū)域為單位,進(jìn)行DEM數(shù)據(jù)拼接。根據(jù)需要,還需把DEM數(shù)據(jù)投影為以經(jīng)緯度坐標(biāo)存儲的數(shù)據(jù),用于數(shù)字溫度模型計算。
(2)DLG數(shù)據(jù)預(yù)處理
①坐標(biāo)轉(zhuǎn)換到同一坐標(biāo)系,投影到同一度帶,以縣級區(qū)域為單位,進(jìn)行DLG數(shù)據(jù)拼接。
②提取境界、主要道路及注記、主要水系及注記、村級以上居民地及注記、海岸線和主要島嶼及注記、其他注記等核心要素,用于生態(tài)區(qū)劃專題圖制作。
(3)行政區(qū)劃信息提取
①按代碼提取境界(縣界)、海岸線島嶼數(shù)據(jù)(可以舍棄面積較小的島嶼),合并為同一圖層。
②數(shù)據(jù)按福鼎市和霞浦縣分別構(gòu)建拓?fù)涿妫總面都必須有相應(yīng)的屬性信息。
4.3坡度、坡向數(shù)據(jù)生成及符合條件區(qū)域信息提取
(1)由DEM生成數(shù)字坡度圖(DSM)
根據(jù)要求提取坡度25度以下的圖元,對像元屬性進(jìn)行重編碼:坡度25度以下的區(qū)域,置pd=1;坡度25度以上為不適宜區(qū)域,置pd=0,生成數(shù)字坡度專題圖層。對生成的柵格圖自動進(jìn)行矢量化,導(dǎo)出為ARC/INFO的Coverage格式,并重建拓?fù)潢P(guān)系。
(2)由DEM生成數(shù)字坡向圖(DSA)
根據(jù)要求提取正南、東南、西南坡向的像元,并進(jìn)行重編碼朝南向置px=1;朝西北、正北、東北向置px=0,生成數(shù)字坡度專題圖層。對生成的柵格圖自動進(jìn)行矢量化,導(dǎo)出的格式為ARC/INFO的 coverage格式,并重建拓?fù)潢P(guān)系。
4.4數(shù)字溫度模型計算及避凍區(qū)域圖層
(1)凍害模型計算公式
根據(jù)地理緯度和海洋季風(fēng)氣候的特點(diǎn),對歷史氣象資料進(jìn)行統(tǒng)計分析,由福建省氣象局專家給出20年一遇的凍害(TD)計算公式。TD的計算公式如下:
陸地(指內(nèi)陸部分)
TD(1/20)=38.2915-1.288224×Φ-1.895327×ln(H+30)+3.676606/(S+1)
內(nèi)島(指海灣、河流入海口所包含的島嶼)
TD(1/20)=38.2915-1.288224×Φ-1.895327×ln(H+30)+3.676606/(0.9+S/50)
外島(指遠(yuǎn)離陸地、相對獨(dú)立的、周圍被海洋所包圍的島嶼)
TD(1/20)=38.2915-1.288224×Φ-1.895327×ln(H+30)+3.676606/(0.8+S/50)
以上公式中
Φ為緯度,以度為單位;
H為地面高程(海拔高),以米為單位,該數(shù)據(jù)可以從DEM數(shù)據(jù)中讀取;
S為格網(wǎng)點(diǎn)離海岸線的最近距離,以公里為單位;
生成的數(shù)字氣溫模型的格網(wǎng)間距Dgrid為25米。
(2)數(shù)字溫度模型生成的方法
①Φ值從以經(jīng)緯度坐標(biāo)的DEM數(shù)據(jù)中讀取;
②H值從DEM數(shù)據(jù)中讀取;
③離海距S的計算:
把海岸線數(shù)據(jù)(高斯投影坐標(biāo))離散化,把格網(wǎng)點(diǎn)的經(jīng)緯度坐標(biāo)轉(zhuǎn)換成高斯投影坐標(biāo),計算每個格網(wǎng)點(diǎn)與海岸離散化點(diǎn)的距離,取S的最小值為離海距(離散化點(diǎn)間隔較小)。
④實現(xiàn)方法
在VC++中根據(jù)公式編程計算TD值,其存儲格式與原DEM相同,格式同為柵格數(shù)據(jù),格網(wǎng)間距為25米。在此過程中涉及大量的計算,因此必須選用性能較好的計算機(jī)。
凍害計算流程圖(見圖1)
(3)避凍區(qū)域圖層生成
①適宜區(qū)域的判別規(guī)則(見表2)
表2:凍害等級評價表
凍害等級
無凍
輕凍
重凍
重凍
嚴(yán)重凍
TD
0<TD
-2<TD≤0
-3<TD≤-2
-4<TD≤-3
TD≤-4
栽培區(qū)
最適宜
適宜
次適宜
可能種植
不適宜
②根據(jù)以上判別表對TD模型數(shù)據(jù)進(jìn)行重編碼,TD>-2為適宜區(qū)域,置TD=1;TD<=-2為不適宜區(qū)域,置TD=0。對生成的柵格數(shù)據(jù)進(jìn)行自動進(jìn)行矢量化,導(dǎo)出的格式為ARC/INFO的 coverage格式,并重新構(gòu)建拓?fù)涿妫杀軆鰠^(qū)域?qū)n}圖層。
(4)50%~80%坡位區(qū)域?qū)n}信息提取
①方法一:由DEM自動生成等高線,人工選取相對高差50%~80%區(qū)域。
②方法二:在DEM模型上人工交互選取相對高差50%~80%區(qū)域。
③方法三:利用現(xiàn)有的DLG數(shù)據(jù),人工選取相對高差50%~80%區(qū)域
④對選取的區(qū)域構(gòu)建拓?fù)潢P(guān)系,并設(shè)置適宜區(qū)域的屬性代碼CODE5-8=1,數(shù)據(jù)導(dǎo)出為ARC/INFO 導(dǎo)入為coverage格式,生成相對高差50%~80%適宜區(qū)域圖層。
(5)空間疊置分析
①在ARC/INFO進(jìn)行交叉(intersect)疊置分析。只能兩個圖層進(jìn)行交叉疊置分析。先對坡度、坡向圖層進(jìn)行交叉疊置,結(jié)果再與區(qū)域矢量專題圖層進(jìn)行交叉疊置,最終生成地理因子圖層。對地理因子圖層進(jìn)行信息提取,提取符合條件(選取條件為:PX=1并且PD=1)的在所屬境界內(nèi)的地理因子專題信息。
同樣地,用intersect命令對以上步驟生成的地理因子圖層、避凍區(qū)劃圖層、相對高差50%~80%適宜區(qū)域圖層,在ARC/INFO進(jìn)行交叉疊置分析。然后,在ARC/INFO對圖層進(jìn)行重新選擇RESELECT提取符合條件的專題區(qū)域圖層,提取條件為:PD=1&PD=1&CODE0.5-0.8=1&TD=1,符合以上4個條件的為最終適宜區(qū)域。
②在ARC/INFO對選擇區(qū)域圖層面積太小的圖元進(jìn)行取舍合并(eliminate,條件表達(dá)式RES AREA<=1250,即面積小于1250平方米的面元),生成最終成果專題圖層。
(6)選擇區(qū)域?qū)n}圖制作
①在ErDAS把數(shù)字高程模型數(shù)據(jù)進(jìn)行彩色暈渲,制作彩色地勢專題柵格圖。
②在AutoCAD,插入彩色地勢專題柵格圖,疊加主要的水系、交通、居民地、注記等專題信息,以及適宜區(qū)域最終成果(區(qū)域按斜格網(wǎng)線填充),制作成專題圖。
③在ArcView對最終適宜區(qū)域圖層按縣進(jìn)行晚孰水果生態(tài)區(qū)域面積統(tǒng)計。
4.5分析結(jié)果與現(xiàn)狀對比驗證
(1)分析結(jié)果分布特點(diǎn)
①適宜區(qū)域呈沿海岸線分布。這是因為離海距離的影響,表明海洋氣候?qū)鉁丶岸緝龊Φ挠绊懞艽蟆?/span>
②適宜區(qū)域呈半山腰坡位分布。受相對高差50%~80%條件的影響很大,加上此條件則適宜區(qū)域大大減少,平原地幾乎沒有適宜區(qū)域。
(2)種植現(xiàn)狀驗證分析
選擇區(qū)域的結(jié)果與福建霞浦、福鼎兩地的種植現(xiàn)狀(由農(nóng)科院提供)進(jìn)行對比,發(fā)現(xiàn)霞浦的沙江鎮(zhèn)、福鼎的秦嶼鎮(zhèn)、白琳鎮(zhèn)現(xiàn)有種植較大面積的荔枝和龍眼,大部分分布于平原地及朝南向山坡地,但平原地種植面積較山坡地大,這與忽略相對高差50%~80%條件所分析的結(jié)果較一致。但根據(jù)農(nóng)科院的專家給出的經(jīng)驗而言,必須考慮冷空氣在山地的坡位凍害影響,就專家經(jīng)驗而言,冷空氣較易沉降在平原地,平原地受到的凍害較山坡地厲害。根據(jù)分析的結(jié)果,對當(dāng)?shù)氐墓r(nóng)進(jìn)行生產(chǎn)種植指導(dǎo)。
五、結(jié)論
由于我們經(jīng)過近幾年的基礎(chǔ)測繪項目(NSDI)建設(shè),擁有豐富的地理信息資源,以及GIS應(yīng)用的經(jīng)驗與技術(shù),通過與農(nóng)業(yè)專家的合作,可以在這方面取得很好的應(yīng)用研究成果。通過對DLG和DEM數(shù)據(jù)進(jìn)行地理空間數(shù)據(jù)挖掘,采用地理空間關(guān)聯(lián)分析法,提取與果樹生長環(huán)境密切相關(guān)的信息,如坡度、坡向、坡位、果樹生長地理緯度、離海洋的距離等地理因子,進(jìn)行果樹生態(tài)區(qū)域的選擇,通過與實際種植情況的驗證,認(rèn)為這種方法是很有實用價值和指導(dǎo)意義的。地理空間數(shù)據(jù)挖掘、GIS技術(shù)及農(nóng)業(yè)技術(shù)的合作是精細(xì)農(nóng)業(yè)的基礎(chǔ),也是科學(xué)指導(dǎo)農(nóng)業(yè)生產(chǎn)的技術(shù)手段,對繁榮我省農(nóng)業(yè)經(jīng)濟(jì)、建設(shè)海峽西岸農(nóng)業(yè)經(jīng)濟(jì)示范區(qū)具有一定的實用價值。
聲明①:文章部分內(nèi)容來源互聯(lián)網(wǎng),如有侵權(quán)請聯(lián)系刪除,郵箱 cehui8@qq.com
聲明②:中測網(wǎng)登載此文出于傳遞更多信息之目的,并不意味著贊同其觀點(diǎn)或證實其描述,文章內(nèi)容僅供參考。