TimeGis – time aspect of the digital geodata (TimeGis - časový aspekt digitálnych geoúdajov)

RNDr. Tomáš Hlásny
katedra geografie, laboratórium GIS
Univerzita Mateja Bela
Tajovského 40
974 01 Banská Bystrica
E - mail: hlasny@fpv.umb.sk

Abstract

Only the full integration of space, time and attributes can bring complex understanding of the nature and processes around. This paper is focused on the time aspect of geodata and newly developed fields of GIS - TimeGIS and RealTime GIS. The main concern of the first part is about general concepts of time, chosen application areas, foundation of the TimeGIS terminology as a chronon, granularity of time, time axis and events. The other part is devoted to analysis of the base spatio-temporal models for storing, updating and analysing spatio-temporal data and their specific position in GIS. The main described models are snapshot model, TMS model, ST-ObjectModel, ESTDM a multi-componential surface.

Second part of the paper is focused on more applicable - the importance of spatio-temporal data and above mentioned data structures of time series analyses and modelling spatio-temporal phenomena. Further, the compendious classification of time series analyses has been proposed. The main specified groups are basic mathematical tools, specialized statistics tools where belong procedures such as detrendent analyses, principal component analyses, polynomial predictive and retrospective tools, or ARIMA procedure. The third group covers procedures such as crosstabulation and crossclassification, Kappa indices, Markov chains and cellular automata. All of these approaches to time series analyses are explained and demonstrated with the help of several real world data sets.

Abstrakt

Len plnohodnotná integrácia priestoru, času a atribútov umožňuje komplexné pochopenie procesov okolo nás. Geografia a Geografické informačné systémy sa zaoberajú štúdiom času a priestoru. Tieto dve zložky štúdia priestorových javov však v súčasnosti nie sú v rovnováhe a štúdiu časovej zložky sa nepripisuje rovnocenný význam. Príspevok je zameraný práve na časový aspekt geoúdajov, na v poslednej dobe aktuálnu problematiku TimeGIS a RealTimeGis a na niektoré aplikácie týchto technológií. Prvá časť je zameraná na všeobecný koncept času pri práci s geoúdajmi, aplikačné oblasti TimeGIS a teoretický rozbor tejto problematiky. V tejto oblasti GIS sa vyprofilovala špecifická terminológia, ako je chronón, granularita času, časová os a udalosti. Dôležitým aspektom vývoja GIS v teoretickej oblasti je práve transparentná integrácia terminológie novo vyprofilovaných oblastí do aplikovanej časti GIS. Ďalšou časťou príspevku je rozbor štruktúry základných konceptuálnych časovo-priestorových modelov a schém, umožňujúcich uchovávanie a analýzu geoúdajov - snapshot model, TMS model, ST-ObjectModel, ESTDM a multikomponentálny povrch. Každá z týchto štruktúr má svoju špecifickú pozíciu z hľadiska ukladania geoúdajov, ich spracovania, aktualizácie a analytických možností.

Druhá časť prípevku je zameraná konkrétnejšie, na význam a pozíciu časových údajov pri analýzach a modelovaní v GIS. V tejto časti sme sa zamerali na rozbor metód pre analýzu časových radov a možnosti ich integrácie v prostredí GIS. Navrhli sme klasifikáciu týchto algoritmov na základné matematické nástroje pre analýzu časových radov, špecializované štatistické metódy ako detrendenčná analýza, PCA, chronologický clustering, alebo ARIMA a špecializované postupy ako je interpretácia údajov usporiadaných v kontingenčnej tabuľke (crosstabulation), séria Kappa indexov, alebo využitie bunkových automatov a Markovových reťazcov. K jednotlivým metódam pre analýzu časových radov je pristupované z hľadiska ich matematickej podstaty, typu údajov na akých môžu byť vykonávané a ich zameraniu, ako je odvodenie deskriptívnych charakteristík časovej série, vysvetlenie genézy jej vývoja, vyjadrenie kvalitatívnej a kvantitatívnej úrovne zmeny dvoch, alebo viacerých modelov v rozličných časových úsekoch a na tvorbu prediktívnych a retrospektívnych modelov. Ďalšie časti príspevku sú venované využitiu uvedených postupov v oblasti prediktívneho modelovania na kvalitatívnych aj kantitatívnych údajoch a prípadným testom presnosti týchto modelov. Pri väčšine metód sú uvádzané možné aplikačné oblasti a vybrané modelové štúdie s využitím toho ktorého postupu.

Úvod do problematiky

Len plnohodnotná integrácia priestoru, času a atribútov umožňuje komplexné pochopenie procesov okolo nás. Geoinformatika a geografické informačné systémy sa zaoberajú štúdiom priestorových, atribútových, časových a topologických vlastností geoobjektov. Tieto zložky štúdia priestorových javov však v súčasnosti nie sú v rovnováhe a v prevážnom množstve aplikácií štúdium časovej zložky nemá rovnocenný význam.

Z historického hľadiska vývoja časovo-priestorových aplikácií je možné za významný považovať rok 1964, kedy Berry (1964) pre popis geografických údajov navrhol využitie dvojrozmernej matice. Tento koncept následne rozšíril do tretieho rozmeru zakomponovaním ďalších diskrétnych časových vrstiev. Armstrong (1998) tento spôsob organizácie údajov označil ako dominantnú metódu organizácie údajov v paradigme geografie. V septembri 1992 sa konala prvá konferencia venovaná čisto problematike časovo-priestorových databáz a v tom istom roku sa objavili aj prvé knihy venovane tejto problematike (Lagran 1992, Hazelton 1992). Kemp a Kowalczyk (1994) v súvislosti s vývojom TimeGIS uvádzajú "potreba integrácie časovej dimenzie v GIS je neodškriepiteľná a veľmi dobre zdokumentovaná ... ďalšie generácie GIS pravdepodobne budú zahŕňať prvky, ktoré umožnia užívateľovi výber konkrétneho typu časovej podpory najvhodnejšej pre danú aplikáciu...". Cieľom tvorby geografického informačného systému by teda mala byť neoddeliteľná integrácia časovej zložky do domény priestorových údajov spôsobom atribút (a), poloha (x,y,z) a čas (t).

V súčasnosti sa v množstve vedných a priemyselných odborov stretávame aplikáciami, pri ktorých je časový aspekt rovnocenný, alebo významnejší ako priestorový. Vzhľadom na vývoj posledných udalostí je mimoriadne aktuálna problematika monitoringu záplav, počasia a všeobecne krízového manažmentu (Joerin a Claramunt 1994). Dynamické GIS systémy s možnosťou odozvy v reálnom čase (RealTimeGIS) v kombinácií s expertnými hydrologickými a meteorologickými systémami prinášajú v tejto oblasti nové riešenia (Wahl et al. 1995). Ďalšie oblasti využitia RTGIS sú napr. v oblasti monitoringu dopravy a stavu znečistenia ovzdušia. Za zmienku stojí štúdia realizovaná v Gratzi (Rakúsko), kde boli na prostriedky mestskej hromadnej dopravy inštalované GPS so zariadeniami pre monitoring znečistenia ovzdušia. Pomocou GSM SMS boli informácie o polohe a stave znečistenia vysielané do centrály, kde boli expertným systémom vyhodnocované s možnosťou prijatia opatrení v reálnom čase (Ringert a Legat 2001). Obdobné projekty sú známe z veľkých miest v Japonsku, kde akonáhle úroveň znečistenia presiahne kritickú hodnotu je inteligentným systémom presmerované doprava. Technológia kombinácie RTGIS, GPS a SMS GSM je známe aj na Slovensku a v Čechách v oblasti bezpečnostných zariadení v autách. V prípade projektov tohto typu hovoríme skôr o Near-RealTimeGIS, vzhľadom na to že odozva systému nie je okamžitá, ale trvá rádovo niekoľko minút. V oblasti vedy a výskumu bolo využitím technológie RTGIS realizované taktiež väčšie množstvo projektov. K významným projektom z tejto oblasti patrí napr. výskum zameraný na monitoring dynamiky oceánov a atmosféry a v oblasti krízového manažmentu, alebo manažmentu prírodných katastrof realizovaný organizáciou National Oceanic and Atmospheric Administration (NOAA) Výskum je zameraný dvomi smermi, na jednej strane je to konkrétna aplikácia, ako je sledovanie pohybu morských cicavcov, monitoring pohybu a technických parametrov lodí, monitoring morských prúdov alebo tzv. RealTime Hurricane Analysis System a na druhej strane je to samotný vývoj a integrácia RTGIS systémov.

V uvedených systémoch a aplikáciách je každý priestorový objekt, tvoriaci súčasť GIS databázy1 okrem svojej polohy v priestore (x,y,z) charakterizovaný svojím atribútom (a) a svojou časovou platnosťou , resp. svojou pozíciou vo viacrozmernom časovo-priestorovom systéme. Takto koncipovaná údajová štruktúra má aj svoju praktickú stránku. Pri posune geoobjektu po časovej osi určitým spôsobom, totiž môže dôjsť k zmene jeho priestorovej reprezentácie, kvalitatívnej a kvantitatívnej zmene jeho atribútov a k zmene jeho časovej, atribútovej a priestorovej topológie. Úlohou TimeGis je práve uchovávanie, spracovávanie a analyzovanie časovo-priestorových údajov a pochopenie a rozbor uvedených parametrov. Konvenčné modely naopak, zdôrazňujú statickú reprezentáciu reality. Geografické informácie rozdeľujú do vrstiev ktoré sú silne obmedzené najmä z hľadiska reprezentácie dynamických informácií.

V súvislosti s uvedeným "posunom objektu po časovej osi" sa v oblasti T-GIS uzákonila určitá špecifická terminológia. V prvom rade je potrebné vyjadriť, či sa priestorový objekt v čase posúva diskrétne, alebo spojito. Prevážna väčšina aplikácií s prvkom času využíva diskrétny koncept času, s možnosťou časovej interpolácie a extrapolácie. Diskrétny koncept času je významný najmä pre potreby modelovania využitím konkrétnych časovo-priestorových modelov (v ďalšom texte). V tejto súvislosti sa používajú pojmy "granularity of time", alebo zrnitosť času a chronón. Granularita, alebo zrnitosť vyjadruje známe rozlíšenie v prípade rastrových údajov. Chronón je časovou obdobou pixelu. Chronón teda vyjadruje najkratšiu časovú rozlišovaciu jednotku. Táto sa môže pohybovať od sekúnd v prípade rozličných RTGIS modelov, cez dni, týždne a mesiace u ekonomických javov, roky pre modely vyjadrujúce rozličné stavy a vlastnosti krajiny až po milióny rokov v prípade geologických máp. Prechod medzi dvomi susednými chronónmi vyjadruje určitú udalosť (event).

Langran a Chrisman (1998) a Lantner (1992) rozoznávajú tzv. "world time", ktorý určuje vývoj a zmeny objektov reálneho sveta a tzv. "database time", ktorý hovorí o životnom cykle geoúdajov v GIS databáze. Problematika "database time" má dva aspekty. Prvý z nich sa týka časového správania objektov reálneho sveta vstupujúcich do databázy, pre ktoré sa ich "database time" začína ich vstupom a končí výstupom (resp. odstránením). Druhý aspekt tejto problematiky sa týka objektov vzniknutých priamo v GIS systéme analýzou, alebo syntézou objektov prvého typu. V tomto prípade sa "database time" odvádza od časového cyklu zdrojových údajov. Databázový čas objektov prvého typu sa v určitých aspektoch prekrýva s "world time".

Hazelton (1990) uvádza tri hlavné oblasti vyžadujúce integráciu časového komponentu na rovnakej úrovni ako je priestorový komponent:

Podľa Lauriniho a Thompsona (1992) recte Ott a Swiaczny (2001) je čas v GIS databázach integrovaný tromi spôsobmi:

Schéma GIS systému podľa Tao (1995) (obr.1) okrem známej priestorovej topológie a metriky vnáša túto terminológiu aj do oblasti atribútových údajov a časového aspektu geoúdajov. Langran a Chrisman (1998) o problematike časovej topológie uvádzajú, že obdobne ako priestorová topologická štruktúra umožňuje orientáciu, manipuláciu a analýzy medzi časovo susediacimi objektmi. Význam tohto prístupu sformuloval Armstrong (1998) nasledovne: "Časový aspekt pri spracovaní geoúdajov je významný z dôvodu, že ich metrika, topológia a atribúty sa menia v čase buď spoločne, alebo nezávisle".

Obr. 1 Koncept štruktúry geoúdajov s integrovaným parametrom času (Tao 1995)

Vývoj časovej, priestorovej a atribútovej topológie je možné vyjadriť príkladom dynamicky sa pohybujúcich geoobjektov (napr. ľadových krýh), na ktorých dochádza k priebežnej zmene atribútov ako teplota, hmotnosť, tvar a poloha. Vzhľadom na to, že tieto parametre sa vyvíjajú v čase do značnej miery nezávisle, dochádza v jednotlivých časových úsekoch k nezávislému prebudovávaniu časovej, priestorovej a atribútovej topológie.

Z hľadiska prístupov k uchovávaniu časovo-priestorových údajov môže nastať niekoľko situácií, ktoré vyžadujú integráciu v prostredí GIS odlišnými spôsobmi. Sú to nasledovné:

Štruktúry pre ukladanie a analýzu časovo-priestorových údajov

Konceptuálnych štruktúr umožňujúcich správu a analýzu časovo-priestorových geoúdajov je väčšie množstvo. Za najjednoduchší spôsob je možné označiť tzv. snapshot model, ktorý pozostáva zo série časovo (kvázi) homogénnych vrstiev bez explicitného ukladania údajov o čase (obr.2). Aj napriek mnohým nevýhodám, ako je časová stacionárnosť jednotlivých vrstiev, rovnaký prístup k objektom s rozličnou časovou stabilitou v rámci jednej vrstvy a náročná manipulácia s väčším množstvom, mnohokrát objemných súborov, patrí tento model medzi v praxi rozšírené štruktúry, najmä pre svoju štrukturálnu jednoduchosť. Nad časovo-priestorovými údajmi ukladanými využitím tejto štruktúry je možné jednoduchým spôsobom vykonávať väčšinu analýz časových radov.

Obr.2 Snapshot model

V prípade vhodnej vstupnej údajovej štruktúry je možné pre vyjadrenie časového rozmeru geoúdajov využiť model, ktorý sme nazvali enhanced snapshot model (ESM). Z hľadiska fyzickej reprezentácie sa jedná o voxelovú štruktúru, kde rozlíšenie v smere osí x a y vyjadruje priestorovú rozlišovaciu úroveň a jednotky v smere osi z vyjadrujú časovú rozlišovaciu úroveň (dĺžku chronónu). Atribút je vyjadrený priamo atribútom jednotlivých trojrozmerných elementov. Výhodou tohto mode-lu je jeho spojitosť z hľadiska priestorového aj časového (ktorá je samozrejme relatívna a je závislá na rozlišovacej časovej schopnosti danej veľkosťou najmenšieho časovo-priestorového elementu v smere časovej osi t) a možnosť interpolácie, resp. extrapolácie vo všetkých rozme-roch. Na druhej strane je uvedená spojitosť súčasne aj nevýhodou tohto modelu, pretože umožňuje popis časového vývoja analy-zovaného javu len za predpokladu stacionárnosti systému z hľadiska pôsobenia určitých procesov. Napríklad v prípade prírodných systémov to znamená, vztiahnutie platnosti modelu k časovým úsekom, v rámci ktorých sú vylúčené prírodné hazardy, alebo náhle zmeny pôsobenia antropických aktivít, čo môže narušiť spojitý priebeh časového radu. Vo všeobecnosti je platnosť ESM potrebné vzťahovať k časového úseku , počas ktorého sa systém správa z uvedeného hľadiska viac-menej stacionárne.

Obr.3 Enhanced Snapshot Model

Ako vstupné údaje pre skonštruovanie ESM slúži séria dvojrozmerných vrstiev usporiadaná formou štandardného snapshot modelu s aplikáciou vybraného interpolačného algoritmu. Vytvorená štruktúra umožňuje realizovať širšie množstvo analytických operácií ako štandardný snapshot model, vytvárať rozličné typy profilov smere priestorových a časovej osi (obr.3), generovať časovo-priestorové izolínie charakteru a vývoja javu so širokými možnosťami interpretácie a pod.

Určitým rozšírením štandardného snapshot modelu je definovaný tzv. Temporal Map Set - TMS. V rámci tohoto modelu má každá bunka priradený binárny atribút, vyjadrujúci jej stav počas určitej udalosti (obr.4).

Obr.4 TMS - model. Formou bináneho atribútu sú jednou vrstvou vyjadrené 4 časové úseky vývoja daného javu. Tento typ modelu umožňuje vyjadriť len zmenu atribútu a nie priestorového objektu.

Tento typ modelu je samozrejme len jednou z prvých aproximácií riešenia pre ukladanie časovo-priestorových údajov a má veľké množstvo nevýhod, ako napr. neschopnosť reagovať na zmeny v priestorovej organizácií geoobjektov. Výhodou je naopak, možnosť vyjadriť formou jednej vrstvy viacero časových úsekov, čo je prínosom napr. z hľadiska tvorby tlačových výstupov.

SpatioTemporal-ObjectModel (ST-ObjectModel) reprezentuje reálny svet ako množinu diskrétnych objektov zložených z tzv. časovo-priestorových atómov. Táto štruktúra je dosiahnutá umiestnením tretej, časovej osi kolmej na osi x a y. Časovo-priestorové atómy sú z hľadiska času aj priestoru homogénne jednotky, ktoré svojou štruktúrou a charakterom odrážajú zmeny v obidvoch dimenziách. Obmedzenie tohoto modelu, obdobne ako pri snapshot modely, alebo ESM je v tom, že jeho štruktúra je diskrétna a nedokáže odrážať kontinuálne zmeny priestoru v čase (Yuan 1997).

Obr.5 ST- ObjectModel, upravené podľa Worboysa (1992)

Peuquet a Duan (1995) vyvinuli jeden z ďalších modelov pre ukladanie časovo-priestorových údajov - Event Based Spatial Temporal Data Model (ESTDM). ESTDM aj TMS modely popisujú časovo-priestorový charakter geoúdajov využitím skupiny vrstiev, v rámci ktorých majú objekty (kvázi) homogénnu časovú štruktúru (Yuan 1997).

Obr.6 Event Based Spatial Temporal Data Model (ESTDM), upravené podľa Peuquet a Duan (1995)

Výhodou ESTDM modelu je skutočnosť, že neodráža len túto sériu stavov, ale vyjadruje aj zmenu vo vzťahoch oproti predošlému stavu (referenčnému časovému modelu (obr.6). Fyzická štruktúra tohto konceptuálneho modelu pozostáva z hlavičky súboru, ktorá obsahuje informácie o tematickej doméne, ktorej sa model týka, odkazy na referenčný časový model a odkazy na prvý a posledný zoznam udalostí viazaných ku geoobjektom. Jednotlivé časové úseky sú reprezentované pomocou tzv. EST (event based series). Každá udalosť je priradená k určitej sérií komponentov, ktoré vyjadrujú miesto zmeny. Komponenty teda vyjadrujú zmeny na preddefinovaných polohách (bunkách rastra) v určitom časovom bode.

Okrem týchto časovo-priestorových štruktúr je pre vyjadrenie časového zložky geoúdajov možné využiť napr. vektorové a multikomponentálne povrchy v zmysle DeMers (1997). V prípade vektorového povrchu (obr. 7) každá bunka obsahuje údaje o veľkosti a smere pôsobenia určitého fenoménu. V prípade časovo-priestorových údajov prvý údaj vyjadruje intenzitu pôsobenia javu v časovom úseku t1 a druhý parameter vyjadruje intenzitu jeho zmeny vzhľadom k časovému úseku t2. Táto metóda v určitých ohľadoch korešponduje s metódou Vector Change Analysis.

Obr.7 Skalárny a vektorový povrch v zmysle DeMers (1997)

Okrem týchto modelov Yuan (1997) uvádza napr. OOGeomorph objektovo orientovaný model, alebo rozličné typy doménových modelov.

Analýza časových sérií

V prípade analýz časových sérií vyjadrených či už priestorovými, alebo nepriestorovými údajmi, sledujeme dva hlavné ciele - určenie charakteru časového, alebo časovo-priestorového fenoménu na základe určitého súboru pozorovaní a predikciu hodnôt v ďalších časových úsekoch. Legendre-Legendre (1998) sformulovali šesť krokov analýzy časových sérií nasledovným spôsobom:

Analýzy časovo-priestorových údajov sú realizovateľné na údajoch všetkých typov - nominálnych, ordinálnych, intervalových aj pomerových. Tento typ analýz je z hľadiska algoritmického riešenia mimoriadne širokou problematikou. V literatúre je uvádzané väčšie množstvo postupov, z ktorých väčšina umožňuje jednoduchú integráciu do GIS systémov. Na úvod tejto časti príspevku uvádzame niektoré základné charakteristiky a terminológiu používanú v súvislosti s časovými radmi, z ktorej budeme v ďalšom texte vychádzať.

Časový rad vyjadruje chronologicky usporiadanú sekvenciu údajov a stavoch určitého javu. Každý časový rad pozostáva z jednej, alebo viacerých zložiek. Sú to trendová zložka, zložka reziduálov - náhodných odchýlok od trendu, môže obsahovať jednu, alebo viac cyklických, alebo periodických zložiek a v zmysle niektorých autorov sezónnu zložku. Podľa iných zdrojov, je sezónnu zložku možné považovať za súčasť cyklickej. Na základe spôsobu syntézy týchto zložiek hovoríme o aditívnych, alebo multiplikatívnych modeloch časových radov. Táto problematika je dôkladne rozpracovaná v prácach Cryer (1986), Bowerman a O`Connel (1987) a Brabenec et al.(1977).

Obr.8 Obrázok a) vyjadruje neperiodický rad s trendovou zložkou, b) periodický rad s trendovou zložkou, c) neperiodický rad bez trendovej zložky a d) periodický rad bez trendovej zložky

Metódy pre analýzu časových radov umožňujúce plnú integráciu do prostredia GIS je možné klasifikovať nasledovným spôsobom:

Základné matematické a štatistické postupy

Špecializované štatistické postupy

Špecializované postupy pre prácu s priestorovými údajmi

Okrem tohto členenia je možné kategorizovať uvedené metódy z hľadiska typu údajov nad ktorými môžu byť vykonávané - kvalitatívne, kvantitatívne príp. ordinárne, nominálne, intervalové a pomerové. Z hľadiska účelu, pre ktorý daná metóda slúži je možné uviesť klasifikáciu na metódy slúžiace pre:

Klasifikované algoritmy samozrejme nezahŕňajú všetky postupy pre analýzu časových sérií. Zamerali sme sa najmä na tie, ktoré umožňujú jednoduchú integráciu v GIS, resp. sú zamerané priamo na analýzu priestorových údajov. Okrem týchto algoritmov sa stretávame napr. s využitím Furierových a wavlet analýz, resp. všeobecne využitie spektrálnych metód pre rozloženie časového radu do série periodických zložiek a s ich následnou analýzou. Red-Horse et al. (1996) uvádzajú postupy pre redukciu údajov diskrétnych časových schém Eigensystem Realisation Algorithm and Polyference, alebo Exogeonous Autoregressive Modeling (ARX). Tieto metódy sú založené na redukcií vstupných údajov využitím niektorého z uvedených algoritmov extrahovaním tzv. modálneho modelu (matematického modelu vyjadrujúceho podstatu správania časovej série) s následným spracovaní tohto modelu metódami spektrálnych analýz. Odlišný prístup k analýzam časových sérií ponúkajú rozličné viacrozmerné štatistické metódy. V ďalšom texte uvádzame metódu hlavných komponentov, okrem nej sa stretávame s ďalšími ordinačnými metódami, alebo s metódou chronologického clusteringu.

Za najpokročilejšie metódy v oblasti prediktívneho modelovania a tvorby matematických modelov popisujúce komplexné správanie časovej série je možné považovať metodiky ARMA (autoregressive - moving average model) a ARIMA (autoregressive - integrated - moving average model), príp. Box-Jenkinsov model. Princíp činnosti týchto modelov je v zásade podobný. Jedná sa o identifikáciu vhodného typu modelu časovej série - AR (autoregressive model), MA (moving average model), ARMA, alebo ARIMA, odhad parametrov modelu a vyhodnotenie štruktúry reziduálov, ktoré musia byť nezávislé a normálne rozdelené. V prípade, že tomu tak nie je, je potrebné použiť iný typ modelu. Používanie tejto metódy vyžaduje určité skúsenosti, najmä v oblasti výberu vhodného modelu. Táto metóda je dôkladne zdokumentovaná napr. v prácach Legendre a Legendre (1998), Cryer (1986) a Bowerman a O`Connel (1987).

S integráciou týchto postupov sa v systémoch GIS zatiaľ nestretávame, preto im v ďalšom texte nebude venovaná pozornosť. Z praktického hľadiska však nie je dôvod sa im pri práci s priestorovými (resp. časovo-priestorovými) údajmi vyhýbať, kde je možné jednoducho importovať priestorové údaje do tabuľkovej formy vo formáte x,y,z.

Skupina základných matematických a štatistických postupov pre analýzu časových radov zahŕňa

základné postupy pre popis priebehu časového radu a postupy pre vyhodnotenie úrovne zmeny medzi dvomi modelmi vztiahnutými k dvom časovým úsekom. Metódy rozdielu, podielu a regresnej a korelačnej analýzy realizovanej na vstupných súboroch slúžia len pre orientačné vyhodnotenie intenzity a charakteru zmeny. V prípade rozdielu vstupných súborov je vhodné klasifikovať výsledný model do kategórií "bezo zmeny", "negatívna zmena" a pozitívna zmena". Pri takomto postupe je potrebné zvoliť určitú prahovú hranicu okolo kategórie "nulová zmena", zmeny v rámci ktorej budú považované za zanedbateľné, čo zlepší výpovednú hodnotu tohto modelu. Tieto metódy by mali byť používané len pre získanie orientačných výsledkov v prvých fázach výskumu.

Metóda regresnej a korelačnej analýzy ponúka dva možné prístupy k analýze časových radov. Na jednej strane úhrnnou charakteristikou korelačného koeficientu vyjadruje intenzitu zmeny medzi modelmi ako celkami. V prípade dosadenia prvého modelu do regresnej rovnice a odčítaním výsledku tejto operácie od druhého modelu vyjadríme priestorovú zmenu medzi modelmi vztiahnutú k jednotlivým polohám. Pri interpretácií vychádzame zo skutočnosti, že v miestach nulovej zmeny je intenzita korelácie najvyššia. Táto metóda v niektorých krokoch korešponduje s metódou hlavných komponentov a detrendenčnou analýzou.

Porovnanie vývoja zmien polohy a variability údajov vztiahnutých k viacerým časovým úsekom môže poskytnúť cenné informácie, umožňujúce čiastočné odhalenie genézy zmeny a vývoja javu. Ako miery polohy je možné využiť (v závislosti od charakteru údajov) rozličné typy priemeru, modus, alebo medián a ako mieru variability smerodajnú odchýlku, rozptyl, príp. variačné rozpätie. Obr.9 vyjadruje niekoľko možných správaní sa časového radu z hľadiska hodnotenia uvedených parametrov.

Obr.9 Zmena polohy a variability jedného systému v dvoch časových úsekoch. V takomto prípade je dôležitá analýza kauzálneho aspektu tohto javu.

Interpretácia zmeny týchto parametrov vyplýva zo znalosti charakteru a mechanizmov ovplyvňujúcich vývoj analyzovaného javu. V prípade zmeny polohy pri zachovaní variability je napr. možné usudzovať o zintenzívnení procesov podmieňujúcich danú časovo-priestorovú štruktúru. Napr. v prípade hodnotenia intenzity znečistenia vzduchu môže byť posun polohy spôsobený zintenzívnením produkcie existujúcich zdrojov znečistenia. Zmenu variability pri zachovaní polohy (obr.9), je možné zdôvodniť napr. zvýšením produkcie zdrojov znečistenia a na druhej strane prijatím určitých opatrení obmedzujúcich znečistenie - čiže dôjde k celkovému zvýšeniu variability, ale stredná poloha môže zostať zachovaná. V iných príp. môže dôjsť k súčasnej zmene polohy aj k zmene variability. Samostatnou oblasťou tohto typu analýzy je hodnotenie kauzálneho aspektu zmeny parametrov, ako špicatosť a šikmosť, príp. samotný tvar rozdelenia početnosti.

V prípade priestorových údajov je za menej známe postupy tejto kategórie možné považovať odvodenie základných deskriptívnych charakteristík časového radu. K najdôležitejším parametrom patria hodnoty prvej diferencie, druhej diferencie, alebo diferencie zrýchlenia a koeficient zrýchlenia. Tieto parametre môžu byť určené pre buď atribútové údaje vztiahnuté k jednej polohe, alebo pre sériu kvantitatívnych modelov vztiahnutých k rozličným časovým úsekom. (snapshot model). Prvé diferencie vyjadrujú rozdiely medzi susednými členmi časového radu a druhé diferencie, alebo diferencie zrýchlenia vyjadrujú rozdiely prvých diferencií. Priemerný koeficient zrýchlenia vyjadruje priemernú hodnotu druhých diferencií a je úhrnnou charakteristikou intenzity vývoja časového radu.

Na obrázku 10 je graficky vyjadrený priebeh časového radu a zodpovedajúcich diferencií zrýchlenia. Časový rad vyjadruje denný chod teplôt. Hodnoty na x-ovej osi vyjadrujú počet minút od začiatku merani o 6.40 ráno. Na základe priebehu druhých diferencií je možné usudzovať o vysokých hodnotách intenzity zrýchlenia časového radu v období medzi 8.40 až 14.00. Pred a po tomto časovom úseku je vývoj teplôt pozvoľný. Z hľadiska ďalšieho výskumu je významná analýza kauzálneho aspektu tohto správania a odklony od neho v závislosti od polohy stanovišťa (Hlásny et al., unpubl).

Obr.10 Denný chod teplôt na štyroch stanovištiach a prislúchajúci priebeh druhých diferencií dvoch stanovíšť. Modrá šípka vyznačuje bod, v ktorom teploty kulminovali (pribižne 370 minúta, 12.50) (Hlásny et al., unpubl.) (prohlédnout v plném rozlišení)

Nasledovná časť je venovaná rozboru metód z kategórie špecializovaných štatistických postupov pre analýzy časových radov. Ako jednu z metód z mimoriadne všestranným uplatnením a širokými možnosťami interpretácie výsledkov je metóda hlavných komponentov (principal component analysis, PCA). Pri tejto metóde sledujeme vo všeobecnosti dva ciele. Odhliadnuc od analýz časových radov, je ako prvoradý cieľ možné označiť redukciu celkového objemu vstupných údajov a detekovanie vzťahov medzi premennými vstupujúcimi do analýzy. Analýza je založená na kombinácií viacerých korelovaných premenných (napr. stavov analyzovaného javu počas niekoľkých časových úsekov, medzi ktorými je možné predpokladať silnú koreláciu) do dvoch, alebo viacerých tzv. komponentov, ktoré vyjadrujú podstatnú časť štruktúry vstupných premenných a nie sú navzájom korelované. Vo väčšine prípadov je pomocou prvých 3-4 komponentov popísaných 95-99% variability vstupných údajov. Detailnejší teoretický rozbor tejto metódy a aplikačné oblasti je nad rámec príspevku a je dôkladne rozpracovaný v napr. prácach Legendre a Legendre (1998) a Johnston (1978).

V prípade 4 časových úsekov je výsledok analýzy hlavných komponentov vyjadriť nasledovnými tabuľkami:

VAR/COVAR

t1

t2

t3

t4

T1

19.36

11.72

17.74

42.24

T2

11.72

9.47

12.55

40.96

T3

17.74

12.20

20.20

48.88

T4

42.24

40.96

48.88

329.80

Tab.1

COR MATRIX

t1

t2

t3

t4

T1

1

0.865584

0.896827

0.528601

T2

0.865584

1

0.907277

0.732874

T3

0.896827

0.907277

1

0.598823

T4

0.528601

0.732874

0.598823

1

Tab. 2

KOMPONENTY

C 1

C 2

C 3

C 4

% var.

82.15

13.45

2.59

1.81

cum% var.

82.15

95.6

98.19

100

Tab.3

Tabuľky č. 1 a 2 vyjadrujú intenzitu vzťahu medzi jednotlivými premennými neštandardizovanou hodnotou kovariancie a štandardizovanou hodnotou korelačného koeficientu. Tabuľka č. 3 vyjadruje v percentách úroveň celkovej variability vstupných premenných a časti variability vyjadrenej jednotlivými komponentmi. Ako je možné vidieť, pomocou prvých dvoch komponentoch bolo pri danej úrovni korelácie medzi premennými vyjadrené 95,6% variability vstupných premenných.

Pri interpretácií týchto hodnôt vychádzame z klesajúcej variability, ktorú jednotlivé komponenty vyjadrujú, pričom každý z nich vyjadruje určitú zložku časového radu (trend, reziduály a pod.). Priestorový aspekt zmien je vyjadrený modelmi jednotlivých komponentov. Prvý komponent vyjadruje najvyššiu variabilitu medzi jednotlivými prvkami časovej série (napr.82.15% variability všetkých vstupných údajov), čiže lokality v ktorých medzi jednotlivými modelmi došlo k najvýznamnejšej zmene. Vzhľadom na to, že komponenty sú nekorelované, každý ďalší komponent vyjadruje odlišné informácie a jemnejšiu úroveň zmeny ako prvý komponent. Druhý a tretí komponent teda vyjadrujú reziduály - variabilitu zmien (resp. menej podstatné zmeny) okolo trendu, vyjadreným prvým komponentom.

Obr.11 Aplikácia PCA na priestorové údaje. Modely t1 a t2 vyjadrujú silne korelované stavy z dvoch časových úsekov. Modely PC1 a PC2 vyjadrujú prvé dva nekorelované kompo-nenty, ktoré môžu byť interpretované ako deter-ministická zložka trendu a reziduály. (prohlédnout v plném rozlišení)

Ďalším postupom tejto kategórie analýz časových radov je detrendenčná analýza (Abraham a Ledolter 1983, Cryer 1986). Podobným spôsobom ako metóda hlavných komponentov umožňuje rozloženie časového radu na trendovú a náhodnú zložku a ich samostatné spracovávanie (obr. 12,13). Legendre a Legendre (1998) označujú trend časového radu ako deterministickú zložku analyzovaného javu danú jeho evolučným vývojom. Extrahovanie a analýzu tejto zložky kladú na prvé miesto v poradí analýz jednotlivých komponentov časovej série.

Obr.12 Na obrázkoch je možné vidieť a) priebeh časovej rady teplôt zaznamenávaných od 7.00 do 12.30 každých 15 minút. Obrázok vyjadruje trendovú a náhodnú zložka tohto radu. Trendová zložka bola aproximovaná funkciou priamky. Pre detailnejšiu analýzu je významné porovnanie hodnôt absolútneho a najmä regresného koeficienta rozličných časových radov (prohlédnout v plném rozlišení)

V prípade spojitých priestorových modelov majú v tejto súvislosti v GIS význam globálne metódy trendového povrchu, ktoré umožňujú extrahovať trendovú zložku analyzovaného javu.

Obr.13 a) vyjadruje komplexný priebeh analyzovaného javu, b) extrahovanú trendovú zložku a c) reziduály (prohlédnout v plném rozlišení)

Extrahovanie trendu je realizované preložením empirických údajov polynómom určitého rádu. Pri takomto postupe je vždy je potrebné uvažovať kvalitu tejto operácie. Táto je vyjadrovaná viacerými spôsobmi, je to napr. hodnota "goodness of fit", resp. suma reziduálov, ich rozdelenie a pod. Dôležité je, aby reziduály boli nezávislé a normálne rozdelené. Na tomto mieste je vhodné vykonať testy normálnosti rozdelenia.

Z hľadiska praktického riešenia je pri štúdiu trendovej zložky časového radu je vždy potrebné uvažovať, nakoľko je analyzovaný trend skutočným trendom a nakoľko je len súčasťou trendu pozorovaného vo vyšších dimenziách (ročných, desaťročných a iných cykloch).

Ďalšia metóda pre analýzu časových radov zo skupiny špecializovaných štatistických postupov je využitie polynomiálnych funkcií rozličného rádu pre prediktívne a retrospektívne modelovanie. Metóda je založená na preložení hodnôt časovej série určitým polynómom využitím metódy najmenších štvorcov, príp. iným postupom, vyhodnotení kvality tohto preloženia a určení neznámych hodnôt v rámci spracovávanej časovej domény (interpoláciou), alebo mimo nej (extrapoláciou).

Obr.14 Priebeh časového radu, šípkami sú vyznačené 3 predpovedané stavy (prohlédnout v plném rozlišení)

Aplikácia tohto postupu na priestorové údaje je jednoduchá. Môže byť realizovaná buď hodnotením vývoja časového radu na rozličných polohách (obr.14), alebo spracovaním celých modelov. V druhom prípade môže byť predikcia problematická, z dôvodu pravdepodobných rozdielov v charaktere vývoja javu na rozličných polohách. V tomto prípade vhodné vykonať určitú generalizáciu a konštruovať polynóm pre každú lokalitu modelu, v rámci ktorej je charakter vývoja javu možné považovať za stacionárny.

V prípade tohto typu analýz je otvorená otázka presnosti vytvoreného prediktívneho, alebo retrospektívneho modelu. Je zrejmé, že táto bude závisieť od intenzity korelácie medzi nezávisle premennou (časom) a jednotlivými prvkami časovej série a od kvality preloženia empirických hodnôt daným polynómom.

Brabenec et al. (1977) uvádzajú konkrétny postup pre určenie intervalu spoľahlivosti tohto odhadu na základe vzťahu:

Kde s`y n+1 je smerodajná chyba predikcie, I je korelačný index, sy je smerodajná odchýlka závisle premennej veličiny a n je počet pozorovaní.

Na základe týmto spôsobom určenej chyby predikcie je možné stanoviť chybový interval okolo bodového odhadu spôsobom

kde ta je kritická hodnota Studentovho t-rozdelenia pre a percentnú hladinu významnosti a n-2 stupňov voľnosti (95% = 2.2622).

Problematika chyby predikcie je odlišným spôsobom rozobraná v práci Johnsona (1978), ktorý uvádza tri hlavné zdroje tejto chyby

kde SY vyjadruje štandardnú odchýlku hodnôt Y, výraz 1 - r2XY vyjadruje koeficientom determinácie (r2) nevysvetlenú časť variability hodnôt Y.

kde SY vyjadruje štandardnú odchýlku hodnôt Y a N rozsah základného súboru

kde SY vyjadruje štandardnú odchýlku hodnôt Y, SX vyjadruje štandardnú odchýlku hodnôt X

Na základe týchto zdrojov je štandardná chyba predikcie formulovaná ako:

V biológií, ekonomike, či v sociálnych vedách sa často stretávame s využívaním exponenciálneho, alebo logaritmického modelu časového radu. Z hľadiska prírodných vied má významné využitie polynómov v tvare S, ktoré aproximujú stav, kde v počiatočných štádiách systém narastá veľmi intenzívne (trh, určitý biologický systém), potom dosahuje svoje nasýtenie (tzv. saturačnú úroveň) a ďalej sa vyvíja pozvoľna. Špecifické a veľmi účinne riešenie v niektorých prípadoch ponúkajú tzv. Gompertzove krivky (Mitášová at al. 1995) v tvare:

Pre určenie parametrov a,b,c sa používa tzv. Kingova metóda. Význam Gompertzových kriviek je predovšetkým v ich modulárnosti a schopnosti prispôsobovať sa zmenám vo vývoji modelovaného javu. Exponenciálne, alebo logaritmické funkcie predpokladajú konštantnú dynamiku tempa rastu súboru, zatiaľ čo v prípade Gompertzových kriviek je možné modelovať situáciu "vymierania" súboru, alebo stav, kedy sa intenzita javu plynulo mení. Ďalšie špecifické rastové krivky (Michajlova, Korsuňova, Koriho, Chapmanova-Richardsnova, alebo Warenova prírastková funkcia) s aplikáciami najmä v lesníctve uvádza napr. Scheer (1991).

Z hľadiska práce s kvalitatívnymi údajmi sú mimoriadne významné nástroje tretej kategórie špecializovaných postupov pre prácu s priestorovými údajmi. Metódy krížovej klasifikácie a tabuľkového triedenia patria medzi najpoužívanejšie nástroje pre vyjadrenie zmeny dvoch kvalitatívnych modelov. Tieto postupy sú ľahko realizovateľné a výsledky jednoducho interpretovateľné. V prípade tabuľkového triedenia (crosstabulation) sú frekvencie kategórií obidvoch modelov vynesené do tabuľky a vyhodnocuje sa proporcionálna a absolútna zmena jednotlivých kategórií a celého modelu. Hodnoty na diagonále tabuľky vyjadrujú údaje bezo zmeny, údaje mimo diagonály vyjadrujú zmenu. Marginálne početnosti vyjadrujú úroveň zmeny jednotlivých kategórií modelu. Na základe vzťahov medzi hodnotami na diagonále, celkového počtu spracovávaných pixelov a marginálnych početností je jednoducho možné určiť percentuálnu úroveň zmeny každej kategórie a celého modelu.

t1

t2

Ihličnaté

Zmiešané

Listnaté

Voda

Suma

Zmena

Ihličnaté

3202

0

56

0

3258

0.017

Zmiešané

113

2691

0

0

2804

0.042

Listnaté

1

0

4492

0

4493

0.0002

Voda

0

0

0

1958

1958

0

Suma

3316

2691

4548

1958

12513

Zmena

0.035

0

0.012

0

0.013

Tab. 4 Matica vyjadruje štruktúru kategórií druhotnej krajinnej štruktúry v časových úsekoch 2000 a 2002 uvedenú na obr.18.Marginálne početnosti vyjadrujú úroveň zmeny jednotlivých kategórií a celého modelu.

Z tabuľky 4 je možné vidieť, že údaje na hlavnej diagonále reprezentujú prípady, keď hodnoty časového úseku t1 zodpovedajú časovému úseku t2. Záznamy mimo diagonál vyjadrujú zmenu. Marginálne početnosti v stĺpcoch a riadkoch vyjadrujú proporčnú úroveň zmeny jednotlivých kategórií. V pravej dolnej časti tabuľky je uvedená celková proporčná zmena modelu. Napr. hodnota proporčnej úrovne zmeny v spodnom riadku matice 0.17, bola získaná ako podiel všetkých hodnôt danej kategórie (29) k sume zmenených prvkov (5).

5 / 29=0.17

Celková proporčná zmena 0.19 bola vypočítaná ako podiel sumy hodnôt všetkých zmenených prvkov (24) a sumy celkového počtu hodnôt matice (126).

Ako je možné vidieť so štruktúry kontingenčnej tabuľky a z výsledkov hodnotenia úrovne zmeny jednotlivých kategórií, získavame vždy dve hodnoty vyjadrujúce zmenu danej kategórie. Spôsob ich interpretácie nie je jednoznačný. Na základe pravidiel pre interpretáciu kontingenčnej tabuľky ako chybovej matice (napr. pri teste klasifikácie snímkov DPZ), kde sa stretávame s tzv. "errors of ommision" a "errors of commision", je možné k uvedeným hodnotám pristupovať ako k "zmene na úkor hodnotenej kategórie" a "zmene na úkor iných kategórií".

Odlišný prístup k interpretácií hodnôt kontingenčnej tabuľky uvádzajú Lilesand a Kiefer (1994). Úroveň zmeny kategórií tabuľky 4 je interpretovaná nasledovným spôsobom:

Zmena 1

Zmena 2

Ihličnaté

24/29 82%

Ihličnaté

24/27 88%

Zmiešané

36/36 100%

Zmiešané

36/55 0.65%

Listnaté

28/44 63%

Listnaté

28/28 100%

Voda

14/17 82%

Voda

14/16 87%

Celková úroveň zmeny

(24 + 36 + 28 + 14) /126 = 80%

Metóda krížovej klasifikácie (crossclasification) graficky vyjadruje vzťahy v kontingenčnej tabuľke (obr.15).

Obr.15 Postup krížovej klasifikácie modelov z dvoch časových úsekov. (prohlédnout v plném rozlišení)

Medzi ďalšie nástroje tejto kategórie patrí séria Kappa indexov (Rosenfield a Fitzpatrick-Links 1986, Lilesand a Kiefer, 1994), ďalej rozvinutá Pontiusom (2000) a Pontiusom a Suedmeyerom (2001). KAPPA index of Agreement, známy aj ako KAPPA coefficient of agreement, KIA, alebo KHAT bol prvý krát uvedený psychológom Cohenom v roku 1960 a pre testy presnosti snímok DPZ bol následne upravený Congaltonom a Meadom (1983). Hlavná aplikačná oblast Kappa indexov spočíva v testovanie presnosti kvalitatívnych údajov (najmä snímok DPZ) v porovnaní s referenčným modelom. Pri určitom spôsobe interpretácie je možné tieto nástroje využiť pre hodnotenie zmeny kvalitatívnych kategórií v dvoch časových úsekoch (Eastman 1999). Táto metóda je svojou podstatou spätá s metóda krížovej klasifikácie a tabuľkového triedenia. Líši sa predovšetkým logikou výpočtu, ktorá je zameraná predovšetkým na porovnanie úrovne zmeny ku ktorej došlo cieleným vývojom s náhodným modelom. Napríklad hodnota Kappa indexu pre zmenu stavou v rokoch 2000/2002 na obr.18 je 0,9813.

Medzi najsofistikovanejšie nástroje tejto kategórie nástrojov pre analýzy časových radov patria metódy Markovových reťazcov a bunkových automatov. Markovove procesy sú procesy, pri ktorých predpokladáme, že budúci stav Xn+1 daný predchádzajúcimi stavmi X0, X1, Xn-1 a súčasným stavom Xn je nezávislý na stavoch predchádzajúcich a závisí výlučne na súčasnom stave (Ross 1997). Hodnota Pij vyjadruje pravdepodobnosť, že proces nachádzajúci sa v stave i prejde do stavu j.

Ak predpokladáme, že jednotlivé pravdepodobnosti sú nenegatívne a proces musí prejsť do ďalšieho stavu tak:

Využitie týchto nástrojov je možné jednoducho demonštrovať na nasledujúcom príklade. Predpokladajme príklad, že pravdepodobnosť, že zajtra bude pršať závisí výlučne na súčasnom stave a nie na stavoch predošlých dní. Jedná sa teda o Markovov proces. Ďalej predpokladajme, že ak prší dnes, tak pravdepodobnosť že bude pršať aj zajtra je a. V prípade, že dnes neprší, pravdepodobnosť, že bude pršať zajtra je ß. Pravdepodobnostná matica má teda tvar

Samotné pravdepodobnosti v matici je možné určiť viacerými spôsobmi. Na jednej strane prostou úvahou, na druhej strane na základe vyhodnotenia zmien stavov v predchádzajúcom období. Takto skonštruovanú maticu je možné využiť pri predikciách na určité obdobie. Pri predikciách sa využíva tzv . Chapman-Kolmogorovova rovnica.

kde

Čiže ak P(n) označuje maticu n prechodov pravdepodobností P nij tak podľa Chapman-Kolmogorovovej rovnice:

Uvažujme vyššie uvedený prípad s počasím, kde a = 0.7 a ß = 0.4. Určíme pravdepodobnosť, s akou bude pršať štyri dni od dnes, v prípade že dnes prší. Pravdepodobnostná matica má tvar

Čiže pravdepodobnosť, že za štyri dni bude pršať je 0.5749 (upravené podľa Rossa, 1997).

Z podstaty aplikácie Chapman-Kolmogorovovej rovnice vyplýva, že predikciu nie je možné realizovať na ľubovolne dlhé obdobie. Zmena pravdepodobnosti nastatia určitého javu totiž bude s predlžovaním dĺžky obdobia predikcie konvergovať k nule.

Ďalej uvažujme konkrétny prípad, pri ktorom po určitom časovom období dôjde k zmene spôsobu využitia krajiny. Zameriame sa na konkrétne kategórie využitia zeme - lúky (L), pasienky (P) s výrazným náletom drevín a les (Le). Hodnotíme pravdepodobnosť ich zmeny na iný spôsob využitia. V prípade zmeny kategórie L na kategórie L,P a Le je 0.6, 0.3 a 0.1. V prípade kategórie pasienky s výrazným náletom drevín je pravdepodobnosť zmeny na les 0.3, pravdepodobnosť zachovania stavu 0.4 a pravdepodobnosť zmeny na lúku 0.3. V prípade kategórie les je pravdepodobnosť, že na danom území bude po určitom časovom úseku opäť les 0.6, pravdepodobnosť zmeny na pasienky s výrazným náletom drevín je 0.3 a pravdepodobnosť zmeny na lúku 0.1.

Pomocou pravdepodobnostnej matice sú tieto stavy vyjadrené nasledovne

Nasledujúci príklad demonštruje využitie týchto princípov na konkrétnych priestorových údajoch. Na obr.16 je časť modelu biotopov oblasti Banskej Štiavnice mapovaná v roku 1998 a to isté územie v roku 2000. Ako je možné vidieť, došlo k určitej zmene hraníc. Pomocou tzv. tranzitnej pravdepodobnostnej matice (tab.5) je vyjadrená pravdepodobnosť zmeny jednej kategórie na druhú za určité časové obdobie.

Obr.16 Mapky vyjadrujú zmenu štruktúry biotopov medzi obdobím rokov 1998 a 2000. (prohlédnout v plném rozlišení)

K1

K2

K3

K4

K5

K6

K7

K8

K9

K10

K1

1.0000

0.0000

0.0000

0.0000

0.0000

0.0000

0.0000

0.0000

0.0000

0.0000

K2

0.0000

1.0000

0.0000

0.0000

0.0000

0.0000

0.0000

0.0000

0.0000

0.0000

K3

0.0000

0.0000

0.9876

0.0000

0.0000

0.0000

0.0124

0.0000

0.0000

0.0000

K4

0.0727

0.0000

0.0000

0.9273

0.0000

0.0000

0.0000

0.0000

0.0000

0.0000

K5

0.0000

0.0000

0.0000

0.0000

1.0000

0.0000

0.0000

0.0000

0.0000

0.0000

K6

0.0000

0.0000

0.0000

0.0000

0.0000

1.0000

0.0000

0.0000

0.0000

0.0000

K7

0.0000

0.0000

0.0000

0.0000

0.0000

0.0000

1.0000

0.0000

0.0000

0.0000

K8

0.0000

0.0046

0.0000

0.0000

0.0000

0.0017

0.0000

0.9937

0.0000

0.0000

K9

0.0000

0.0000

0.0000

0.0000

0.0000

0.0000

0.0000

0.0000

1.0000

0.0000

K10

0.0000

0.0000

0.0000

0.0000

0.0000

0.0000

0.0000

0.0000

0.0000

1.0000

Tab.5 Pravdepodobnostná tranzitná matica vyjadruje pravdepodobnosť zmeny jednej kategórie biotopu na druhú určenú na základe Chapman-Kolmogorovovej rovnice na obdobie 2004 (dvojnásobok intervalu medzi stavmi na obr.16).

Údaje získané z pravdepodobnostnej matice sú využiteľné buď ich priamou interpretáciou, alebo vytvorením priestorového modelu vyjadrujúceho potenciálny stav v akom sa mapované kategórie budú nachádzať. Toto je možné realizovať napr. využitím techník bunkových automatov (cellular automata).

Teória bunkových automatov bola prvý krát sformulovaná Johnom von Neumannom v roku 1950 a behom najbližších dvoch desaťročí si získala popularitu najmä vďaka John Conwayovej "Hre života". Teória bunkových automatov je založená na množine určitých stavov a pravidiel, na základe ktorých je modelovaný vývoj systému v priestore a čase. (Cole a Albrecht 1999). Bunkové automaty samotné môžu byť považované za virtuálne nekonečnú maticu buniek v n - rozmernom priestore (zväčša 2D), ktorá sa vyvíja v čase na základe explicitne určených pravidiel. Bunkové automaty sú dynamické matematické systémy založené na diskrétnom koncepte priestoru a času (Li et al. 2001).

Základným pravidlom bunkových automatov je to, že stav t1 závisí len na stave v akom sa bunka nachádza v stave t a nie na predošlých stavoch a na stave okolitých buniek. Po tejto stránke je princíp bunkových automatov podobný Markovovým reťazcom. Pravidlá, alebo tzv. "transition rules" sú určované na základe určitej schémy, alebo harmonogramu, ktorý určuje podmienky prechodu buniek do ďalšieho stavu. (Cecchini a Rinaldi, 1957).

Tranzitné pravidlá môžu byť formulované niekoľkými spôsobmi. Napríklad v jednorozmernom systéme zápis "011 -> x0x" znamená, že centrálna bunka nadobudne hodnotu 0 v prípade, že v predchádzajúcom stave mala hodnotu 1 a z prava sa nachádzala bunka s hodnotou 0 a zľava bunka s hodnotou 1. Odlišný, tzv. totalistický prístup k stanoveniu tranzitného pravidla spočíva vo vyhodnotení sumy buniek v susedstve centrálnej bunky. Napríklad v prípade, že suma hodnôt okolitých buniek je 4, bunka prežíva (dostane atribút 1) a vo všetkých ostatných prípadoch bunka umiera (0).

Mierne odlišný prístup k časovo-priestorovému modelovaniu ponúkajú tzv. reverzibilné bunkové automaty. Slúžia pre tvorbu retrospektívnych modelov a ich jediný rozdiel od štndardných bunkových automatov je v tom, že proces prebieha smerom späť (Schatten, 1999).

S aplikáciami metódy bunkových automatov sa v súčasnosti stretávame v množstve oblastí. Okrem iného sú to napr. modelu rastu, alebo rozvoja urbánnych oblastí, modely šírenia požiarov, alebo rastlinných druhov, stretávame sa s modelovaním dynamiky využitia zeme, množstvom ekologických aplikácií a dokonca aj s modelmi šírenia kriminality v mestách (Liang et al., 2001). Bunkové automaty podstatou svojej činnosti napĺňajú základný funkčno-štruktúrálny koncept reálneho sveta, ktorý je možné sformulovať vetou "lokálne interakcie vedú ku globálnej dynamike".

Jednou z najznámejších aplikácií technológie bunkových automatov je Conwayova "Game of Life". John Horton Conway vyvinul tento algoritmus v 70 rokoch minulého storočia pre modelovanie rozličných prírodných dynamických procesov, kde početnosti živých organizmov stúpajú, klesajú, alebo zanikajú na základe podmienok okolia.

Základná idea je určenie určitej počiatočnej konfigurácie buniek a aplikácií Conwayovho zákona o zrodení, zániku a prežití buniek. Tento zákon je formulovaný nasledovne:

Základné Conwayove pravidlá, na princípe ktorých sa štruktúra vyvíja, sú nasledovné:

Dôležitá skutočnosť, ktorú si je pri bunkových automatoch potrebné uvedomiť je, že uvedený proces sa deje simultánne v celej bunkovej štruktúre (obr. 17).

Obr.17 Prediktívny model vývoja počiatočnej štruktúry na základe pravidiel Conwayovej hry života. (prohlédnout v plném rozlišení)

Kombinácia pravdepodobnostného mechanizmu Markovových reťazcov a bunkových automatov vytvára silný prediktívny nástroj časových radov pre kvalitatívne údaje. Do procesu prediktívneho modelovania vstupujú ako podklady binárne modely jednotlivých kategórií (počet modelov zodpovedá počtu kategórií) a pravdepodobnostná tranzitná matica. Matica o veľkosti napr. 5x5 buniek prechádza cez binárne modely jednotlivých kategórií. V prípade že sa nachádza v lokalitách pokrytých hodnotami 1 hodnoty výsledného modelu sú 1, v prípade že matica prechádza nulovými hodnotami modely výsledného modelu sú 0. V prípad, že matica prechádza časťami modelu nachádzajúcimi sa na prechode medzi 1 a 0 hodnoty výsledného modelu sú v rozsahu 0-1. Výsledok operácie je následne násobený hodnotou pravdepodobnosti zmeny tejto kategórie (Eastman 1999). Na základe tohto prístupu je v prípade kategórií, ktoré zaznamenali najvýznamnejšiu zmenu oproti minulému stavu v ďalších časových úsekoch pozorovaný najdynamickejší vývoj. Výsledok tejto operácie aplikovaný na údaje z vyššie uvedeného mod elového územia využitím pravdepodobnostnej tranzitnej matice uvedenej v tab.5 je uvedený na obr. 18.

Obr.18 Výrez modelu biotopov v území Štiavnické Bane. Obrázok vyjadruje zmenu štruktúry biotopov v rokoch 2000/2002 s predikciou realizovanou na obdobie rokov 2006 - 2008 využitím Markovových reťazcov a bunkových automatov. (prohlédnout v plném rozlišení)

Metóda Vector Change Analyses je využívaná najmä pri analýzach zmien hodnôt odrazivosti spektrálnych snímok z rozličných časových úsekov. Spracovávať je možné série spektrálnych snímok z rozličných časových úsekov, pre ktoré vyjadrujeme predovšetkým veľkosť zmeny. V prípade porovnávania dvoch snímok je možné vyjadriť veľkosť, aj smer tejto zmeny (Eastman, 1999). Tieto skutočnosti sú uvedené na obr. 19.

Obr.19 Schéma a) vyjadruje veľkosť a schéma b) smer zmeny hodnôt medzi dvomi časovými úsekmi t1 a t2.

Záver

Štúdium časovej a priestorovej štruktúry prírodných javov je stredobodom záujmu množstva vedných odborov. Ich vzájomná integrácia na na spoločnej platforme geografických informačných systémov a v GIS databázach vytvára novú kvalitu, umožnujúcu pochopenie mnohých štrukturálnych a funkčných vzťahov, ktoré pri štandardných prístupoch zostávajú skryté. Analýza charakteru časového radu, rozbor jeho jednotlivých zložiek a prediktívne modelovanie realizované na úrovni priestorových údajov odkrýva skutočnosti umožňujúce na jednej strane dôkladné pochopenie správania systému a na strane druhej vypracovanie opatrení na tých miestach a v takom rozsahu, ako daná situácia vyžaduje. RealTime a NearRealTime GIS s rozvojom telematických technológií a dostupnosťou počítačových systémov umožňujúcich spracovanie údajov v reálnom čase postupne prenikajú do množstva oblastí bežného života. Postupom času sa bude v GIS projektoch obdobne ako priestorový referenčný systém, definovať aj časový referenčný rámec so svojími parametrami odvíjajúcimi sa zo štrukturálnych charakteristík času a požiadaviek projektu samotného.

V príspevku sme sa snažili priniesť informácie o problematike časového aspektu geoúdajov, pozícií parametru času v GIS databázach, navrhli sme možnú klasifikáciu metód analýz časových radov umožňujúcich jednoduchú integráciu v prostredí GIS a rozobrali sme niektoré metódy, ktoré považujeme za základ pre realizáciu časovo-priestorových analýz. Veríme, že tento príspevok pomôže k lepšiemu pochopeniu problematiky časového aspektu geoúdajov a zvýrazní polohu analýz časových radov v rámci analytických nástrojov GIS.

Literatúra

  1. Abraham, B., Ledolter, J. (1983) Statistical methods for forecasting. New York: Wiley.
  2. Armstrong, M.P. (1988) Temporality in Spatial Databases, Proceedings of GIS/LIS '88, Falls Church, VA:American Congress on Surveying and Mapping, 2, pp. 880-889
  3. Bakytová, B., Ugron, M., Kontšteková, O.,(1975) Základy štatistiky, ALFA Bratislava
  4. Berry, B., (1964) Approaches to Regional Analysis: A Synthesis", Annals of the Association of American Geographers, Vol. 54, pp. 2-11
  5. Bowerman, G.D., O`Connel, R.T., (1987) Time series forecasting, Duxbury Press, Boston
  6. Brabenec, V., Divilová, Z.,Macháček, O., (1977) Matematická štatistika, SPN Praha
  7. Cecchini, A.,Rinaldi, E., (1957) The Multi - Cellular Automaton: A Tool to Build more Sophisticated Models.A Theoretical Foundation and a Practical Implementation, Laboratorio sulla Simulazione, DAEST - IUAV, Ca' Tron S.Croce
  8. Cole, V.,Albrecht, J., (1999) Exploring Geographic Parameter Space with a GIS, Implementation of Cellular Automata, The 11th Annual Colloquium of the Spatial Information Research Centre, University of Otago, Dunedin, New Zealand
  9. Congalton, R.G., Mead, A.R., (1983) A Quantitative Method to Test for Consistency and Correctness in Photointerpretation, Photogrammetric Engeneering and Remote Sensing 49,1, pp. 69-74
  10. Cryer, J.D., (1986) Time series analysis, PWS-Kent Pub Co., Boston
  11. DeMers, M.N., (1997) Foundamentals of Geographic Information Systems, John Wiley&Sons Inc.
  12. Eastman, J.R., (1999) Guide to GIS and Image Processing, Volume 2, Clark Labs, Worcester, MA
  13. Gardner, M., (1970) Mathematical Games, The fantastic combinations of John Conway's new solitaire game "life", Scientific American 223, pp. 120-123
  14. Hazelton, N.W.J., (1992) Develompents in Spatio-Temporal GIS, In: Geographical Information Sciences Research in Victoria and Tasmania", Ballarat University College, http://geomatics.eng.ohio-state.edu/Papers/Ballarat_92/ Ballarat_9216.html
  15. Hlásny, T., Polčák, N., Krátka E., Využitie GIS pri výskume miestnej klímy, unpubl.
  16. Joerin, F., Claramunt, C., (1994) Integrating the Time Component in a GIS: an Application to Assess Flooding Impacts on Agricultur, EGIS, pp.524-532
  17. Johnson, R.K., (1978): Multivariate Statistical Analysis in Geography, Longman Group Limited, GB
  18. Kemp, Z., Kowalczyk, A., (1994) Innovations in GIS 1, Taylor and Francis, London
  19. Langran, G., Chrisman N., (1988) A Framework for Temporal Geographic Information, Cartographica, 25(3), pp. 1-14
  20. Langran, G., (1992) Time in geographical information systems, London, Taylor & Francis
  21. Lantner, D., (1992) Intelligent Assistants for Filling Critical Gaps in GIS, Department of Geography, University of California at Santa Barbara
  22. Legendre, P., Legendre, L., (1998) Numerical ecology, Second English Edition, Elsevier London
  23. Li, B.,Wilkinson, G.,G., Khaddaj, S., (2001) Cell-based Model For GIS Generalization, Proceedings of the 6th International Conference on GeoComputation
    University of Queensland, Brisbane, Australia, CD-Rom
  24. Lillesand M.T., Kiefer R.W., (1994) Remote Sensing and Image Interpretation, John Wiley & Sons, New York
  25. Liang, J., Liu, L., Eck, J.,(2001) Simulating Crimes and Crime Patterns Using Cellular Automata and GIS, http://www.cobblestoneconcepts.com/ucgis2summer /liang/ liang.htm
  26. Yuan, M., (1997) Temporal GIS and Spatio-Temporal Modeling, The University of Oklahoma,http://www.ncgia.ucsb.edu/conf/SANTA_FE_CD-ROM/sf_papers/yuan_may /may.html
  27. Mitášová, I., Veverka, B., Pezlar, Z., (1990) Základy teórie systémov kybernetiky s aplikáciami v geodézií a kartografií, Alfa, Bratislava
  28. Ott, T., Swiaczny, F., (2001) Time-Integrative Geographic Information Systems, Springer, Berlin/Heidelberg/New York
  29. Peuquet, D. J., Duan, N., (1995) An event-based spatiotemporal data model (ESTDM) for temporal analysis of geographical data. International Journal of Geographical Information Systems, 9(1), pp. 7-24
  30. Pontius, G.,Suedmeyer, B., (2001) Assessing map accuracy by components of chance, change, quantity, stratification, location and resolution, Clark University, Australia, elektronická prezentácia
  31. Pontius Jr, R.G., (2000) Quantification error versus location error in comparison of categorical maps. Photogrammetric Engineering and Remote Sensing. 66(8) pp. 1011-1016.
  32. Red-Horse, J. R., Alvin, K. F., Mignolet, M. P., Robertson, A. N., (1996) An Investigation of Three Major Time Series Data Analysis Techniques, 14th International Modal Analysis Conference, Dearborn, AIAA Journal, Vol. 34, No. 8, 1996, pp. 1678-1685
  33. Ringert, J.,Legat, K., (2001): Air Pollution Information System (APIS), Presented at the United Nations / United States of America Workshop on "The Use and Applications of GNSS", Vienna, Austria, 7 p.
  34. Ross, S.M., (1997) Probability Models, Academic Press
  35. Rosenfield, G.H.,Fitzpatrick-Links, K., (1986) A Coefficient of Agreement as a Measure of Thematic Classification Accuracy, Photogrammetric and Engineering and Remote Sensing, 52,2, pp. 223 - 227
  36. Schatten, A., (1999) Digital Worlds, http://www.ifs.tuwien.ac.at/~aschatt/info/ ca/ca.html
  37. Scheer, L.,(1991) Návody pre cvičenia zo štatistických metód v lesníctve, VŠLD Zvolen,
  38. Wahl, K.L., Thomas, W.O., Hirsch R.M., (1995) Stream-Gaging Program of the U.S. Geological Survey, U.S. Geological Survey Circular 1123, Reston, Virginia, http://water.usgs.gov/pubs/circ1123/
  39. Worboys, M. F., (1992) A model for spatio-temporal information. Proceedings: the 5th International Symposium on Spatial Data Handling, 2, pp. 602-611