GISáček


Posouzení možnosti využití ArcIMS pro prezentaci rozsáhlých rastrových dat

Tomáš Ježek
Institut geoinformatiky
VŠB – Technická univerzita Ostrava
tř. 17. Listopadu
708 33 Ostrava – Poruba
E – mail: t.jezek@volny.cz

Abstract

In this present work is process a using of ArcIMS by publication of spatial data. The main emphasis is put on publication of vast raster data which are saved in DBMS with using of ArcSDE. In the first of two chapters is shown a description and principle of work ArcIMS and ArcSDE products. In the second chapter is described a realisation of actual work. This is possible to divide into a few parts. First two parts are describing a preparation of useful data and used methods of their saving. In the next part is described a creating of a map application as a web ArcIMS client which is used for testing of ArcIMS output. That is followed by description of testing and monitoring of ArcIMS work. The next two chapters are about statistical comparison of ArcIMS performance with regard to a particular methods of spatial raster data saving. The conclusion of the work is includes a review of ArcIMS and ArcSDE function and possible recomandation concerning the saving and publication of spatial raster data.

Abstrakt

V předložené práci je zpracováno využití programového prostředku ArcIMS při publikovaní prostorových dat. Hlavní důraz je kladen na publikování rozsáhlých rastrových dat, které jsou uloženy v DBMS s využitím programového prostředku ArcSDE. V prvních dvou kapitolách je uveden popis a princip fungování programových prostředků ArcIMS a ArcSDE. V další kapitole je popsána realizace samotné práce. Tu lze rozdělit do několika částí. První dvě popisují přípravu potřebných dat a použité metody jejich ukládání. V další části je popsáno vytvoření mapové aplikace v podobě webového klienta ArcIMS, která slouží k testování výkonu ArcIMS. Následuje popis techniky testování a monitorování činnosti ArcIMS. Další dvě kapitoly pojednávají o statistickém srovnání výkonu ArcIMS s ohledem na jednotlivé metody uložení rastrových prostorových dat. Závěr práce obsahuje zhodnocení fungovaní technologie ArcIMS a ArcSDE a možná doporučení týkající se ukládání a publikace rastrových prostorových dat.

Úvod

V současné době se neustále rozšiřuje počet lidí využívajících moderní informační technologie. Největšího rozmachu v této oblasti jistě dosáhla mezinárodní počítačová síť Internet. Ta je schopná svým uživatelům zprostředkovat kontakt a informace z nespočetných oblastí lidského konání. Počet uživatelů Internetu na celém světě neustále roste a spolu s neustálým příchodem nových technologií tento trend jistě přetrvá. Také oblast geoinformačních technologií (GIT) sleduje tento trend a přibližuje se stále širšímu počtu uživatelů. Již dlouhou dobu to není uzavřená komunita lidí, jež se zabývá touto oblastí profesionálně nebo z čistého nadšení pro věc. Jestliže ještě před deseti lety byl navigační systém GPS pojmem z oblasti vojenských technologií, případně špionážních filmů, tak v dnešní době tento systém může využít každý turista při svých výletech za poznáním. Velký rozmach v oblasti GIT prodělala technologie prezentace a publikování prostorových dat prostřednictvím počítačových sítí, zejména Internetu a intranetu. K rozšiřování těchto technologií jistě přispívá podpora ze strany státních orgánů. Tyto technologie jsou používány nebo budovány na většině městských úřadů, magistrátech velkých měst či úřadech nově vzniklých krajů. Mnoho z těchto subjektů již v současné době prezentuje a publikuje vybraná prostorová data. Na jedné straně tato technologie slouží zaměstnancům daného úřadu či organizace a na straně druhé široké veřejnosti. Také řada soukromých subjektů a organizací zavádí tyto technologie do provozu, protože jejich využití např. v oblasti prodeje výrobků, služeb a marketingu je značné. Nelze opomenout využití těchto technologií v oblasti záchranných služeb a při řízení krizových situací. Uvedený výčet možností aplikací této technologie samozřejmě není konečný a našla by se jich ještě celá řada. V budoucnu nás jistě čeká další přibližování zmiňované technologie co nejširšímu počtu uživatelů. Vzhledem k této skutečnosti je diplomová práce zaměřena na posouzení možnosti využití programového prostředku ArcIMS pro publikování prostorových dat prostřednictvím počítačových sítí Internetu a intranetu. Hlavní důraz je kladen na prezentaci rozsáhlých prostorových rastrových dat.

Cíle diplomové práce

Hlavní cíl diplomové práce, je ověřit možnosti využití programového prostředku ArcIMS pro potřeby prezentace rozsáhlých rastrových dat: Pro dosažení tohoto cíle bylo nutné splnit následující úkoly. První z nich je seznámení se s problematikou prezentace a publikováním prostorových dat prostřednictvím Internetu a intranetu, se zaměřením na konkrétní programový produkt, kterým je ArcIMS. Předmětem zájmu jsou rozsáhlá rastrová data, a proto bylo nutné seznámit se nejprve s metodami ukládání a možnostmi prostorové indexace těchto dat. Získané poznatky byly využity při řešení fyzického uložení rastrových dat s využitím relační databáze prostřednictví programového prostředku ArcSDE. Další krok představuje vytvoření mapové aplikace v podobě webového klienta, která umožňuje prezentaci a základní prostorové operace s těmito daty. Aplikace by měla sloužit k ověření a testování různých způsobů uložení a reprezentace rastrových dat. Posledním úkolem je návrh způsobu testování a hodnocení výkonnosti mapového serveru v závislosti na způsobu uložení rastrových dat.

ESRI - ArcIMS

ArcIMS je programový prostředek firmy ESRI, který slouží k distribuci prostorových dat prostřednictvím intranetu a Internetu a dále k tvorbě aplikací, které prezentují prostorová data. Je to komplexní prostředí, jehož součástí jsou nástroje pro tvorbu a administraci interaktivních mapových aplikací, nástroje pro distribuci prostorových dat prostřednictvím mapových služeb a samozřejmě klientských programů pro přístup k nim. ArcIMS je typickým příkladem aplikace založené na principu "klient-server". Klient ArcIMS zasílá požadavek (response) ArcIMS serveru s využitím síťového protokolu HTTP. Po zaslání požadavku je spojení mezi klientem a serverem uzavřeno do doby, než serverová část ArcIMS vygeneruje odpovídající odpověď (request) a pošle ji zpět klientovi. Každý požadavek a jemu náležející odpověď se nazývá transakce.

Architektura ArcIMS

Programový produkt ArcIMS je souborem řady komponent. Tyto komponenty je možno rozdělit na dvě hlavní složky. První z nich je serverová komponenta, která jak již sám název napovídá, pracuje na serverovém počítači a spolu s webovým serverem je zodpovědná za vygenerování odpovědi. Druhou složkou je klientská komponenta, která slouží uživateli ArcIMS, který jejím prostřednictvím zasílá požadavky na server.

Využití ArcIMS v diplomové práci

Název diplomové práce "Posouzení možnosti využití ArcIMS pro prezentaci rozsáhlých rastrových dat" již napovídá, že hlavní předmětem zájmu je publikování rozsáhlých rastrových dat. Rastrová data byla uložena dvěma způsoby. Prvním způsobem bylo uložení dat v DBMS s využitím programového prostředku ArcSDE. Druhý způsoby představoval image katalog snímků ve formátu MrSID, uložený na lokálním pevném disku serverového počítače. Tato data byla zpřístupněna ArcIMS. ArcIMS bude pro účely práce sloužit jako mapový server, využívající mapovou službu typu ImageServer, prostorová data budou putovat ke klientovi ve formě vygenerovaných rastrových souborů. Klientem ArcIMS bude standardní webový prohlížeč. Tato konfigurace byla zvolena zadavatelem diplomové práce a s ohledem na konzultované požadavky GIS oddělení Krajského úřadu ve Zlíně. Důvodem použití tohoto řešení jsou nejmenší nároky na technické a programové vybavení uživatelských počítačů a z toho vyplývající stabilita řešení. Další výhodou jsou menší nároky na údržbu systému. Jedním z úkolů diplomové práce bylo otestování výkonu ArcIMS. V tomto kroku byly využity nástroje pro monitorování, které jsou součástí ArcIMS.

ESRI - ArcSDE

ArcSDE je programový prostředek, který umožňuje využívat a spravovat prostorová data prostřednictvím DBMS. Obecně vzato je to tedy prostředník mezi aplikacemi pracujícími s prostorovými daty a některým z komerčních databázových systémů, v němž jsou prostorová data uložena. ArcSDE podporuje následující čtyři SŘBD:
 
- IBM DB2
- IBM Informix
- Microsoft SQL Server
- Oracle

Výhody uložení prostorových dat v prostředí DBMS jsou jasné. Prostorová data jsou centrálně uložena v jedné databázi a je k nim zajištěn přístup široké řady klientů a uživatelů, samozřejmě s odpovídajícími možnostmi zabezpečení dat. Toto řešení dále umožňuje editování dat prostřednictvím většího počtu uživatelů, využití dlouhých transakcí, tvorbu alternativních verzí prostorových dat apod. ArcSDE pracuje s prostorovými daty v jejich obvyklých formátech a překládá je přímo do formátů, které jsou podporovány databázovými systémy. To umožňuje využití širokých možností, které moderní databázové prostředky nabízejí.

Uložení dat v ArcSDE

Klíčovým pojmem v oblasti managementu dat prostřednictvím ArcSDE je geodatabáze. Tento termín používá ve svých produktech firma ESRI. Geodatabázi si lze představit jako skladiště prostorových dat v DBMS. Může obsahovat velkou řadu vektorových dat, rastrových dat, tabulek a dalších objektů. Geodatabáze může mít různou velikost a různý počet uživatelů, od malých jednouživatelských databází až po rozsáhlé celopodnikové, které najednou využívá celá řada uživatelů. Geodatabáze používá objektově-relační vektorový datový model. Jednotlivé prostorové entity jsou v geodatabázi reprezentovány jako objekty s určitými vlastnostmi, vztahy a vazbami. Podporována je široká paleta různých typů prostorových dat. Může se jednat o samostatné objekty a geoprvky (features), prvky s jasně definovanou topologií, sítě a další speciální typy prostorových objektů. Datový model geodatabáze dále umožňuje definovat vazby, vztahy a pravidla mezi uloženými geoprvky.

Využití ArcSDE v diplomové práci

Při zpracování diplomové práce bylo využito ArcSDE ve verzi 8.2. Databázovým systémem (DBMS) byl Microsoft SQL 2000 Server [19]. Prostřednictvím ArcSDE byla do databáze ukládaná rastrová a vektorová data, která byla publikována programovým prostředkem ArcIMS. Vektorová data, která tvořila Shapefile soubory, byla uložena do DBMS jako samostatné třídy geoprvků (Features class). Rastrová data, která tvořila kolekce leteckých snímků, byla uložena do DBMS dvěma způsoby. Prvním způsobem bylo vytvoření mozaiky ze všech snímků, tak vznikla jedna samostatná rastrová vrstva. Druhým způsobem bylo uložení leteckých snímků ve formě image katalogu. Rastrová data, která byla prostřednictvím ArcSDE importována do DBMS, byla uložena v souborech formátu TIFF.

Metody ukládání prostorových dat

Metoda č.1 - Mozaika z leteckých snímků uložená v DBMS

Metoda mozaikování rastrových souborů je první z metod, které lze využít při ukládání rastrových dat do DBMS s využitím ArcSDE. Mozaikováním se rozumí spojování většího počtu rastrových souborů do jednoho celistvého souboru. Jednotlivé soubory se mohou překrývat, případně na sebe nemusí přesně navazovat. Samotný import dat byl prováděn s pomocí aplikace ArcCatalog a v ní obsaženém nástroji Raster to Geodatabase.Nástroj Raster to Geodatabase nabízí řadu volitelných parametrů, kterými lze ovlivnit charakteristiku uložení importovaných rastrových dat. Při importu připravených prostorových dat, které představovalo 42 zaregistrovaných leteckých snímků ve formátu TIFF, byly zvoleny tyto parametry:

Název výsledné rastrové vrstvy SDE.SDE.MOSAIC_42.IMAGE
Datová komprese ne
Velikost dlaždic 128px * 128px
Pyramidové hladiny ano, cubic convolution
Prostorový referenční systém S-JTSK Křovákovo zobrazení (EastNorth)
Klíčové slovo default

Tabulka č. 1 Parametry ArcSDE rastrové vrstvy

Metoda č.2 - Image katalogu z rastrových souborů (DBMS)

Image katalog je možnost, jak bez použití metody mozaikování organizovat větší počet rastrových souborů tak, že se navenek tváří jako jeden souvislý rastrový soubor. Tato možnost organizace dat je zvláště vhodná v případě, kdy dochází k časté aktualizaci rastrových dat.S pomocí ArcSDE lze vytvořit v DBMS dva typy image katalogu. První z nich je označován jako Referenced Raster Catalog a druhý jako Embedded Raster Catalog. Jako druhá metoda importu rastrových dat do DBMS byl využit právě Embedded Raster Catalog.Každý importovaný rastr uložený v Embedded Raster Catalog měl stejné parametry jako v případě použití metody mozaikování rastrových dat (viz tabulka č.1).

Metoda č.3 - Image katalog z rastrových souborů ve formátu MrSID

Z celé kolekce snímků ve formátu MrSID byl vytvořen image katalog. Image katalog je databázová tabulka ve formátu dbf, která obsahuje pět sloupců (viz tabulka č.2). V prvním sloupci je cesta k rastrovému soboru (relativní nebo absolutní). Další čtyři sloupce obsahují geografické souřadnice souboru. Z toho vyplývá, že do image katalogu je možné zařadit pouze geograficky rektifikované rastrové soubory.

IMAGE XMIN YMIN XMAX YMAX
Ras804a.sid -471250 -1101000 -470000 -1102000
Ras803a.sid -472500 -1101000 -471250 -1102000
Ras802a.sid -471250 -1101000 -470000 -1101000
Ras801a.sid -472500 -1101000 -471250 -1101000

Tabulka č. 2 Ukázka image katalogu vytvořeného ze souborů MrSID

Testovací aplikace ArcIMS

Jak již bylo uvedeno, pro uživatelský přístup k ArcIMS byl zvolen webový klient. Testovací aplikaci tedy tvořil komplet HTML stránek, které bylo možné zobrazovat v klasickém webovém prohlížeči bez použití jakéhokoliv funkčního rozšíření. Protože vytvořená mapová aplikace sloužila k otestování výkonu ArcIMS, při publikování rozsáhlých rastrových dat musela splňovat několik podmínek. Těmito podmínkami byly:

  - Základní prostorové operace s mapovým oknem. Tím se rozumí operace jako zvětšení, zmenšení, posun mapy apod.
 
  - Zapínání a vypínání jednotlivých datových vrstev, které se mají zobrazovat
 
  - Změnu měřítka vykreslované mapy. Měřítko bylo možné měnit po jednotlivých pevně zadaných krocích (1:1 000..1:200 000) a ručně zadat pomocí dialogového okna.
 
  - Vyhledání konkrétního prostorového objektu, podle zadaných kritérií a jeho zobrazení v mapovém okně. Splnění této podmínky bylo nutné pro zachování stejných podmínek při testování jednotlivých metod uložení rastrových dat. Aplikace umožňovala vyhledávání pevně zvolených adresních bodů ve vrstvě adresních bodů města Ostravy.

Vlastní tvorbu mapové aplikace lze rozdělit do třech kroků. Prvním krokem bylo vytvoření konfiguračního souboru *.AXL. Následovalo vytvoření mapové služby s využitím nástroje ArcIMS Administrator. Posledním krokem byla tvorba webového klienta s pomocí nástroje ArcIMS Designer a manuální úpravou jím vytvořených HTML stránek a JAVA skriptů, tak aby aplikace splňovala výše uvedené podmínky. Takto vytvořená mapová aplikace (viz obr. 1)mohla být použita pro testování ArcIMS.

Obr č. 1 Vytvořená mapová aplikace v podobě webového klienta

Nástroje pro testování a monitorování ArcIMS

Jedním z úkolů diplomové práce bylo zodpovědět otázku, jakým způsobem monitorovat provoz ArcIMS a měřit jeho výkonnost. Popsané postupy a techniky by měly budoucímu správci systémy napomáhat při optimalizaci konfigurace celého systému v závioslosti na požadavcích klientů a možností správce. ArcIMS obsahuje dva nástroje, pomocí kterých je možno analyzovat a monitorovat činnost ArcIMS. Prvním je statistické sledování činnosti jednotlivých Virtual Server. Druhou možností je analýza logovacích souborů, které vznikají během provozu jednotlivých Virtual Server.

Statistické sledování Virtual Server

Statistické sledování jednotlivých Virtual Server je obsaženo v aplikaci ArcIMS Administrator a je označováno jako Statistics (viz obr.č.2).

Obr č. 2 Nástroj Statistics

Nástroj Statistics umožňuje monitorovat činnost jednotlivých Virtual Server prostřednictvím následujících parametrů.
 
  - Response Time (čas vyřízení) - je zaznamenán maximální, minimální a průměrný čas vyřízení
    požadavků klientů ArcIMS.
 
  - Server Totals ( Informace o instancích) - zde jsou uvedeny informace o celkovém počtu instancí daného
    Virtual Serveru (registered), informace o instancích, které jsou ve stavu čekající (idle servers)
    a poslední informace představuje celkový počet vyřízených požadavků od startu ArcIMS Application Server.
 
  - Clients Totals ( Informace o požadavcích klientů ) - zde jsou zaznamenány informace o požadavcích, které
    čekají na vyřízení ve frontě ArcIMS Application Server.
 
Tyto parametry jsou doplněny grafickými informacemi o počtu požadavků a o změně jednotlivých časů vyřízení.

Analýza logovacích souborů Virtual Server

Analýza logovacích souborů je druhou možností, jak monitorovat činnost ArcIMS. Každý z jednotlivých typů Virtual Server si během své činnosti vytváří textový soubor *.log. Například činnost Virtual Server typu Image je zaznamenána v souboru ImageServer_.log. Všechny *.log jsou uloženy v adresáři /server/log. V ArcIMS lze nastavit jednu ze čtyř úrovní logování - ON, OFF, MINIMAL, ERROR.
Obecně se doporučuje při normálním provozu ArcIMS nastavit úroveň OFF nebo ERROR, protože tyto volby mají jen minimální dopad na výkon ArcIMS. Obě zbývající úrovně je vhodné použít v případě ladění systému nebo při zkušebním provozu. Úroveň logování lze nastavit v souboru aimsserver.cfg, který se nachází v adresáři \server\etc. Tato možnost monitorování činnosti ArcIMS byla využita při porovnání jednotlivých metod uložení rastrových prostorových dat.

Testování výkonu ArcIMS při prezentaci rastrových dat

Posledním úkolem diplomové práce bylo otestování výkonu ArcIMS při prezentaci prostorových rastrových dat. Rastrová data byla uložena třemi způsoby. První způsob představovala mozaika leteckých snímků, která byla uložena jako rastrová vrstva v DBMS s využitím ArcSDE. Druhý způsob představovalo vytvoření image katalogu z leteckých snímků a jeho uložení v DBMS, opět s využitím ArcSDE. Posledním způsobem bylo vytvoření image katalogu z leteckých snímků ve formátu MrSID. Image katalog byl uložen na lokálním pevném disku serverového počítače. Cílem bylo porovnat jednotlivé metody uložení dat s ohledem na jejich prezentaci prostřednictvím ArcIMS. K tomuto účelu byla využita jedna z možností sledování činnosti ArcIMS, analýza logovacích souborů Virtual Server. Protože klientem byl standardní webový prohlížeč, ke kterému prostorová data putují ve formě vygenerovaných rastrových souborů, analýze byl podroben logovací soubor Virtual Server typu Image. Nejdříve bylo nutné nastavit úroveň logování na hodnotu ON. Při volbě této úrovně logování se do logovacího souboru zapisují údaje o každém jednotlivém požadavku klienta a jemu odpovídající odpovědi. Samotné testování probíhalo následujícím způsobem. Prostřednictvím webového klienta byly zasílány požadavky na prostorová data, která byla vykreslována v různém měřítku. Konkrétně to bylo 1:500, 1:750, 1:1 000, 1:1 500, 1:2 500, 1:5 000 a 1: 10 000. Změna měřítka byla prováděna vždy s mapovým oknem, jehož střed představoval bod (adresa) z vektorové vrstvy adresních bodů města Ostravy. Bylo zvoleno dvacet bodů. Na každém z nich byla otestována určitá posloupnost měřítek. Tato posloupnost nebyla vždy stejná, ale měnila se bod po bodu tak, aby byla zajištěna různorodost požadavků. Všechny postupy byly dokumentovány z důvodu zachování stejných podmínek při testování všech tří metod. Popsaný postup byl proveden pro získání většího počtu hodnot dvakrát. Klíčovým parametrem, který byl monitorován a dokumentován, byl Image Retrieval Time. Tuto hodnotu představuje čas potřebný ke zpracování a přípravě požadovaných rastrových prostorových dat. Takto připravená data budou později použita při generování rastrového souboru, který bude odeslán jako odpověď klientovi. Po zpracování každého příchozího požadavku byla jemu odpovídající hodnota Image Retrieval Time zapsána do zvláštního textového souboru a doplněna komentářem ( měřítko, číslo bodu, pořadí měření a použitá metoda). Výsledný textový soubor byl zpracován do podoby tabulky ve formátu Microsoft Excel. V průběhu testování bylo naměřeno celkem 210 hodnot pro každou ze tří metod ukládání prostorových dat. Pro statistické srovnání jednotlivých metod bylo využito programového prostředku STATGRAPHICS Plus.

Statistický nástroj ANOVA

Z naměřených hodnot Image Retrieval Time byla vytvořena tabulka, která sloužila jako vstup programovému prostředku STATGRAPHICS plus. Pro popis a statistické srovnání naměřených časů byl využit nástroj ANOVA (Analysis of Variance). Tento nástroj umožňuje popsat rozložení a rozptyl hodnot v sledovaném souboru v závislosti na jiné veličině, dělící daný soubor do jednotlivých výběrů. Konkrétně tedy umožňuje statisticky popsat rozptyl naměřených hodnot Image Retrieval Time v závislosti na velikosti měřítka, ve kterém byla data zobrazována. Analýza rozptylu byla provedena pro každou ze tří uvedených metod uložení prostorových dat. Výstupem nástroje ANOVA je statistický přehled o rozptylu hodnot v jednotlivých výběrech sledovaného souboru a vztahů mezi nimi. Počet výběrů je roven sedmi a odpovídá počtu měřítek, ve kterých byla rastrová data vykreslována. Výstupem nástroje ANOVA je celá řada textových souhrnů a grafických digramů.

ANOVA - Metoda č.1

Pro první metodu uložení dat, kterou představovala mozaika leteckých snímků byla provedena statistická analýza ANOVA. Pro ilustraci rozložení hodnot ve sledovaném souboru je na obrázku č.3 zobrazen rozptylogram.

Obr č. 3 Grafické zobrazení rozložení hodnot Image Retrieval Time pro metodu č.1

Z výstupů statistické analýzy lze vypozorovat řadu skutečností. Nejkratší doba Image Retrieval Time je patrná u měřítek vykreslování 1:500 a 1:750. Dále tato hodnota narůstá, ale její nárůst není nijak závratný. Nevětší hodnoty Image Retrieval Time jsou v případě použití měřítka 1:1 500. Tato skutečnost je patrně způsobena použitím pyramidových hladin a dlaždicové struktury rastrových dat. Hodnoty všech výběrů, odpovídající měřítkům vykreslování dat, mají poměrně značný rozptyl. Příčinou takového rozptylu hodnot je patrně způsob indexace rastrových dat v DBMS a také vliv technických parametrů počítačového vybavení.

ANOVA - Metoda č.2

Naměřené hodnoty pro druhou metodu, tvořenou image katalogem z leteckých snímků, uloženým v DBMS, byly opět podrobeny statistické analýze ANOVA. Pro představu rozložení hodnot Image Retrieval Time je na obrázku č.4 zobrazen rozptylogram.

Obr č. 4 Grafické zobrazení rozložení hodnot Image Retrieval Time pro metodu č.2

Z výsledků statistické analýzy je patrné, že jako u předchozí metody doba Image Retrieval Time stoupá s velikostí měřítka vykreslovaných dat a nejmenší je opět u měřítek 1:500 a 1:750. Rozptyl hodnot je oproti první metodě menší, ale stále patrný.

ANOVA - Metoda č.3

Stejně jako u předchozích hodnot obou metod byla provedena analýza rozptylu i pro třetí metodu; image katalog z leteckých snímků ve formátu MrSID. Pro ilustraci rozložení naměřených hodnot je opět uveden rozptylogram (viz obr.5).

Obr č. 5 Grafické zobrazení rozložení hodnot Image Retrieval Time pro metodu č.3

Z výsledků analýzy rozptylu hodnot je patrné, že doba Image Retrieval Time se zvyšuje v závislosti na změně měřítka vykreslování prostorových dat. V případě měřítka 1:500, 1:750 a 1:1 000, je tato doba srovnatelná s oběmi výše uvedenými metodami. Při použití měřítka 1:1 500 tato doba prudce narůstá a v případě měřítka 1:5 000 a 1:10 000 již dosahuje několika desítek sekund. Také rozptyl hodnot je poměrně velký. Tyto skutečnosti jsou patrně způsobeny samotným principem formátu MrSID.

Statistická metoda testování hypotéz

Technika testování hypotéz vyžaduje dvě předem definované hypotézy. Nulovou hypotézu a alternativní hypotézu. Alternativní hypotéza přesně vymezuje, do jaké situace se dostáváme, když nulová hypotéza neplatí. Nulová hypotéza se obvykle definuje tak, že srovnávaný výběr je pravděpodobně statisticky totožný se základním výběrem. Důležitými pojmy z oblasti testování hypotéz jsou testová statistika (testovací kritérium) a dosažená hladina významnosti (p-value). Všechny tyto pojmy a detailní rozbor metody testování hypotéz je uveden v literatuře [27]. Pro testování hypotéz týkající se rozdílů mezi párovými hodnotami dvou výběrů se používá metoda párových testů. Tato statistická metoda je detailně popsaná v literatuře [26]. V podstatě jde o techniku, která analyzuje rozdíly sledovaných hodnot. Nulovou hypotézu představuje skutečnost, že průměr rozdílů párových hodnot obou výběrů je roven nule. Alternativní hypotézou je, že tento rozdíl je různý od nuly. Tento test se nazývá oboustranný t-test. Tuto metodu, tedy testování hypotéz oboustranným t-testem, lze využít pouze v případě existence předpokladu, že sledované hodnoty pocházejí z normálního rozdělení [32]. Sledované hodnoty naměřených Image Retrieval Time pro jednotlivé metody uložení prostorových dat však vykazují určité znaky, které svědčí o tom, že nepocházejí z normálního rozdělení. Těmito znaky jsou hodnoty směrodatné šikmosti (standard skewness) a směrodatné špičatosti (standard kurtosis). Pro normální rozdělení by tyto hodnoty měly ležet v rozmezí -2 až +2. Hodnoty obou statistických znaků vypočtené pro jednotlivé sledované metody však v tomto rozmezí neleží. Z důvodu nemožnosti přijetí předpokladu, že analyzované hodnoty pocházejí z normálního rozdělení je pro testování hypotéz nutno použít tzv. neparametrické metody. Neparametrické metody testování hypotéz jsou detailně popsány v literatuře [33]. Při statistickém srovnání jednotlivých metod byl využit Mann-Whitney (Wilcoxon) test [33] (dále jen W-test). Opět bylo nutné stanovit nulovou a alternativní hypotézu. Nulovou hypotézu v případě W-testu představuje tvrzení, že medián párových hodnot Image Retrieval Time srovnávaných metod je nulový. Tvrzení, že medián je různý od nuly představuje alternativní hypotézu. Rozhodování o platnosti či neplatnosti obou hypotéz se opět provádí prostřednictvím vypočtené testové statistiky a dosažené hladině významnosti (p-value). Pokud je p-value větší než stanovená hladina významnosti (0,05 pro 95% pravděpodobnost, 0,01 pro 99% pravděpodobnost) lze přijmout tvrzení o pravdivosti nulové hypotézy. V opačném případě lze s určenou pravděpodobností zamítnou nulovou hypotézu.

Vyhodnocení provedených statistických analýz

Veškeré provedené analýzy lze uzavřít následujícím způsobem. Metoda č.1 a metoda č.2, které využívaly pro ukládání rastrových prostorových dat DBMS, podávaly při přípravě dat ve všech sledovaných měřítcích přibližně stejné výsledky. Zjištěné odchylky byly patrně způsobeny způsobem indexování dat v DBMS a využitím techniky pyramidových hladin. Největší rozdíl mezi oběma metodami byl patrný při přípravě dat v měřítku 1:10 000. Tento rozdíl byl s největší pravděpodobností způsobený odlišným počtem pyramidových hladin u obou testovaných metod. Pro metodu č.1 - Mozaiku z leteckých snímků (DBMS) bylo vytvořeno sedm pyramidových hladin. Pro metodu č.2 - Image katalog z leteckých snímků (DBMS) bylo vytvořeno šest pyramidových hladin pro každý snímek zařazený v image katalogu. Třetí metoda ukládání rastrových dat, image katalog z leteckých snímků uložených ve formátu MrSID na lokální pevném disku, podávala z celkového pohledu horší výsledky než obě metody využívající DBMS. Ovšem po porovnání Image Retrieval Time naměřených při přípravě dat v měřítcích 1:500, 1:750 a 1:1 000 bylo možné prohlásit, že v tomto případě byla třetí metoda rovnocenným konkurentem prvních dvou metod. Výsledky třetí metody výrazně zaostávaly při přípravě dat v měřítcích 1:1 500, 1:2 500, 1:5 000 a 1:10 000. V těchto případech byly naměřené hodnoty Image Retrieval Time několikanásobně vyšší než u prvních dvou metod. Tuto skutečnost patrně způsobuje samotný princip grafického formátu MrSID.

Závěr

Diplomová práce byla zaměřena na problematiku prezentace a publikování prostorových dat prostřednictvím počítačových sítí Internetu a intranetu. Hlavním předmětem zájmu byl konkrétní programový prostředek ArcIMS a posouzení jeho využití pro prezentaci rozsáhlých prostorových dat. Popsány byly rovněž možnosti a postupy při tvorbě a úpravě mapových aplikací v tomto programovém prostředku. Nedílnou součástí práce byl také návrh testování výkonu a monitorování provozu ArcIMS. Získané poznatky byly využity při srovnání jednotlivých metod ukládání rastrových prostorových dat. Při řešení uložení prostorových dat byla prostudována možnost jejich fyzického uložení v relační databázi prostřednictvím programového prostředku ArcSDE. V práci byl popsán postup a možnosti při manipulaci a při správě prostorových rastrových dat s využitím této moderní a sofistikované metody. Další popsanou variantou bylo uložení rastrových dat v grafickém formátu MrSID. Zajímavé byly výsledky srovnání metody uložení rastrových dat v relační databázi s metodou uložení rastrových dat formátu MrSID na lokálním pevném disku. Srovnání bylo provedeno s využitím popsaných nástrojů a statistických metod. Výsledkem analýz bylo konstatování, že metoda uložení rastrových dat v relační databázi je rychlejší, efektivnější a vyrovnanější než metoda uložení prostorových dat formátu MrSID na lokálním pevném disku. Nevýhody druhé uvedené metody jsou však značně závislé na určitých parametrech vykreslování dat a jsou bohatě vykoupeny redukcí objemu rastrových dat. Při zpracování práce se potvrdilo, že programový prostředek ArcIMS je možno úspěšně využít mimo jiné i pro prezentaci rozsáhlých rastrových dat. Konečné rozhodnutí o konfiguraci celého systému či volbě konkrétní metody však závisí na správci systému ArcIMS, jeho požadavcích, prioritách a možnostech (technických, programových, finančních…). Výsledky analýz, zpracovaná dokumentace, popsané a provedené postupy by mu mohly být určitým cenným vodítkem.

Literatura

  1. REYNOLDS, M. WOOLLRIDGE, A.: JavaScript profesionální řešení.1. vyd. Brno : UNIS Publishing. 1997. 779s., ISBN 0-7897-0789-6
  2. KOSEK, J.: XML pro každého. 1.vyd. Praha: Grada Publishing. 2000. 164s., ISBN 80-7169-860-1
  3. ESRI, Redlands. ArcGIS 8 : Managing ArcSDE Services. 2001. 144 s
  4. ESRI, Redlands. ArcGIS 8 : Understanding ArcSDE. 2001. 53 s.
  5. MURRAY, J.D. vanRYJEN, W.: Encyklopedie grafických formátů II. 1. vyd. Praha : Computer Press. 2001. 950s., ISBN 80-7226-033-2
  6. BURROUGH, P., McDONNELL, A.: Principles of Geographical Information Systems. Oxford University Press. 1998. 333s.
  7. PLEWE, B.: GIS Online information, retrieval, mapping, and the Internet.OnWord Press, SantaFe, USA, 1997
  8. TUČEK, J.: Geografické informační systémy. Principy a praxe. Praha: Computer Press. 1998. 424 s., ISBN 80-7226-091-2
  9. ESRI, Redlands. ArcXML Programmer's Reference Guide 4.0. 2002.
  10. ESRI, Redlands. ArcXML DTD. 2001
  11. ESRI, Redlands. Sderaster command documentation for ArcSDE 8.2. 2001
  12. ESRI, Redlands. Raster Data Management with ArcSDE. 2002
  13. ESRI, Redlands. Loading Raster in ArcSDE using sderaster. 2002.
  14. ESRI, Redlands. Loading ArcSDE Raster using ArcGIS 8.2. 2002
  15. ArcDATA, Praha. ArcRevue. 2002, 11, 4.
  16. AKČR. Úvodní studie GIS krajských úřadů. 2003-02-19
  17. ESRI, Redlands. ArcNews. 2002
  18. Computer Press, Praha. GEOinfo. 2001
  19. Microsoft. Microsoft SQL 2000 Server. 2002
  20. OGC. Geography Markup Language (GML) Implementation Specification. 2003-01-29
  21. OGC. Web Feature Service Implementation Specification. 19-September-2002
  22. OGC. About OGC. 2003-04-11
  23. LizardTech. MrSID - White Paper. 2003-04-11
  24. KOLÁŘ, J. HALOUNOVÁ,L. PAVELKA,K..: Dálkový průzkum Země 10. [cit. 2003-03-23] Skripta ČVUT Praha, 2000, 164 stran, ISBN 80-01-01567-X
  25. Statistické porovnání dvou skupin [online]. 1999-01-05
  26. Testování hypotéz [online]. 1999-01-05
  27. ESRI, Redlands. ArcIMS - Customizing HTML Viewer. 2002
  28. ESRI, Redlands. Raster Data in ArcSDE 8.2 - White Paper. May-2002
  29. ESRI, Redlands. ArcIMS 4 Installation Guide - Windows. 2002
  30. ESRI, Redlands. ArcIMS 4 Architecture and Functionality - White Paper. 2002
  31. Náhodná veličina a rozdělení pravděpodobnosti. 1999-01-05
  32. Neparametrické metody. 1999-01-05

Copyright (C) VŠB - TU Ostrava, Institut geoinformatiky, 2001-3. Všechna práva vyhrazena. 
V případě, dotazů, komentářů, připomínek kontaktujte www-gis.hgf@vsb.cz
Tato stránka byla naposledy aktualizována: 29.03.2006 16:16
Stránky jsou optimalizovány pro Microsoft Internet Explorer v. 5.0 a vyšší.
Jsou vytvářeny v programovém prostředí FrontPage 2003.

NAVRCHOLU.cz