Metadata v procesu realizace GIS projektu

Ing. Jan Růžička
Institut ekonomiky a systémů řízení
VŠB - Technická univerzita Ostrava
tř. 17. listopadu
708 33 Ostrava - Poruba
E - mail: jan.ruzicka@vsb.cz

Abstrakt

Tento příspěvek se zabývá problematikou úlohy metadat pro prostorová data a metainformačních systémů v projektu Geografického informačního systému (GIS). Vztah metadat k projektu GIS je různý v různých fázích životního cyklu projektu a to bude diskutováno. Bude zmíněna úloha metadat pro manažera(y) projektu GIS, který má na starosti řízení projektu GIS nebo řízení některé z jeho dílčích částí.

Úvod

Odborníci zabývající se projektováním GIS a především manažeři, kteří řídí již běžící projekty dnes naráží na nedostatečný popis dat, která jsou v projektu GIS spravována. Bohužel většina projektů probíhala velice spontánně a prvotní zájem byl především mít velmi rychle prezentovatelné výsledky interpretace dat. Důsledkem toho vznikalo množství dat, velmi často bez jakékoliv dokumentace o jejich vzniku, nebo s dokumentací značně primitivní. Popsat dostatečným způsobem tato data, která vznikla např. před 10 lety, je dnes prakticky nemožné a tak je třeba alespoň apelovat na to, aby nově vznikající data již byla vhodně dokumentována. Obvykle je tento popis dat označován jako metadata. V dnešní době již existuje mnoho možností jak standardizovaným způsobem data popisovat a k dispozici jsou i nástroje usnadňující tvorbu metadatových záznamů. Pro získání informací o metadatech, metadatových službách, standardech je vhodné nahlédnout do publikací [1][7][9].

Projekt GIS

Pořídit GIS pro jakoukoli organizaci, to není jako koupit sekretářce balík kancelářských produktů nebo program pro vedení podvojného účetnictví. Vybudování GIS v jakékoliv organizaci tak, aby byla reálná šance na navrácení prostředků vynaložených na jeho vybudování, představuje složitý proces, který je potřeba dobře naplánovat.

Zavedení GIS s sebou přinese nejen ovlivnění stávajícího podnikového informačního systému, ale také výrazné změny v organizaci a strategických plánech společnosti. GIS se řadí mezi strategické IS, neboť by měl výrazným způsobem zlepšit konkurenceschopnost podniku v turbulentním podnikatelském prostředí. Výjimku v tomto případě obvykle tvoří rozpočtové organizace, kde by mělo být cílem především zkvalitnění a zefektivnění práce organizace. Vzhledem k tomu, že vybudování GIS je dlouhodobá záležitost, je třeba si uvědomit, že se musí promítnout do strategických plánů společnosti.

Projekt GIS by se dal rozdělit do tří fází: úvodní, analytická a implementační fáze. Tyto fáze se dále dělí na několik dílčích kroků. Ve většině těchto kroků hrají významnou roli metadata a to především z důvodu, že data jsou základem každého dobře fungujícího GISu.

Úvodní fáze projektu GIS

Předtím než lze přistoupit k úvodní fázi budování GIS v organizaci, je nutné si uvědomit výše uvedená fakta. Pak již je možné udělat první krok k budování GIS. Tím by měl být rámcový plán celého projektu obsahující seznam kroků dalšího postupu projektu (např. tak jak budou popsány dále), s přidělením zodpovědnosti za jednotlivé kroky a časovým harmonogramem. Tyto skutečnosti vyplývají z klasického pojetí projektového řízení.

Dalším krokem, který je nezbytný, je seznámení řídících pracovníků a vrcholového vedení s tím, co je to GIS, jaké výhody jsou spojeny s jeho zavedením a nezapomenout upozornit na úskalí, která budování GIS přináší. Je totiž nutné si uvědomit, že pro budování projektu GIS je nutná výrazná podpora ze strany vrcholového vedení organizace (výrazná investice, dlouhodobá záležitost, změny v organizaci podniku, ...).

Analytická fáze projektu GIS

Úvodní studie

Úvodním krokem do druhé fáze projektu GIS, označované jako analytická, je vypracování tzv. úvodní studie, která by měla zdůvodnit nebo vyvrátit potřebu vybudování GISu pro danou organizaci. Tato úvodní studie by se měla zaměřit na analýzu současného stavu především ve vztahu k práci s prostorovými daty. Měla by evidovat potenciální uživatele GISu, zdroje dat.

Zde hraje významnou roli veřejný metainformační systém, který shromažduje metadata z různých zdrojů a poskytuje nástroje pro jejich evidenci a prezentaci. Takový systém pracuje pouze s metadaty veřejného charakteru. To však neznamená, že musí obsahovat jen metadata o veřejně přístupných datech. Více informací o metainformačních systémech lze najít v [1][7][9][10].

Dále by měl být v rámci této studie proveden odhad přínosů a nákladů na vybudování GIS. V tomto případě může manažer projektu GIS využít služeb veřejného metainformačního systému k získání informací o dostupných datových sadách, které evidentně jsou nebo potenciálně mohou být předmětem zájmu organizace. Jinou oblastí zájmu je zjištění zda organizace nebude v budoucnu produkovat data, o která by byl na trhu zájem. Je-li tomu tak, je možné ověřit existenci konkurenčních datových sad na trhu a jejich cenu.

Vypracování úvodní studie předpokládá komunikaci s řadovými zaměstnanci organizace obvykle formou dotazníků. Je nutné, alespoň jednoduchou formou, seznámit řadové zaměstnance s problematikou GIS. Při komunikaci s uživateli dat je vhodné jim vysvětlit co prostorová dat jsou. Mnozí uživatelé s nimi totiž pracují, ale neví o tom. Veřejný metainformační systém v tomto případě může posloužit jako nástroj k prezentaci datových sad, které se v daném oboru objevují. Výsledkem může být zjištění, že někteří uživatelé s prostorovými daty pracují aniž o tom ví.

Pilotní projekt

V případě, že výsledky úvodní studie podpoří zavedení GIS, je nutné v dalším kroku získat souhlas s provedením pilotního projektu. Při předkládání výsledků úvodní studie za účelem získání souhlasu s provedením pilotního projektu je třeba vedoucí pracovníky upozornit na to, že po dokončení pilotní fáze budou mít možnost implementaci GIS ukončit. Ukončení se očekává v případě, že výsledky pilotního projektu nejsou dostatečně uspokojivé. Je důležité upozornit vedení společnosti na to, že pilotní projekt je budován s cílem navrhnout strukturu funkční a datové složky GIS a ověřit tento návrh s využitím dat o vhodně vybrané části zájmového území.

Pořízení dat tvoří nejnákladnější část implementace GIS. Pořízení dat tvoří až 80% všech nákladů. Pro pilotní projekt se vybírá obvykle oblast pokrývající max. 10% celého zájmového území. Náklady na pořízení dat pro pilotní projekt jsou pak natolik malé (relativně), že případné ukončení celého projektu po pilotní fázi nemusí přinést tak výrazné ztráty. Od počátku implementace GIS (sestavení plánu projektu) až po skončení pilotního projektu pokrývají náklady přibližně 5-10% z nákladů na celkovou implementaci GIS.

Vzhledem k tomu, že data tvoří až 80% procent ceny projektu GIS, je vhodné se této složce projektu GIS věnovat velmi pozorně. Již v pilotním projektu by měla být využívána veřejně dostupná digitální data pořízená jinými organizacemi, pokud je to možné. V úvodní studii je provedeno zhodnocení stávajícího stavu veřejně dostupných digitálních dat. V pilotní fázi je nutné ověřit, zda vytipovaná data jsou opravdu přínosná pro projekt. Důležité je také ověření, jak nákladná bude integrace takovýchto dat do projektu. Data mohou být v některých případech značně nekvalitní, neúplná a tak jejich využití může být v některých případech daleko nákladnější než prvotní pořízení těchto dat.

V případě svolení s pilotním projektem je obvyklé k tomuto účelu vybrat zpracovatele. V dalším kroku je tedy potřeba vyzvat dodavatele k předložení nabídek na zpracování GIS pro organizaci. Nezbytným krokem je pak zhodnocení těchto nabídek a vybrání příslušného dodavatele.

Návrh struktury databáze

Nejnákladnější částí GIS jsou, jak již bylo řečeno, data. Je proto vhodné věnovat velkou pozornost návrhu struktury databáze prostorových dat. Návrh struktury databáze prostorových dat musí být výsledkem úzké spolupráce dodavatele a řídících pracovníků jednotlivých oddělení organizace. Po vytvoření detailního návrhu databáze lze spustit pilotní projekt. Pilotní projekt by měl na jedné straně ověřit návrh databáze prostorových dat a na druhé straně upřesnit námi dříve odhadované náklady na vybudování GIS pro celou naši zájmovou oblast.

Implementační fáze projektu GIS

V případě, že tvůrce projektu (a především vedení společnosti) výsledky pilotního projektu uspokojily (tj. odhadované přínosy ze zavedení GIS v určitém časovém horizontu převýší odhadované náklady, může se samozřejmě jednat i o jiné hodnotící kritérium či skupinu kritérií), může být spuštěn projekt pro celé zájmové území. Zahajuje se tím třetí fáze (tzv. implementační) celého projektu GIS.

Úprava databáze

Pilotní projekt jistě odhalí některé nedostatky v návrhu databáze prostorových dat, proto je obvykle potřeba provést doladění detailního návrhu databáze prostorových dat. Spuštění projektu pro celé zájmové území obvykle spočívá v konverzi dat o zbývajícím území.

Konverze dat

Konverze dat bývá obvykle nejnáročnější (finančně i časově) částí budování GIS. Velká část dat, kterou chceme mít v GIS, obvykle není dostupná v digitální podobě a tak nezbývá než jejich pracný a časově náročný převod. Prvním krokem konverze dat bývá obvykle kontrola a doplňování chybějících údajů, neboť většina organizací nemá své exitující mapy (ať už v digitální nebo analogové podobě) a kartotéky kompletní a korektní. Jinou oblastí jsou data obecnějšího charakteru. Ta se mohou ve velké míře vyskytovat již v digitální podobě a zájmem manažera projektu GIS by mělo být zjištění aktuálního stavu takovýchto digitálních datových sad. V případě konverze dat bývá obvykle ekonomičtější zakoupení již existujících dat, pakliže existují.

Metainformační systémy v tomto případě mohou sloužit jako nabídkové katalogy různých datových sad. Manažer projektu GIS může pak s takovým nabídkovým katalogem pracovat jako s obvyklým katalogem zboží. Následující sadu činností provádí manažer po dobu celého projektu, tak jak je patrné z předchozího textu. Kdo dočetl můj příspěvek až sem, má u mě na příští konferenci GIS Ostrava jakožto platící účastník štamprli myslivce. Má možnost zjistit aktuální informace o datových sadách a vyhnout se tak koupi nevhodné datové sady. Součástí metadat také bývají informace o distribuci datové sady. Je tedy obvykle možné zjistit orientační cenu dat, ověřit případné restrikce jejich užití. Např. má - li uživatel dat v budoucnu plány prezentovat výsledky své práce v prostředí Internetu s využitím zakoupených dat, pak by měl v metadatech najít informace i o této formě využití. Často tato informace nebývá součástí metadat. Většina metadatových služeb s výhodou využívá možnost prezentace těchto podrobných informací WWW (URI) odkazem na externí dokument. Součástí uživatelsky přítulného metainformačního systému by měly být i možnosti specifických dotazů na podmínky užití dat. Podmínkou v tomto případě je však dostatečné naplnění této části metadatového záznamu v celé databázi metainformačního systému. Zjišťování informací o datových sadách prostřednictvím veřejných metainformačních systémů bývá obvykle rychle a snadno přístupné prostřednictvím Internetu. Manažer projektu GIS tímto způsobem šetří čas při vyhledávání dostupných zdrojů dat. Metadata prezentovaná veřejným metainformačním systémem obvykle nebývají natolik podrobná, aby se manažer mohl rozhodnout přímo u monitoru počítače. Výsledkem práce manažera s metadaty ve veřejném metainformačním systému bývá obvykle seznam potenciálně vhodných datových sad, seznam kontaktních osob (včetně e-mailové adresy, telefonu) a pro každou datovou sadu seznam otázek a kontaktní osobu, které by měly posloužit k lepší podpoře rozhodnutí manažera.

Pořízení technického a programového vybavení

Dalším krokem, pokud tak již nebylo učiněno, je pořízení technického a programového vybavení pro GIS. Technické a programové vybavení není vhodné pořizovat již před zahájením pilotního provozu. Mnohem vhodnější je nechat si zpracovat pilotní projekt na minimu vlastního zařízení a spíše využít možností dodavatelské společnosti. Stejně tak je možné pořídit programové vybavení až po pořízení dat o celém území dodavatelskou firmou.

Školení uživatelů

Někdy opomíjeným krokem implementace GIS bývá proškolení uživatelů GIS. Obvykle je potřeba přijmout nové zaměstnance, kteří se budou zabývat administrací GIS nebo přeškolit stávající zaměstnance z oddělení informatiky na administrátory GIS. Nezbytné je také školení koncových uživatelů GIS tak, aby byli schopni efektivně využívat možností GIS. Součástí školení by měla být rovněž prezentace používaných dat a k tomuto účelu se nejlépe hodí metainformační systém, který je k evidenci a prezentaci dat určen.

Provozování GIS

I v případě, že organizace ještě žádná prostorová data nevlastní a nemůže je nabídnout k prodeji prostřednictvím metainformačních systémů, může využít metadat k jiným účelům. Především je dobré vědět jaká data jsou v podniku využívána a mít o nich přehled. Může se tak zabránit vzniku duplicitních dat. K evidenci metadat nemusí být využíván veřejný metainformační systém, ale i vnitropodnikový, který navíc umožní i evidenci jiných důležitých údajů, jako je sledování stavu pořizování dat, evidence přidělení zodpovědnosti, a jiné skutečnosti svazané s projektem GIS.

Kromě evidence vlastních metadat je obvykle vhodné a často i nezbytné prezentovat některá data veřejnosti, obchodním partnerům, potenciálním zákazníkům. V případě soukromých firem se zveřejnění informací o datových sadách rovna reklamě, která může potenciálně přinést další zisky pro organizaci. V případě, že je možnost prezentovat metadata ve veřejné metadatové službě, a často i bezplatně, je hrubým nedostatkem manažera takto neučinit.

V případě veřejných institucí je poskytování informací jedním ze základních úkolů, k jehož zabezpečení je využívána řada různých cest. Tou nejprogresivnější a nejperspektivnější je zveřejnění informací s využitím technologií sítě Internet.

Jinou možností využití metadat je jejich vstup jako kritérium pro hodnocení dat pro určitou specifickou prostorovou analýzu dat. Každý model reálného světa, který je reprezentován (popsán) prostorovými daty má určitá omezení způsobená zjednodušením reality. Jiná omezení vznikají v důsledku kvality dat. Tato omezení mohou v analýzách hrát významnou roli. Mohou výrazně ovlivnit správnost, korektnost a užití výsledku analýz. Omezení dat je popsáno v metadatech. Metadata tedy mohou přispět k výběru vhodných dat pro plánované analýzy.

V případě prvků kvality (které jsou součástí metadat) mají jednotlivé elementy různý vliv dle charakteru zamýšlené analýzy. Metadata mohou odborníkovi, který má zájem danou analýzu provést, pomoci k eliminování nevhodných dat. Rozhodnutí v takovémto případě však závisí především na zkušenostech daného odborníka.

Ekonomické hodnocení projektu GIS

Při ekonomickém hodnocení projektu GIS je nutné si uvědomit, že se jedná o obvyklý přístup k hodnocení projektu v oblasti informačních technologií. Způsob odhadu nákladů v případě nasazení jakékoliv informační technologie (tedy i GIS) se příliš neliší od posouzení nákladů na jakýkoliv projekt. Obvykle jsou jednoduchým způsobem vyčíslitelné. Existuje i část nehmatatelných nákladů, které se obtížně vyčíslují (např. nutné organizační změny). Rozdílné je hodnocení přínosů nasazení informační technologie a jiných technologií (např. nasazení energeticky úspornějšího stroje pro zpracování odpadu). V případě nasazení informačních technologií (resp. GIS) vzniká mnoho obtížně vyčíslitelných přínosů. Tyto přínosy jsou často označovány jako nehmatatelné (např. komplexnější podpora rozhodování).

Náklady na vybudování GIS

Obvykle zahrnují:

Přínosy z vybudování GIS

Obvykle zahrnují:

Volba dodavatele

Jedním z kroků implementace GIS je volba vhodného dodavatele. Celý projekt GIS může být navržen tak, že bude vytvořen několika dodavateli. Každý z dodavatelů bude zaměřen na specifickou oblast informační technologie (technické vybavení, operační systém, databázový systém, programové vybavení pro GIS, pořízení dat).

Druhá možnost tvorby GIS je komplexní dodávka od jednoho dodavatele. Tento způsob však vyžaduje velmi silného dodavatele s širokým polem působnosti. Problémem v tomto případě může být určitá forma závislosti na jednom dodavateli.

Při volbě dodavatele se obvykle stanovuje několik kritérií podle kterých se následně hodnotí předložené nabídky. V následujícím textu jsou uvedeny dvě specifické oblasti, kterých se hodnocení týká. Samostatnou kapitolou, kterou se však příspěvek nezabývá, je hodnocení dodávky v oblasti pořízení dat.

Kritéria pro posouzení programového vybavení pro GIS

Kritéria pro posouzení dodavatele

Z výše uvedených kriterií je patrné, že i zde mohou do procesu rozhodování vstoupit metadata spravovaná veřejným metainformačním systémem. Metainformační systémy nabízejí možnost ověření některých aspektů týkajících se posouzení dodavatele. Především je možné ověřit, jaké datové sady veřejného charakteru doposud vyprodukoval, v jaké kvalitě, v jaké ceně a jak dalece jsou pořízená data využívána.

K výběru dodavatele je vhodné uvést, že vhodným způsobem výběru dodavatele je přizvání nezávislé skupiny odborníků z oblasti GIS, kteří vypracují analýzu předložených nabídek dodavatelů. Rozhodnutí však musí i nadále záviset na společnosti tak, aby studie nezávislých odborníků, mohla být považována opravdu za nezávislou.

Závěr

Závěrem lze říci, že metadata a metainformační systémy hrají významnou roli v úspěšném řízení projektu GIS. Součástí každého informačního systému (i GIS) by měla být evidence metadat. Metadata mohou výrazně ovlivnit ekonomické přínosy GIS pro organizaci. Můžeme s jistotou tvrdit, že metadata by měla být nedílnou součástí projektu GIS a není proto možné se jimi nezabývat a jejich evidenci opomíjet. Samotná evidence metadat by měla být velmi dobře organizována tak, aby bylo možné s metadaty efektivně pracovat. Pro evidenci metadat je vhodné (ne-li nezbytně nutné) využívat některý z existujících standardů, tak aby byla zaručena možná výměna metadat s externími subjekty.

Jinou neméně důležitou skutečností je významná úloha veřejných metainformačních systémů pro práci manažera projektu GIS. Opomíjení existence veřejných metainformačních systému, či katalogu dat, může pro manažera projektu znamenat značné poškozování řízeného projektu. Všeobecným zájmem manažerů projektů GIS by mělo být poskytování metadat o datech jimi spravovaných do veřejných metainformačních systému. Výsledkem takovéto činnosti, pakliže ji bude provozovat většina producentů dat, bude úspora nákladů v kterémkoli projektu GIS. Jestliže se manažer k prezentovaní metadat ve veřejném metainformačním systému neodhodlá, poškozuje tím samozřejmě částečně konkurenční projekty, ale především projekt jím řízený.

Literatura

  1. Aalders, H., J., G., L.: Data searching by metadata, In. sborník z konference GIS Ostrava 2001, Ostrava 2001, ISSN 1213-239X
  2. Aalders, H., J., G., L.: Some experiences with managing GIS projects. In. sborník z konference GIS Ostrava 2000, Ostrava 2000, ISBN 1211-4855
  3. Ionita, A.: Information Technology and Geographic Information System in the framework of Organization and business aspects in GIS. In. sborník z konference GIS Ostrava 2000, Ostrava 2000, ISBN 1211-4855
  4. Kolektiv autorů České asociace pro geoinformace: Metainformační systém - návrh řešení, CAGI, Praha 1999
  5. Molnár, Z.: Efektivnost IS/IT. In. sborník z konference GIS Ostrava 2000, Ostrava 2000, ISBN 1211-4855
  6. Pearce, J., Flowerden, R.: Mastering Metadata, in. GISeurope, October 1998, str. 22 - 24, ISSN 0926 - 3403
  7. Růžička J.: Comparison of CEN, FGDC and ISO standards for metadata, In. proceedings from 7th EC-GIS Workshop, Managing the Mosaic, Potsdam 2001, Potsdam 2001
  8. Růžička, J.: Jak najít data, časopis GeoInfo 4/2000, Computer Press, Brno 2000, ISSN 1211-1082
  9. Růžička, J.: Metainformation system of CAGI, In. proceedings from 6th EC-GIS Workshop, The Spatial Information Society - Shaping the Future, Lyon 2000, Lyon 2000
  10. Růžička, J.: XML a metadatové služby, In. sborník z konference GIS Seč 2000, Seč 2000
  11. Skokan, K.: Standardy systémového inženýrství a řízení projektů, In. sborník z konference GIS Ostrava 2001, Ostrava 2001, ISSN 1213-239X
  12. Vodáček,L.- Rosický,A.: Informační management. Management Press. Praha 1997. ISBN 80-85943-35-2