GISáček


Tvorba metainformačního systému pro prostorová data s využitím Internetových technologií

Tomáš Duchoslav
Institut ekonomiky a systémů řízení
VŠB – Technická univerzita Ostrava
tř. 17. Listopadu
708 33 Ostrava – Poruba
E – mail: tomas.duchoslav@email.cz

Abstract

This Thesis deals of the metainformation system for geospatial data - MIDAS. The aim of this work was not only participate in development, but also realize the comparison with other systems, which were established for the purpose of metadata administration in geodata area. The development of system consists of creation the mode of editing and the XML module for metadata exchange. A part of this work was also to review the option of exploitation initiative Dublin Core for description of the information in the system MIDAS.

Abstrakt

Tato diplomová práce se zabývá metainformačním systémem pro prostorová data - MIDAS. Cílem práce bylo nejen podílet se na jeho vývoji, ale také provést srovnání s jinými systémy, které byly vybudovány za účelem poskytovaní metadat v oblasti geodat. Vývoj systému spočíval především v tvorbě editačního režimu a modulu XML pro výměnu metadat. Součástí práce bylo také zhodnotit zda je vhodné využít iniciativy Dublin Core pro popis informací uložených v systému MIDAS.

Úvod

Metadaty nazýváme data, která popisují jiná data. Se stále rostoucím objemem různých druhů dat roste potřeba jejich evidence. Důležitá je nejen znalost o jejich existenci, ale hlavně znalost o jejich vlastnostech. To umožňuje jejich další vhodné využití. Z tohoto důvodu některé informační systémy spravují kromě samotných dat i jejich metadata, které představují dokumentační složku těchto dat (např. informace o kvalitě dat zahrnují zpravidla datum sběru, spolehlivost klasifikace, úplnost dat, metodu sběru a způsob formalizace dat, ale také informace obecného charakteru jako například, kdo je autorem, způsob pořízení, apod.). Metadata je možné také uchovávat samostatně mimo popisovaná data. V takovém případě se metadata ukládají v prostředí specializovaných metainformačních systémů, které se zabývají správou těchto metadat. Příkladem takového systému může být MIDAS, který eviduje informační zdroje veřejné správy.

V rámci širšího využití metainformačních služeb se nabízí jako nejvhodnější právě prostředí Internetu. Nejenom že umožňuje současně přístup širokému okruhu uživatelů k aktuálním informacím odkudkoliv a kdykoliv, ale především je to i finančně nenáročné řešení jak pro poskytovatele tak i koncového uživatele. Pro provoz takového systému je potřeba pouze internetové připojení s vhodným prohlížečem na straně klienta a na straně poskytovatele webový server, na kterém je aplikace provozována. Jde tedy již pouze o to, vybrat pro tvorbu systému vhodnou technologii. Ty jsou v současné době na poli Internetu nabízeny v poměrně širokém rozsahu.

MIDAS

MIDAS je metainformační systém, který umožňuje pořizovat, spravovat, udržovat a analyzovat metadata za účelem získávání informací o geodatech a jiných zdrojích veřejné správy. Tvůrcem a provozovatelem systému MIDAS je CAGI. Systém je přístupný na webové stránce http://gis.vsb.cz/midas

MIDAS poskytuje informace o zdrojích těchto kategorií:

  • Datový soubor;
  • Aplikační programové vybavení;
  • Služba;
  • Událost;
  • Dokument;
  • Organizace;
  • Osoba.

Tvorba editační části systému MIDAS

Jednmím z cílů práce bylo vytvořit editační režim, který by oprávněným uživatelům umožňoval vkládat nové nebo měnit existující záznamy v systému MIDAS prostřednictvím Internetu. Tento editační režim byl navrhnut tak, aby uživatel mohl plyně přecházet z prostředí prohlížecího do editačního a opačně. Protože celá internetová aplikace MIDAS je naprogramována za použití skriptovacího jazyka PHP ve verzi 4, bylo nezbytné i pro tvorbu editačního režimu využít této technmologie, tak aby byla zajištěna kompatibilita.

Základní struktura režimu pro vkládání je patrná z obrázku Č. 1. Každý nově vkládaný (nebo editovaný) záznam (ať už se jedná o datový soubor, organizaci či jiný) je rozdělen do specifických záložek, které obsahují různé položky metapopisu.

Obr. č. 1 MIDAS - editační režim

Všechny možné editované položky jsou dvojího druhu: povinné nebo nepoviné. Povinné položky znamenají pro uživatele, že musí být správně vplněny pokud má být záznam publikovatelný. To znamená, že je v systému viditelný pro všechny uživatele. Kontrola správnosti vyplněné položky je částečně zajištěna pomocí funkcí JavaScriptu. Tento skriptovací jazyk běží přímo na straně klienta a je-li obsah položky nekorektní, zobrazí se uživateli při pokusu o publikování metadat hlášení o konkrétní chybě.

Více informací o systému MIDAS na adrese http://gis.vsb.cz/midas

Tvorba modulu XML pro výměnu metadat

Cílem tohoto modulu je zajistit přenos dat (v našem případě metadat) mezi metainformačními systémy pro prostorová data prostřednictvím XML dokumentů. Výměnný formát XML je definován "Standardem ISVS pro strukturu a výměnný formát metadat informačních zdrojů, verze 1.1", vydaný ÚVIS.[6] Celý modul obsahuje dvě samostatné aplikace. Jedna umožňuje načíst (import) XML dokument do systému MIDAS a druhá generuje (export) informace obsažené v systému ve formátu XML. Modul je naprogramován v jazyce PHP4.

Import XML

Tato aplikace umožňuje načíst platný XML dokument podle výše uvedeného standardu. Její výhodou by měl být především fakt, že běží v on-line režimu na Internetu a umožní uživateli jednoduché a rychlé vkládání metadat do systému. Působí tedy jako určitá alternativa ruční editace záznamů.

Import XML dokumentu je proveden pomocí následujících kroků:

  1. Vytvoření parseru XML;
  2. Registrace obslužných funkcí pro parser. Parser vyvolává tyto zaregistrované funkce během rozpoznávání různých prvků v dokumentu. Většina logiky aplikace je implementována v těchto funkcích obsluhy;
  3. Přečtení dat ze souboru XML a jejich předání parseru. Tady dochází k vlastnímu zpracování dat;
  4. Uvolnění parseru po zpracování celého souboru.

Na závěr celé procedury se na straně klienta objeví závěrečné hlášení obsahující výpis všech záznamů, které byly z dokumentu úspěšně uloženy do systému MIDAS.

Export XML

Princip funkčnosti celé aplikace exportu XML je velice podobný aplikaci MIDAS při výpisu metadat v prohlížecí části. Hlavní rozdíl je pouze formát, ve kterém se data zobrazují a z toho se odvíjí i jejich využití. Výpis v HTML nemůže uživatel nijak využít pro další automatické zpracování, působí pouze jako vizuální zprostředkování dat. Naopak dokument XML může uživatel dále dle libosti zpracovávat za pomoci nějaké aplikace k takovému účelu určené, nebo ho může využít jako standardní výměnný formát.

Celý princip aplikace pro export XML dokumentů je naznačen na obrázku č.2. Aplikace běží nezávisle na rozhraní MIDAS a tak se uživateli v první fázi zobrazí stránka HTML s formulářem v němž může zadat klíčová slova a typ objektu (DS, Organizace, Osoba apod.) pro nalezení příslušného záznamu z databáze. Potvrzením se celý formulář odešle na server, kde se začne požadavek zpracovávat.

Obr. č. 2 Schéma exportu metadat do XML

V 1. kroku po odeslání požadavku se zobrazí XML nález, což představuje seznam nalezených záznamů ve formátu XML. Názvy záznamů jsou zobrazeny v podobě odkazů, které v jazyce XML zajišťuje technologie Xlink. Po kliknutí na vybraný záznam se spustí skript, který zajistí již samotný výpis všech metadat záznamu v podobě XML.

Posouzení kompatibility MIDAS s evropskými požadavky na metainformační systémy pro prostorová data

Tento úkol byl zamřen především na porovnání systému MIDAS s vybranými metainformačními systémy prostorových dat, které působí v Evropě. Byla zvolena porovnávací kritéria, podle kterých byla stanovena shoda či podobnost systémů.

Porovnávané metainformační systémy:

  1. MIDAS (český);
  2. GEODATA-INFO (dánský);
  3. GDDD (evropský);
  4. GEO-ID (irský);
  5. LANDLÝSING (islandský);
  6. INFODATABASE (grónský).

Zvolená kritéria porovnávání:

  1. Typy zdrojů;
  2. Standardy a normy;
  3. Jaké geografické pokrytí poskytují data;
  4. Počet datových souborů v systému;
  5. Vyhledávací mechanismy v systému, třídění metadat;
  6. Přístup k systému;
  7. Cena za poskytované služby;
  8. Jazykové verze systému;
  9. Výměnný formát XML;
  10. Způsob a možnosti editace.

Zhodnocení porovnání

Z výsledků srovnání vybraných evropských metainformačních systémů pro prostorová data vyplývají pro MIDAS některé zajímavé závěry, které zde budou stručně shrnuty.

Struktura a obsah metadat popisujících prostorová data ve všech porovnávaných systémech vychází z evropského standardu CEN / TC 287. Tento fakt je důležitý především z hlediska vzájemné kompatibility systémů a snadného přenosu dat mezi nimi.

Další velkou společnou výhodou těchto služeb je přístup k poskytovaným údajům prostřednictvím Internetu zcela zdarma. Uživatel tak může získat potřebné aktuální informace během několika minut ze svého domova či zaměstnání.

Velký rozdíl mezi systémy je však v množství poskytovaných záznamů DS. Zatímco MIDAS popisuje přes 3000 DS (převážnou většinu tvoří data z organizací veřejné správy), tak počet záznamů u ostatních se pohybuje maximálně okolo několika stovek. Jedním z důvodů může být způsob vkládání nových záznamů. Většina evropských aplikací totiž umožňuje vkládat nová data pouze přes vyplnění připraveného formuláře (většinou ve formátu MS Word 97) a jeho následným odesláním správci systému, který je poté vloží do databáze. Naopak MIDAS umožňuje oprávněným uživatelům provádět zásahy do databáze přímo "on-line" bez asistence druhé osoby. Editace je tak rychlá a snadná.

V oblasti výměny metadat je MIDAS také o krok před většinou ostatních systémů. Kromě něho a dánského GEODATA-INFO ani jeden z nich neumožňuje export metadat do formátu XML. MIDAS navíc jako jediný disponuje (probíhá testování) přímým importem XML dokumentů do systému (viz. předchozí kapitola).

Největší nevýhodou MIDASu je evidentně absence jiného jazykového prostředí kromě češtiny. Tento nedostatek by měl být v budoucnu napraven připravením anglické verze. Kromě toho se začíná pracovat i na rozšíření nástrojů pro uživatelské vyhledávání záznamů v systému.

Z hodnocení vyplývá, že MIDAS je plnohodnotným metainformačním systémem pro prostorová data, který nejenže odpovídá evropské úrovni kladené na obdobné systémy v zemích EU, ale v některých směrech je dokonce předčí.

Posouzení vhodnosti akceptování pravidel Dublin Core pro Metainformační systémy pro prostorová data

Dublin Core

Dublin Core (dále jen DC) je mezinárodní iniciativa, která se zabývá problematikou popisu informačních zdrojů. Zpočátku se zaměřovala na oblast knihovnictví a vydavatelství. V současné době je doporučení DC využitelné pro různé oblasti lidské činnosti a je používáno pro popis obecných zdrojů. DC nebyl přímo vytvářen pro popis geografických informací. Cílem DC není nahradit používané standardy (CEN, ISO,…), ale působit jako doplněk těchto standardů, který umožní zpřístupňovat informační zdroje napříč různými odvětvími.

Doporučení DC předkládá soubor metadatových prvků, jehož záměrem je usnadnit vyhledávání elektronických zdrojů na WWW. Tyto prvky jsou mezinárodně uznávané a používané.

Patnáct základních prvků DC ovšem není konečnou množinou. Každá organizace, instituce si může nadefinovat vlastní nebo modifikovat stávající tak, aby co nejvíce vyhovovaly jejím potřebám. Pro účely modifikace stávajících prvků existují v DC tzv. "kvalifikátory". Tyto kvalifikátory slouží pro úpravu významu jednotlivých prvků ve snaze, co nejvíce je přizpůsobit účelům v dané oblasti.

Použití DC pro MIDAS

Již v úvodu této kapitoly bylo zmíněno, že DC je vhodný pro popis informačních zdrojů z nejrůznějších oblastí, včetně popisu informací geografického charakteru. Proto se přímo nabízí jeho využití právě v systému MIDAS.

Při návrhu struktury systému bylo doporučení DC akceptováno a byla snaha položky jednotlivých typů objektů (datový soubor, organizace, osoba, služba, programové vybavení, události a dokumenty) co nejvíce sjednotit s prvky DC.

Jak odpovídají jednotlivé prvky DC položkám datového souboru v metainformačním systému MIDAS je zobrazeno v následující tabulce.

DCMIDAS
TitleNázev
CreatorOsoba, organizace (Původce/Autor)
PublisherOsoba, organizace (Vydavatel)
SubjectKlasifikace
DescriptionPopis
ContributorOsoba, organizace (Původce/Autor)
DatePlatnost od - Platnost do
TypeKód typu objektu
FormatFormáty, poznámky k formátům
IdentifierSložený identifikátor sestávající z Názvu organizace a Názvu zdroje
SourceŘešeno vazbou na jiný objekt standardu (Např. pro vztah DS vs. DS: předloha, potomek, součást)
LanguageJazyk (jazyky)
RelationŘešeno vazbou na jiný objekt standardu
CoverageVymezující obdelník, vymezující plocha, území, ID adresy
RightsOsoba, Organizace (Typ - původce/autor, vlastník, vlastník autorských práv)

Tabulka č. 1 Odpovídající si položky DC a MIDAS

Závěr

MIDAS je v současné době plně funkční metainformační systém pro prostorová data, který je provozován na Internetu. Kromě možnosti vyhledávat metadata o datových souborech, k čemuž byl vytvořen především, umožňuje zobrazovat i údaje o osobách, organizacích, událostech, programovém vybavení, dokumentech a službách. Velký přínos pro systém MIDAS znamenalo vytvoření modulu, který by uživatelům dával možnost nejen informace získávat, ale i pohodlně a automaticky vkládat do systému. Tento modul byl nazván jako editační režim a jeho vytvoření bylo jedním z hlavních cílů této diplomové práce. Editační režim byl koncipován tak, aby byl ve svém ovládání pro uživatele maximálně intuitivní a přehledný. Aby byla zachována kontinuita mezi prohlížecí a editační částí, bylo potřeba využít stejného programovacího jazyka. V našem případě se jednalo o PHP4, který je ve světě velice často využíván pro tvorbu nejrůznějších webových aplikací.

Jazyk PHP hrál také nezastupitelnou roli při vytváření modulu pro výměnu metadat ve formátu XML. Úkolem bylo vytvořit takové prostředí nezávislé na aplikačním rozhraní MIDAS, které by umožňovalo ze systému exportovat metadata přímo v jazyce XML a naopak dokázalo načíst XML dokument, který je platným dle definovaného standardu "ISVS pro strukturu a výměnný formát metadat informačních zdrojů, verze 1.1" vydaný ÚVIS. Tato aplikace by měla především sloužit při výměně metadat mezi systémem MIDAS a úřady státní správy a samosprávy.

V Evropě již dnes existuje celá řada metainformačních systémů o geodatech podobných MIDASu. Jejich společným cílem je zpřístupnit informace o všech možných dostupných zdrojích, soustředěné na jednom jediném místě. Tyto služby se však od sebe odlišují v prostředcích, které k tomuto účelu nabízí. Z výsledku vzájemného porovnání vybraných systémů vyplývá, že MIDAS splňuje vysoký evropský standard na poli metadat.

Posledním úkolem diplomové práce bylo posoudit zda je vhodné akceptovat pravidla Dublin Core pro metainformační systémy geodat a především pak pro MIDAS. Dublin Core se používá pro popis zdrojů na WWW. Tato iniciativa se vyvíjela především s cílem zpracování zdrojů jako jsou muzea a knihovny. Pravidla Dublin Core jsou ovšem natolik obecná a pružná, aby se dala aplikovat na MIDAS a především na popis informací uložených v systému.

Literatura

  1. Castagnetto J., Rawat H., Schumann S., Scollo Ch., Veliath D.: Programujeme PHP profesionálně, ComputerPress 2001, 656 stran, ISBN 80-7226-310-2.
  2. Horáková B., Kafka Š.: MIDAS. Jeho role při evidenci a analýze geodat veřejné správy. Sborník z konference GIS Ostrava 2002, Česká asociace pro geoinformace, pracoviště CAGI na VŠB-TU Ostrava, 2002, 14 stran.
  3. Horáková B., Kafka Š.: MIDAS. Stávající metody sběru metadat ve státní správě a návrh nové metodiky. Závěrečná zpráva, Česká asociace pro geoinformace, pracoviště CAGI na VŠB-TU Ostrava, 2001, 5 stran.
  4. LaClef Consortium: An Operational Model for Unlocking Public Sector GI through E-Commerce, LaClef Final Report, PUB1102-LACLEF 25035/0, 77 stran.
  5. MADAME: Methods for Access to Data and Metadata in Europe, Leden 2000, 40 stran.
  6. Standard ISVS pro strukturu a výměnný formát metadat informačních zdrojů, verze 1.1, Věstník ÚVIS, 2001, 59 stran.
  7. Woods T., Cassettari S., Craglia M.: GI-META Final Report, připraveno pro Evropskou komisi, Červen 1997, 164 stran.
  8. http://www.ics.muni.cz/dublin_core
  9. http://www.php.cz/manual/cs/
  10. http://www.purl.org/dc

Copyright (C) VŠB - TU Ostrava, Institut geoinformatiky, 2001-3. Všechna práva vyhrazena. 
V případě, dotazů, komentářů, připomínek kontaktujte www-gis.hgf@vsb.cz
Tato stránka byla naposledy aktualizována: 29.03.2006 16:16
Stránky jsou optimalizovány pro Microsoft Internet Explorer v. 5.0 a vyšší.
Jsou vytvářeny v programovém prostředí FrontPage 2003.

NAVRCHOLU.cz