Výskyt nemoci v území je nutno chápat a matematicky modelovat jako náhodný jev s poissonovským pravděpodobnostním rozdělením. Výsledkem toho je, že veličiny hodnotící riziko onemocnění jsou vždy pouze odhadem s jistou mírou spolehlivosti. Čím je zkoumaná populační skupina menší, tím je menší také spolehlivost vypočtené veličiny, a naopak. V případě geografického zpracování je velikost populační skupiny závislá od územních jednotek pro které je zpracování prováděno (problém malých čísel).
Nejsnazším řešením, jak zvýšit spolehlivost výsledků je agregovat vstupní data do předem daných větších celků, k čemuž se nabízí například okresy. Na této úrovni je možné získat pro většinu druhů onemocnění výsledky se spolehlivostí dostatečnou k opatrné interpretaci [1]. Navíc je nepoměrně snazší získat vstupní data o nemocnosti na úrovni větších správních jednotek, než třeba na úrovni obcí. Hranice okresů však mají s územní distribucí příčinných faktorů vzniku onemocnění jen málo co společného. Důsledkem toho je, že takto získané mapy částečně zakrývají skutečný charakter jevu v území. Z teoretického pohledu je použitá mapa hranic okresů pouze jedna z nekonečně mnoha konfigurací plošných jednotek do nichž lze území členit. Průběh sledované veličiny je přitom na územním členění závislý (modifiable area units problem) [2]. Tomuto nežádoucímu jevu lze zabránit tak, že se zpracují data vztažená k co nejmenším jednotkám, která jsou k dispozici. To na druhou stranu vede k již zmíněným problémům s malými čísly.
Východisko poskytují metody zpracování, využívající existenci prostorové autokorelační struktury. Prostorová autokorelace provází ve větší, či menší míře většinu jevů odehrávajících se v území. (Co si je "blízko" v území je si "blízko" i svojí hodnotou). Průběh hodnoty náhodné veličiny v území je možné modelovat dvěma složkami. První složka zachycuje globální trend v datech (first order effects) a druhá lokální efekty vznikající vzájemnou interakcí na krátké vzdálenosti (second order effects) [2]. Mezi nejvíce sofistikované metody, které využívají této představy jsou bayesovské metody. Výpočetně i na implementaci jsou méně náročné metody typu "kernel estimation". Dobrých výsledků lze dosáhnout zvláště v kombinaci s použitím nepřímé věkové standardizace incidence onemocnění.
Jako nejvhodnější charakteristika popisující riziko onemocnění v území se v této práci ukázala nepřímo standardizovaná incidence (SIR). Tato veličina je poměrem mezi skutečnou a očekávanou incidencí onemocnění v dané populační skupině (v čase a prostoru). Očekávaná incidence je spočtena na základě znalosti demografické struktury v daném období a průměrné míry onemocnění v jednotlivých věkových kategoriích.
Diky existenci národního onkologického registru bylo v této práci možné využít údajů o incidenci jednotlivých druhů maligních onemocnění v jednotlivých obcích ČR. Výskyt těchto onemocnění na úrovni obcí je (naštěstí) poměrně řídkým jevem a proto bylo použití metody výpočtu s prostorovým vyhlazováním nezbytné.
Výpočet sSIR (smoothed SIR) v území je založen na fokálním výpočtu prostředky mapové algebry. Algoritmus pracuje nad údaji o počtech onemocnění a o demografické struktuře vztažených do území v podobě plošných intenzit. Území je modelováno pravidelnou mřížkou o velikosti buňky 500m - 1500m (pro různé kroky zpracování). Každé buňce byl přiřazen příslušný vektor hodnot. Pro každou výstupní buňku byla spočtena hodnota SIR z hodnot v jistém okolí zpracovávané buňky. Algoritmus byl zapsán prostředky mapové algebry modulu GRID systému ARC/INFO. Výsledkem algoritmu jsou dvě mřížky (gridy), v nichž první pro každou buňku obsahuje hodnotu odhadu SIR a druhá obsahuje jeho rozptyl. V případě velkého rozptylu, byla provedena korekce parametrů algoritmu a proveden výpočet s adekvátně zvětšenou mírou vyhlazování (bere do úvahy větší okolí). Odhad SIR i jeho spolehlivost jsou vstupem pro vizualizaci formou tématické mapy.
Výhodou algoritmu je jeho založení na běžné mapové algebře, což umožnilo jeho realizaci v komerčním GIS software. Pomocí stejného software bylo řešeno i následné zpracování tématických dat, čímž odpadly problémy s konverzemi dat.
Většina dosavadních prací se kloní k tvorbě tématické mapy metodou kartogramu. K tomu je nutno provést klasifikaci spojité veličiny do do intervalů, jimž jsou přiřazeny barvy z diskrétní barevné škály. Je ale těžké vyhnout se optické dominaci velkých ploch před malými a optickému zveličení rozdílu barev u ploch, které spolu sousedí. Navíc každý systém klasifikace do diskrétních hladin výsledný obraz poznamenává ,rozdílné klasifikace dávají jiný výsledek a je těžké rozhodnou, kterou z nich použít [5]. S tím je spojeno i rozhodnoutí, zda trvat na vzájemné srovnatelnosti map a použít jednotné členění do intervalů, nebo zda dát přednost vysokému kontrastu zobrazení a použít klasifikaci řízenou daty.
V rámci práce [4] byla zpracována a použita metoda, která se pokouší o řešení tohoto dilematu. Pro vyjádření spojité veličiny (SIR) , spojitě se měnící v území, je použita reprezentace, která kombinuje spojité a diskrétní grafické prostředky. Pro vizualizaci hodnot je využito současně isolinií, a plošného vyjádření spojitou barevnou škálou. Při tvorbě plošného barevného vyjádření klasifikace do intervalů záměrně nebyla provedena, a pro zobrazení průběhu v území je použita spojitá barevná škála. Tato barevná škála má neutrální barvu kolem „neutrální" hodnoty (SIR = 1), a přechází k odstínům zelené na straně nízkého rizika onemocnění (SIR < 1) a k odstínům fialové na straně zvýšeného rizika (SIR > 1). Barevné škály na obou stranách tohoto spektra jsou v oblasti histogramu vyrovnány, což vede ke kontrastnímu vykreslení průběhu veličiny s prokreslenými extrémy. Spojitý charakter průběhu SIR v území, získaný použitou metodou vyhlazováním, potlačuje optický klam spočívající v tom, že dvě mírně odlišné barevné odstíny se jeví patrnější u sousedících ploch, než u ploch vzdálených.
Aby bylo možné, bez velkého spoléhání na barvocit, odečíst hodnotu SIR v konkrétním bodě, jsou mapy doplněny o průběh SIR reprezentovaný isoliniemi v konstatních intervalech. Isolinie dávají současně informaci o hodnotovém rozpětí SIR v konkrétní mapě (svojí hustotou) a poskytují možnost srovnávat různé mapy navzájem.
Alternativním přístupem k mapování územního rozdělení rizika onemocnění je mapování statistické signifikance odlišnosti od hodnoty teoreticky předpokládané. Takové mapy sice dávají přesnou informaci o tom, kde se děje něco „zajímavého", ale neposkytují samotný obraz rizika onemocnění jako takového.
V práci [4] byla použita kompozitní metoda, kdy je míru spolehlivost odhadu rizika zanesena do mapy v podobě poloprůhledných plošných výplní, které zvyšují svoje krytí v lokalitách se sníženou spolehlivostí odhadu a stávají se zcela transparentními v oblastech vysoké spolehlivosti odhadu SIR. Míru spolehlivosti tak uživatel může vnímat jako integrální součást vizuálního vjemu, poskytovaného mapou.
Pro odborníky zajímavé může být vyčíslení korelace map různých onemocnění. V práci [4] byl kromě číselných charakteristik tohoto druhu využit nástroj umožňující vizualizaci vzájemného vztahu územního rozložení rizika různých onemocnění. Tímto nástrojem jsou „trichromatické" mapy. Tato metoda staví na přirozené schopnosti lidského oka identifikovat v obrazu „tvary" a vnímat je v kontextu s celkem. Princip jejich konstrukce je následující. Každé ze tří diagnóz byla přiřazena jedna ze základních barev v barevném modelu RGB. Hodnoty SIR jsou přitom transformovány do jednotné škály. Kombinací jednotlivých složek vzniká barevný vjem, z něhož je možné interpretovat míru rizika příslušejícího analyzovaným onemocnění v území.
literatura:
[1] Geryk E., Kolcová V., Maršík V., Šikula P., Široký P., Zachoval J.: Atlas zhoubných nádorů v České republice, Kartuziánské nakladatelství Brno, 1995
[2] Bailey T.C., Gatrell A.C.: Interactive spatial data analysis, Longman Scientific & Technical, 1995
[3] Elliot P.,Cuzik J.,English D.,Stern R.: Geograhical & Environmental Epidemiology
[4] Maršík V. a kol. : Průběžná zpráva o řešení grantu 3478-2
[5] Kraak M.J.,Ormeling F.J.: Cartography: Visualisation of spatial data, Addison Wesley Longman 1996