Tvorba map nemocnosti - praktický přístup

Vladimír Maršík
Masarykův onkologický ústav,
Žlutý kopec 7, 656 53 Brno,
Katedra geografie Masarykovy university, Brno
tel.: 05 4313 6908
e-mail:marsik@mou.cz, veem@brn.pvtnet.cz

Úvod

Zobrazování (deskripce) výskytu nemocí v území pomocí map má dlouhou historii. Z počátku se autoři zabývali výhradně deskripcí výskytu infekčních nemocí, přičemž cíl, který si kladli bylo nalézt zdroj infekce a popsat charakter přenosu. K mapování neinfekčních onemocnění se přikročilo teprve s poznáním vlivu jiných (než infekčních) faktorů vnějšího prostředí na jejich etiologii. V oblasti mapování neinfekčních onemocnění jsou známé především atlasy výskytu zhoubných novotvarů, které vznikly, a vznikají z podnětu národních onkologických center v mnoha zemích světa. Jedním z prvních byl vytvořen ve Švédsku v roce 1914. Cílem těchto publikací je upozornit na extrémy v územní distribuci rizika onemocnění a ve spojitosti s navazujícími epidemiologickými studiemi pomoci jak v základním výzkumu příčin onemocnění, tak při plánování preventivních opatření. S mapováním výskytu onemocnění v území je však spojena řada metodologických úskalí.

Výskyt nemoci v území je nutno chápat a matematicky modelovat jako náhodný jev s poissonovským pravděpodobnostním rozdělením. Výsledkem toho je, že veličiny hodnotící riziko onemocnění jsou vždy pouze odhadem s jistou mírou spolehlivosti. Čím je zkoumaná populační skupina menší, tím je menší také spolehlivost vypočtené veličiny, a naopak. V případě geografického zpracování je velikost populační skupiny závislá od územních jednotek pro které je zpracování prováděno (problém malých čísel).

Nejsnazším řešením, jak zvýšit spolehlivost výsledků je agregovat vstupní data do předem daných větších celků, k čemuž se nabízí například okresy. Na této úrovni je možné získat pro většinu druhů onemocnění výsledky se spolehlivostí dostatečnou k opatrné interpretaci [1]. Navíc je nepoměrně snazší získat vstupní data o nemocnosti na úrovni větších správních jednotek, než třeba na úrovni obcí. Hranice okresů však mají s územní distribucí příčinných faktorů vzniku onemocnění jen málo co společného. Důsledkem toho je, že takto získané mapy částečně zakrývají skutečný charakter jevu v území. Z teoretického pohledu je použitá mapa hranic okresů pouze jedna z nekonečně mnoha konfigurací plošných jednotek do nichž lze území členit. Průběh sledované veličiny je přitom na územním členění závislý (modifiable area units problem) [2]. Tomuto nežádoucímu jevu lze zabránit tak, že se zpracují data vztažená k co nejmenším jednotkám, která jsou k dispozici. To na druhou stranu vede k již zmíněným problémům s malými čísly.

Východisko poskytují metody zpracování, využívající existenci prostorové autokorelační struktury. Prostorová autokorelace provází ve větší, či menší míře většinu jevů odehrávajících se v území. (Co si je "blízko" v území je si "blízko" i svojí hodnotou). Průběh hodnoty náhodné veličiny v území je možné modelovat dvěma složkami. První složka zachycuje globální trend v datech (first order effects) a druhá lokální efekty vznikající vzájemnou interakcí na krátké vzdálenosti (second order effects) [2]. Mezi nejvíce sofistikované metody, které využívají této představy jsou bayesovské metody. Výpočetně i na implementaci jsou méně náročné metody typu "kernel estimation". Dobrých výsledků lze dosáhnout zvláště v kombinaci s použitím nepřímé věkové standardizace incidence onemocnění.

Metoda výpočtu prostorově vyhlazeného SIR

Praktická metoda mapování výskytu onemocnění byla vyvinuta v rámci práce na grantovém úkolu „Vyhodnocení územní distribuce malignit v regionech ČR využitím geografických informačních systémů" [4].

Jako nejvhodnější charakteristika popisující riziko onemocnění v území se v této práci ukázala nepřímo standardizovaná incidence (SIR). Tato veličina je poměrem mezi skutečnou a očekávanou incidencí onemocnění v dané populační skupině (v čase a prostoru). Očekávaná incidence je spočtena na základě znalosti demografické struktury v daném období a průměrné míry onemocnění v jednotlivých věkových kategoriích.

Diky existenci národního onkologického registru bylo v této práci možné využít údajů o incidenci jednotlivých druhů maligních onemocnění v jednotlivých obcích ČR. Výskyt těchto onemocnění na úrovni obcí je (naštěstí) poměrně řídkým jevem a proto bylo použití metody výpočtu s prostorovým vyhlazováním nezbytné.

Výpočet sSIR (smoothed SIR) v území je založen na fokálním výpočtu prostředky mapové algebry. Algoritmus pracuje nad údaji o počtech onemocnění a o demografické struktuře vztažených do území v podobě plošných intenzit. Území je modelováno pravidelnou mřížkou o velikosti buňky 500m - 1500m (pro různé kroky zpracování). Každé buňce byl přiřazen příslušný vektor hodnot. Pro každou výstupní buňku byla spočtena hodnota SIR z hodnot v jistém okolí zpracovávané buňky. Algoritmus byl zapsán prostředky mapové algebry modulu GRID systému ARC/INFO. Výsledkem algoritmu jsou dvě mřížky (gridy), v nichž první pro každou buňku obsahuje hodnotu odhadu SIR a druhá obsahuje jeho rozptyl. V případě velkého rozptylu, byla provedena korekce parametrů algoritmu a proveden výpočet s adekvátně zvětšenou mírou vyhlazování (bere do úvahy větší okolí). Odhad SIR i jeho spolehlivost jsou vstupem pro vizualizaci formou tématické mapy.

Výhodou algoritmu je jeho založení na běžné mapové algebře, což umožnilo jeho realizaci v komerčním GIS software. Pomocí stejného software bylo řešeno i následné zpracování tématických dat, čímž odpadly problémy s konverzemi dat.

Tvorba tématických map

Vizualizace formou mapy přináší možnost předat výsledky k posouzení širší odborné veřejnosti. Na zpracování těchto map jsou kladeny značné nároky, neboť s nimi budou pracovat specialisté z různých oborů ale i laici. Cílem proto je, aby tyto tématické mapy splňovali podmínku snadné interpretace, estetické přitažlivost, intuitivního obsahu , ochrany proti mylným interpretacím, možnosti vzájemné srovnatelnosti a přitom dávaly kontrastní zobrazení. Tyto cíle, které si navzájem částečně protiřečí, však není snadné dosáhnout.

Většina dosavadních prací se kloní k tvorbě tématické mapy metodou kartogramu. K tomu je nutno provést klasifikaci spojité veličiny do do intervalů, jimž jsou přiřazeny barvy z diskrétní barevné škály. Je ale těžké vyhnout se optické dominaci velkých ploch před malými a optickému zveličení rozdílu barev u ploch, které spolu sousedí. Navíc každý systém klasifikace do diskrétních hladin výsledný obraz poznamenává ,rozdílné klasifikace dávají jiný výsledek a je těžké rozhodnou, kterou z nich použít [5]. S tím je spojeno i rozhodnoutí, zda trvat na vzájemné srovnatelnosti map a použít jednotné členění do intervalů, nebo zda dát přednost vysokému kontrastu zobrazení a použít klasifikaci řízenou daty.

V rámci práce [4] byla zpracována a použita metoda, která se pokouší o řešení tohoto dilematu. Pro vyjádření spojité veličiny (SIR) , spojitě se měnící v území, je použita reprezentace, která kombinuje spojité a diskrétní grafické prostředky. Pro vizualizaci hodnot je využito současně isolinií, a plošného vyjádření spojitou barevnou škálou. Při tvorbě plošného barevného vyjádření klasifikace do intervalů záměrně nebyla provedena, a pro zobrazení průběhu v území je použita spojitá barevná škála. Tato barevná škála má neutrální barvu kolem „neutrální" hodnoty (SIR = 1), a přechází k odstínům zelené na straně nízkého rizika onemocnění (SIR < 1) a k odstínům fialové na straně zvýšeného rizika (SIR > 1). Barevné škály na obou stranách tohoto spektra jsou v oblasti histogramu vyrovnány, což vede ke kontrastnímu vykreslení průběhu veličiny s prokreslenými extrémy. Spojitý charakter průběhu SIR v území, získaný použitou metodou vyhlazováním, potlačuje optický klam spočívající v tom, že dvě mírně odlišné barevné odstíny se jeví patrnější u sousedících ploch, než u ploch vzdálených.

Aby bylo možné, bez velkého spoléhání na barvocit, odečíst hodnotu SIR v konkrétním bodě, jsou mapy doplněny o průběh SIR reprezentovaný isoliniemi v konstatních intervalech. Isolinie dávají současně informaci o hodnotovém rozpětí SIR v konkrétní mapě (svojí hustotou) a poskytují možnost srovnávat různé mapy navzájem.

Alternativním přístupem k mapování územního rozdělení rizika onemocnění je mapování statistické signifikance odlišnosti od hodnoty teoreticky předpokládané. Takové mapy sice dávají přesnou informaci o tom, kde se děje něco „zajímavého", ale neposkytují samotný obraz rizika onemocnění jako takového.

V práci [4] byla použita kompozitní metoda, kdy je míru spolehlivost odhadu rizika zanesena do mapy v podobě poloprůhledných plošných výplní, které zvyšují svoje krytí v lokalitách se sníženou spolehlivostí odhadu a stávají se zcela transparentními v oblastech vysoké spolehlivosti odhadu SIR. Míru spolehlivosti tak uživatel může vnímat jako integrální součást vizuálního vjemu, poskytovaného mapou.

Interpretace územního rozdělení

Cílem mapování onemocnění je odpověď na otázku, zda má dané onemocnění prostorové závislosti. Pokud je cílem na tuto odpověď získat odpověď, ve smyslu potvrzení, resp. zamítnutí hypotézy je možné pokusit se o využití některého statistického testu homogenity. Klasické testy, které neberou v úvahu prostorovou konfiguraci jsou nepoužitelné, existuje ale řada statistických testů prostorové autokorelace (Moran, Geary, Smans...). Bohužel jejich použitelnost v případě testování věkově standardizovaných veličin je sporná, neboť samotné rozdělení populace v území má kladnou prostorovou autokorelaci a ta se přenáší i na standardizovanou veličinu.

Pro odborníky zajímavé může být vyčíslení korelace map různých onemocnění. V práci [4] byl kromě číselných charakteristik tohoto druhu využit nástroj umožňující vizualizaci vzájemného vztahu územního rozložení rizika různých onemocnění. Tímto nástrojem jsou „trichromatické" mapy. Tato metoda staví na přirozené schopnosti lidského oka identifikovat v obrazu „tvary" a vnímat je v kontextu s celkem. Princip jejich konstrukce je následující. Každé ze tří diagnóz byla přiřazena jedna ze základních barev v barevném modelu RGB. Hodnoty SIR jsou přitom transformovány do jednotné škály. Kombinací jednotlivých složek vzniká barevný vjem, z něhož je možné interpretovat míru rizika příslušejícího analyzovaným onemocnění v území.

Závěr

Mapy se stávají důležitým nástrojem moderní epidemiologie nemocí. Dříve velmi pracné metody jsou dnes realizovatelné díky možnosti využití výkonné výpočetní techniky a specializovaného vybavení jako je GIS. Role GIS v mapování nemocnosti začíná ve fázi zpracování dat a navazuje v tvorbě map. Bez jeho nasazení si realizaci diskutovaných metod není možné představit.

literatura:
[1] Geryk E., Kolcová V., Maršík V., Šikula P., Široký P., Zachoval J.: Atlas zhoubných nádorů v České republice, Kartuziánské nakladatelství Brno, 1995
[2] Bailey T.C., Gatrell A.C.: Interactive spatial data analysis, Longman Scientific & Technical, 1995
[3] Elliot P.,Cuzik J.,English D.,Stern R.: Geograhical & Environmental Epidemiology
[4] Maršík V. a kol. : Průběžná zpráva o řešení grantu 3478-2
[5] Kraak M.J.,Ormeling F.J.: Cartography: Visualisation of spatial data, Addison Wesley Longman 1996