Ing. Lena Halounová, CSc.
Laboratoř DPZ
Fakulta stavební ČVUT Praha
Thákurova 7
166 29 Praha 6
E - mail: halounov@fsv.cvut.cz
Orthophoto images of many towns and areas are available in geographical information systems in many organizations at present. These photos have lost their initial information volume present in original RGB digital images or in scanned colour photos due to the irreversible digital JPEG compression. These images were processed in one diploma work defended in January 2001 at CTU in Prague with one goal: image processing allowing detecting vegetation in Prague. The work proved the ability to determine vegetation classification of an orthophoto image with the accuracy higher than 90 per cent.
Ortofoto snímky mnoha měst a oblastí jsou v současné době k dispozici v rámci geografických informačních systémů v mnoha organizacích. Tyto snímky díky nevratné digitální kompresi JPEG ztratily svůj počáteční informační obsah, který je obsažen v původních RGB digitálních snímcích nebo ve skenovaných barevných fotografiích. Tyto snímky byly zpracovány v rámci jedné diplomové práce obhajované v lednu 2001 na ČVUT v Praze s jedním cílem: zpracování obrazu umožňující určení vegetace v Praze. Tato práce prokázala schopnost určit klasifikaci vegetace na ortofoto snímku s přesností vyšší než 90 procent.
Ortofoto snímky zpracovávané fotogrammetrickými metodami poskytují neocenitelné informace o území s přesností mapového podkladu, ale s názorností nesrovnatelně vyšší. Praha si objednala tyto snímky u firmy Geodis Brno. Snímky byly pořízeny proto, aby poskytovaly mimo jiné nejnovější informace o zástavbě a o výškových poměrech Prahy, aby tedy možno získat podrobný podklad pro modelování odtoku dešťových vod a postupu případných povodňových vod na území Prahy. Na základě tohoto modelu pak byly určeny zásahy do ochrany středu města, které bylo do té doby chráněno pouze na tzv. dvacetiletou vodu, tj. na průtok vody Vltavou, který se v křivce dlouhodobého pozorování vyskytuje s frekvencí jednou za dvacet let.
Snímky jsou součástí městského informačního systému MISYS, který má k dispozici řada pracovišť v Praze - jako např. obvodní úřady apod. Snímky jsou využívány většinou jen k vizuální kontrole. Diplomová práce měla ukázat, že je lze při znalostech metody zpracování obrazu využívat i k mnoha jiným úlohám, kde cílem je např. určit plošný rozsah určitého jevu. Jako příklad byla zvolena vegetace, která sama o sobě v sobě obsahuje řadu podrobnějších tříd - travní povrchy, keře, stromy apod.
Snímkování Prahy bylo firmou Geodis provedeno v červenci a v srpnu 1996 s využitím širokoúhlé komory Zeiss RMK A 15/23. Měřítko snímkování bylo 1 : 6800. Výška letu, určená ze vztahu
h =f.ms
kde h je relativní výška letu,
f je konstanta komory,
ms je měřítko snímku,
byla 1020 metrů.
Letecké měřické snímky byly skenovány na skeneru INTERGRAPH Optronics ColorGetter do formátu TIFF (Tagged Image File Format). Protože bylo zpracování prováděno na software firmy INTERGRAPH, byly snímky převedeny do formátu COT, což je mírně upravený formát TIFF. Pro projekt MISYS byly snímky po vlastním zpracování předány ve formátu JPEG.
Vybrané snímky, které byly zpracovávány, byly čtvrtinami pokrývajícími klad mapových listů SMO 1 : 5000 v listu Praha. Jednalo se o snímky Praha 7 - 0/3 listu Praha7 - 0 a Praha 7 - 1/1 listu Praha 7 - 1. Tyto snímky na sebe ve skutečnosti navazují ve svislém směru.
Snímky pokrývají plochu 1250 x 1000 metrů, velikost pixelu je 0.4 metru
Pokud jsou zpracovávána obrazová data ve 24bitovém tvaru, je možné s nimi pracovat tak, jak s nimi pracuje lidský zrak. To znamená, že dopadající elektromagnetické záření je rozdělováno do tří základních neboli primárních barev spektra - červené, zelené a modré, červené s maximální absorpcí na vlnové délce cca 625 nm, zelené cca 560 nm a modré cca 455 nm. Rozdělené spektrum je nervovými impulsy předáváno do mozku. V tomto případě se pro barevný formát používá označení RGB formát.
Existuje však řada dalších formátů barev. Jako příklad může sloužit IHS formát. Jednotlivá písmena označují intenzitu (intensity), odstín (hue), sytost (saturation). Intenzita je rovna průměrné hodnotě (někdy vážené průměrné hodnotě) z R, G a B pásem a je tím udán stupeň šedi. Odstín je pak roven úhlu v rámci barevného kruhu, který svírá daná barevná hodnota s osou barvy červené, přičemž červená má úhel 0o, zelená 120o a modrá 240o. Barvy z viditelné části spektra se vyskytují v úhlech 0o až 240o. Barvy v rozsahu 240o až 360o jsou nespektrálními barvami (purpurovými). Parametr sytosti je roven vzdálenosti, kterou má barevná hodnota v barevném kruhu od středu kruhu. Hodnoty na obvodu kruhu jsou rovny plné sytosti a jsou to tzv. čisté barvy, hodnoty ve středu kruhu jsou rovny pouze stupňům šedi, které mají nulovou sytost.
Komprese JPEG (Joint Photographic Expert Group, sponzorovaná International Satndards Organization) využívá právě formátu IHS. Po transformaci je vyloučena polovina informace o barevnosti (H, S). Pak je použita diskrétní kosinová transformace (DCT), která umožňuje vyloučit hodnoty s vysokými frekvencemi výskytu, a zbývající hodnoty jsou kvantovány, aby byl ještě snížen objem dat. Závěrečným krokem je pak použití RLE a Huffmanovo kódování. V RLE, neboli Run-Length Encoding, jsou data uložena jako hodnoty počtu pixelů o stejné velikosti stupně šedi a hodnota tohoto stupně šedi, Huffmanovo kódování je statistická metoda používající binární kódovací strom pro náhradu běžně se vyskytujících hodnot několika bity a pro náhradu méně běžných hodnot více bity.
Komprese JPEG poskytuje data, která jsou ve většině případů vizuálně málo odlišná od původních dat, ale co do objemu dat velice úsporná. Tato komprese je nevratná, nelze tedy získat zpět původní data.
Výběr počtu tříd a jejich definice ze snímků byly obtížné. Velká podrobnost snímků, kde 1 pixel má rozměr 40 x 40 centimetrů, umožňuje rozlišit i např. barevnou květenu na balkónech. Proto byla použita nejprve neřízená klasifikace založená na shlukové analýze, kde byla volena metoda ISODATA.
První výpočet obou snímků byl proveden s následujícím nastavením po vyzkoušení řady možností a podrobné interpretaci získaných výsledků těchto možností. Počty zkoušených tříd se pohybovaly od 50 do 80. Výsledné nastavení uvedené v tabulce č. 1 se ukázalo jako nejvhodnější:
Vstupní proměnné |
užité hodnoty |
Počet vstupních shluků |
55 |
Maximální počet shluků |
60 |
Minimální počet pixelů shluku |
50 |
Maximální počet shlukových párů, které mohou být během iterací spojeny |
8 |
Maximální počet iterací |
20 |
Parametr pro spojování shluků |
Euklid. vzdálenost |
Mezní hodnota vzdálenosti středů shluků |
20.00 |
Procento pixelů použitých pro shlukovou analýzu |
5-00 |
Směrodatná odchylka prahu určující rozdělení shluku do dvou nových |
6.00 |
Zlomek směrodatné odchylky pro dělení shluků |
1.00 |
Výběr metody k vytvoření počáteční hodnoty pro každý shluk |
Random Placement |
Velikost kernelu pro výpočet počátečních hodnot shluků |
5 |
Tabulka č. 1. Přehled nastavení proměnných pro metodu ISODATA
Snímek Praha 7 - 0/3 byl klasifikován do 66 shluků, snímek 7 - 1/1 do 72 shluků. Tyto výsledky byly podrobeny pečlivé kontrole, která v jistých případech byla doplněna i terénním průzkumem, neboť daná oblast se nachází v blízkosti Fakulty stavební. U obou snímků bylo zjištěno, že přibližně 40 shluků představuje jiné třídy než třídy zeleně. Snímky obsahovaly i neklasifikované pixely. Proto bylo přikročeno k řízené klasifikaci.
Třídy získané metodou neřízené klasifikace byly upraveny, aby byly odstraněny neklasifikované pixely zeleně. Toho bylo dosaženo speciální metodou výběru trénovacích ploch označovanou jako Region Growing podle tříd vybraných shlukovou analýzou. Tato metoda vybírá do trénovací plochy pixely s blízkými spektrálními charakteristikami. Kontrola výběru byla provedena kontrolou histogramů vybraných tříd a dále kontrolou rozptylogramů těchto tříd.
Snímek Praha 7 - 0/3 byl rozdělen do výsledných 16 tříd a snímek Praha 7 - 1/1 do 23 tříd. Klasifikace byla provedena metodou Maximum likelihood.
Výsledná klasifikace byla podrobena filtraci, kde byla zvolena metoda módové filtrace. Filtrace byla nastavena pro kernel 3 x 3 pixely, kde byl definován požadavek, aby hodnota v centrálním pixelu byla rovna hodnotě, která se vyskytuje v rámci pixelu alespoň tři krát..
Přesnost klasifikace byla posouzena pro vybrané plochy dobře klasifikovaných ploch a ploch, jejichž klasifikace byla hodnocena jako nejhorší. Následující tabulka porovnává získané výsledky:
Snímek |
Plocha |
Počet neklasifikovaných pixelů zeleně |
Počet všech pixelů zeleně |
% neklasifikovaných pixelů zeleně |
Praha 7-0/3 |
nezdařile klasifikovaná |
1112 |
17683 |
7.02 |
zdařile klasifikovaná |
113 |
19288 |
0.59 |
|
Praha 7-1/1 |
nezdařile klasifikovaná |
1607 |
27935 |
5.75 |
zdařile klasifikovaná |
199 |
23971 |
0.83 |
Tabulka č. 2. Porovnání přesnosti klasifikace
Zpracování snímků ukázalo, že i klasickým způsobem klasifikace lze zpracovávat letecké měřické snímky, kde nelze využívat texturálních vlastností při zpracování, ani data z infračervených pásem, která jsou u většiny družicových snímků. Největším problémem výše uvedené metody bylo zpracování v místech, kde se vyskytovaly stíny. Některé plochy, kde se stíny vyskytovaly, byly určeny jako třída ploch, kde není zeleň, a to v těch případech, kdy nebylo možno provést verifikaci v terénu - oblasti zahrad veřejnosti nepřístupných.
Snímky byly zpracovávány jeden po druhém. Zpracování prvního sloužilo jako pilotní projekt a trvalo cca 4,5 týdne, zpracování druhého 5dní.
V loňském roce byl předveden nový produkt pojmenovaný eCognition firmy Definiens. Tento produkt využívající texturální analýzu umožní zpracovaní obdobného typu dat ještě podstatným způsobem zkrátit. V současné době se metoda testuje v laboratoř DPZ Fakulty stavební ČVUT.
Recenzoval: RNDr. Petr Dobrovolný, CSc. (MU Brno)