Klasifikace zeleně na území Prahy z ortofoto snímků již převedených do formátu JPG

Ing. Lena Halounová, CSc.
Laboratoř DPZ
Fakulta stavební ČVUT Praha
Thákurova 7
166 29 Praha 6
E - mail: halounov@fsv.cvut.cz

Abstract

Orthophoto images of many towns and areas are available in geographical information systems in many organizations at present. These photos have lost their initial information volume present in original RGB digital images or in scanned colour photos due to the irreversible digital JPEG compression. These images were processed in one diploma work defended in January 2001 at CTU in Prague with one goal: image processing allowing detecting vegetation in Prague. The work proved the ability to determine vegetation classification of an orthophoto image with the accuracy higher than 90 per cent.

Abstrakt

Ortofoto snímky mnoha měst a oblastí jsou v současné době k dispozici v rámci geografických informačních systémů v mnoha organizacích. Tyto snímky díky nevratné digitální kompresi JPEG ztratily svůj počáteční informační obsah, který je obsažen v původních RGB digitálních snímcích nebo ve skenovaných barevných fotografiích. Tyto snímky byly zpracovány v rámci jedné diplomové práce obhajované v lednu 2001 na ČVUT v Praze s jedním cílem: zpracování obrazu umožňující určení vegetace v Praze. Tato práce prokázala schopnost určit klasifikaci vegetace na ortofoto snímku s přesností vyšší než 90 procent.

1. Úvod

Ortofoto snímky zpracovávané fotogrammetrickými metodami poskytují neocenitelné informace o území s přesností mapového podkladu, ale s názorností nesrovnatelně vyšší. Praha si objednala tyto snímky u firmy Geodis Brno. Snímky byly pořízeny proto, aby poskytovaly mimo jiné nejnovější informace o zástavbě a o výškových poměrech Prahy, aby tedy možno získat podrobný podklad pro modelování odtoku dešťových vod a postupu případných povodňových vod na území Prahy. Na základě tohoto modelu pak byly určeny zásahy do ochrany středu města, které bylo do té doby chráněno pouze na tzv. dvacetiletou vodu, tj. na průtok vody Vltavou, který se v křivce dlouhodobého pozorování vyskytuje s frekvencí jednou za dvacet let.

Snímky jsou součástí městského informačního systému MISYS, který má k dispozici řada pracovišť v Praze - jako např. obvodní úřady apod. Snímky jsou využívány většinou jen k vizuální kontrole. Diplomová práce měla ukázat, že je lze při znalostech metody zpracování obrazu využívat i k mnoha jiným úlohám, kde cílem je např. určit plošný rozsah určitého jevu. Jako příklad byla zvolena vegetace, která sama o sobě v sobě obsahuje řadu podrobnějších tříd - travní povrchy, keře, stromy apod.

2. Zpracovávaná data

Snímkování Prahy bylo firmou Geodis provedeno v červenci a v srpnu 1996 s využitím širokoúhlé komory Zeiss RMK A 15/23. Měřítko snímkování bylo 1 : 6800. Výška letu, určená ze vztahu

h =f.ms

kde h je relativní výška letu,

f je konstanta komory,

ms je měřítko snímku,

byla 1020 metrů.

Letecké měřické snímky byly skenovány na skeneru INTERGRAPH Optronics ColorGetter do formátu TIFF (Tagged Image File Format). Protože bylo zpracování prováděno na software firmy INTERGRAPH, byly snímky převedeny do formátu COT, což je mírně upravený formát TIFF. Pro projekt MISYS byly snímky po vlastním zpracování předány ve formátu JPEG.

Vybrané snímky, které byly zpracovávány, byly čtvrtinami pokrývajícími klad mapových listů SMO 1 : 5000 v listu Praha. Jednalo se o snímky Praha 7 - 0/3 listu Praha7 - 0 a Praha 7 - 1/1 listu Praha 7 - 1. Tyto snímky na sebe ve skutečnosti navazují ve svislém směru.

Snímky pokrývají plochu 1250 x 1000 metrů, velikost pixelu je 0.4 metru

3. Komprese JPEG

Pokud jsou zpracovávána obrazová data ve 24bitovém tvaru, je možné s nimi pracovat tak, jak s nimi pracuje lidský zrak. To znamená, že dopadající elektromagnetické záření je rozdělováno do tří základních neboli primárních barev spektra - červené, zelené a modré, červené s maximální absorpcí na vlnové délce cca 625 nm, zelené cca 560 nm a modré cca 455 nm. Rozdělené spektrum je nervovými impulsy předáváno do mozku. V tomto případě se pro barevný formát používá označení RGB formát.

Existuje však řada dalších formátů barev. Jako příklad může sloužit IHS formát. Jednotlivá písmena označují intenzitu (intensity), odstín (hue), sytost (saturation). Intenzita je rovna průměrné hodnotě (někdy vážené průměrné hodnotě) z R, G a B pásem a je tím udán stupeň šedi. Odstín je pak roven úhlu v rámci barevného kruhu, který svírá daná barevná hodnota s osou barvy červené, přičemž červená má úhel 0o, zelená 120o a modrá 240o. Barvy z viditelné části spektra se vyskytují v úhlech 0o až 240o. Barvy v rozsahu 240o až 360o jsou nespektrálními barvami (purpurovými). Parametr sytosti je roven vzdálenosti, kterou má barevná hodnota v barevném kruhu od středu kruhu. Hodnoty na obvodu kruhu jsou rovny plné sytosti a jsou to tzv. čisté barvy, hodnoty ve středu kruhu jsou rovny pouze stupňům šedi, které mají nulovou sytost.

Komprese JPEG (Joint Photographic Expert Group, sponzorovaná International Satndards Organization) využívá právě formátu IHS. Po transformaci je vyloučena polovina informace o barevnosti (H, S). Pak je použita diskrétní kosinová transformace (DCT), která umožňuje vyloučit hodnoty s vysokými frekvencemi výskytu, a zbývající hodnoty jsou kvantovány, aby byl ještě snížen objem dat. Závěrečným krokem je pak použití RLE a Huffmanovo kódování. V RLE, neboli Run-Length Encoding, jsou data uložena jako hodnoty počtu pixelů o stejné velikosti stupně šedi a hodnota tohoto stupně šedi, Huffmanovo kódování je statistická metoda používající binární kódovací strom pro náhradu běžně se vyskytujících hodnot několika bity a pro náhradu méně běžných hodnot více bity.

Komprese JPEG poskytuje data, která jsou ve většině případů vizuálně málo odlišná od původních dat, ale co do objemu dat velice úsporná. Tato komprese je nevratná, nelze tedy získat zpět původní data.

4. Zpracování snímků

4.1. Neřízená klasifikace

Výběr počtu tříd a jejich definice ze snímků byly obtížné. Velká podrobnost snímků, kde 1 pixel má rozměr 40 x 40 centimetrů, umožňuje rozlišit i např. barevnou květenu na balkónech. Proto byla použita nejprve neřízená klasifikace založená na shlukové analýze, kde byla volena metoda ISODATA.

První výpočet obou snímků byl proveden s následujícím nastavením po vyzkoušení řady možností a podrobné interpretaci získaných výsledků těchto možností. Počty zkoušených tříd se pohybovaly od 50 do 80. Výsledné nastavení uvedené v tabulce č. 1 se ukázalo jako nejvhodnější:

Vstupní proměnné

užité hodnoty

Počet vstupních shluků

55

Maximální počet shluků

60

Minimální počet pixelů shluku

50

Maximální počet shlukových párů, které mohou být během iterací spojeny

8

Maximální počet iterací

20

Parametr pro spojování shluků

Euklid. vzdálenost

Mezní hodnota vzdálenosti středů shluků

20.00

Procento pixelů použitých pro shlukovou analýzu

5-00

Směrodatná odchylka prahu určující rozdělení shluku do dvou nových

6.00

Zlomek směrodatné odchylky pro dělení shluků

1.00

Výběr metody k vytvoření počáteční hodnoty pro každý shluk

Random Placement

Velikost kernelu pro výpočet počátečních hodnot shluků

5

Tabulka č. 1. Přehled nastavení proměnných pro metodu ISODATA

Snímek Praha 7 - 0/3 byl klasifikován do 66 shluků, snímek 7 - 1/1 do 72 shluků. Tyto výsledky byly podrobeny pečlivé kontrole, která v jistých případech byla doplněna i terénním průzkumem, neboť daná oblast se nachází v blízkosti Fakulty stavební. U obou snímků bylo zjištěno, že přibližně 40 shluků představuje jiné třídy než třídy zeleně. Snímky obsahovaly i neklasifikované pixely. Proto bylo přikročeno k řízené klasifikaci.

4.2. Řízená klasifikace, filtrace

Třídy získané metodou neřízené klasifikace byly upraveny, aby byly odstraněny neklasifikované pixely zeleně. Toho bylo dosaženo speciální metodou výběru trénovacích ploch označovanou jako Region Growing podle tříd vybraných shlukovou analýzou. Tato metoda vybírá do trénovací plochy pixely s blízkými spektrálními charakteristikami. Kontrola výběru byla provedena kontrolou histogramů vybraných tříd a dále kontrolou rozptylogramů těchto tříd.

Snímek Praha 7 - 0/3 byl rozdělen do výsledných 16 tříd a snímek Praha 7 - 1/1 do 23 tříd. Klasifikace byla provedena metodou Maximum likelihood.

Výsledná klasifikace byla podrobena filtraci, kde byla zvolena metoda módové filtrace. Filtrace byla nastavena pro kernel 3 x 3 pixely, kde byl definován požadavek, aby hodnota v centrálním pixelu byla rovna hodnotě, která se vyskytuje v rámci pixelu alespoň tři krát..

4.3. Posouzení přesnosti klasifikace

Přesnost klasifikace byla posouzena pro vybrané plochy dobře klasifikovaných ploch a ploch, jejichž klasifikace byla hodnocena jako nejhorší. Následující tabulka porovnává získané výsledky:

Snímek

Plocha

Počet neklasifikovaných pixelů zeleně

Počet všech pixelů zeleně

% neklasifikovaných pixelů zeleně

Praha 7-0/3

nezdařile klasifikovaná

1112

17683

7.02

zdařile klasifikovaná

113

19288

0.59

Praha 7-1/1

nezdařile klasifikovaná

1607

27935

5.75

zdařile klasifikovaná

199

23971

0.83

Tabulka č. 2. Porovnání přesnosti klasifikace

5. Závěr

Zpracování snímků ukázalo, že i klasickým způsobem klasifikace lze zpracovávat letecké měřické snímky, kde nelze využívat texturálních vlastností při zpracování, ani data z infračervených pásem, která jsou u většiny družicových snímků. Největším problémem výše uvedené metody bylo zpracování v místech, kde se vyskytovaly stíny. Některé plochy, kde se stíny vyskytovaly, byly určeny jako třída ploch, kde není zeleň, a to v těch případech, kdy nebylo možno provést verifikaci v terénu - oblasti zahrad veřejnosti nepřístupných.

Snímky byly zpracovávány jeden po druhém. Zpracování prvního sloužilo jako pilotní projekt a trvalo cca 4,5 týdne, zpracování druhého 5dní.

V loňském roce byl předveden nový produkt pojmenovaný eCognition firmy Definiens. Tento produkt využívající texturální analýzu umožní zpracovaní obdobného typu dat ještě podstatným způsobem zkrátit. V současné době se metoda testuje v laboratoř DPZ Fakulty stavební ČVUT.

Literatura

  1. Konečná, L.: Klasifikace zeleně v urbanizovaných oblastech pomocí leteckých barevných snímků, diplomová práce, Fakulta stavební ČVUT Praha, 2000
  2. Castleman, K. R.: Digital Image Processing, Prentice Hall, Inc., New Jersey, 1996

Recenzoval: RNDr. Petr Dobrovolný, CSc. (MU Brno)