Zkušenosti s programem eCognition pro klasifikaci urbanizovaného území z leteckých černobílých snímků a snímků (TM)

Ing. Lena Halounová, CSc.
Laboratoř DPZ
Fakulta stavební ČVUT Praha
Thákurova 7
166 29 Praha 6
E - mail: halounov@fsv.cvut.cz

Abstract

Classifications in remote sensing are the highest level of image processing. These methods bring simplification of a big amount of information comprised in satellite or aerial imagery. Most of them are based on recognition of single pixel values some of them on texture analysis. eCognition software takes into account far more - heterogeneity, shape, border, and many other characteristics. This software making a bridge between image processing and GIS allows to distinguish a meadow from a lawn even in case the vegetation cover is the same and the class definition is based only on different locations of both areas. This software whose first version was presented in October 2000 was tested in two diploma projects at the department of mapping and cartography of the Faculty of Civil Engineering of CTU in Prague. Black and white aerial photography and Landsat TM were used for this testing. The large variety of eCognition implemented tools needs a deep experience with the software to be fully used. Further research of all possibilities or of "classification calibration" are necessary and will continue.

Abstrakt

Klasifikace v dálkovém průzkumu Země jsou nejvyšší úrovní při zpracování obrazu. Tyto metody přinášejí zjednodušení velkého množství informací obsažených v družicových nebo leteckých snímcích. Většina z nich je založena na rozpoznávání hodnot v jednotlivých pixelech, některé z nich na texturální analýze. Software eCognition bere v úvahu daleko více - heterogenitu, tvar, hranici a mnoho dalších charakteristik. Tento software tvořící překlenutí mezi zpracováním obrazu a GIS umožní rozlišení louky od trávníku i v tom případě, že vegetační pokryv je tentýž a definice třídy je založena pouze na odlišné lokalitě obou ploch. Tento software, jehož první verze byla poprvé představena v říjnu roku 2000, byl testován ve dvou diplomových pracech na katedře mapování a kartografie Fakulty stavební ČVUT v Praze. Pro testování byla použita černobílá fotografie a Landsat TM. Velká rozmanitost nástrojů v eCognition vyžaduje hlubokou zkušenost s ním, aby mohl být tento software plně využit. Výzkum všech možností nebo kalibrace klasifikace jsou nezbytné a budou dále pokračovat.

1. Úvod

Podrobná klasifikace leteckých snímků, družicových snímků s vysokou rozlišovací schopností a radarových snímků byla do doby, než byl k dispozici software eCognition, poměrně obtížná a někdy přímo nemožná automatickým způsobem. Letecké fotografie většinou sloužily pro vizuální interpretaci, nebo pro vytvoření pozadí pro vektorová data. Jejich majitelé či uživatelé se do automatické klasifikace nepouštěli, přestože, jak uvádí např. [4] s využitím [5], to možné je. Zpracování družicových snímků je však již téměř samozřejmě spojeno s automatickou klasifikací. Ta u radarových snímků při poměrně značném úsilí přináší přesnost maximálně kolem 80 procent [2], [3], [6], [7]. Je to právě textura radarových snímků charakterizovaná často jako "pepř a sůl", která činí problémy při klasifikacích. Snímky s vysokou rozlišovací schopností představované dnes především snímky z americké družice IKONOS - multispektrálními (pixel 4 m) a panchromatickými (pixel 1 m), které následuje izraelská družice EROS s panchromatickými snímky a po nich družice QuickBird s opět multispektrálními (pixel 2.5 m) a panchromatickými snímky (pixel cca 60 cm) je stejně časově náročné zpracovávat automatickou klasifikací jako snímky letecké. Jejich frekvence pořizování se však narozdíl od leteckých může pohybovat v řádu několika dní. Proto zde hraje automatická klasifikace tak významnou roli.

2. eCognition

eCognition zpracovává snímky v podstatě ve dvou základních krocích. Prvním krokem je tzv. segmentace. Druhým pak je vlastní klasifikace.

2.1. Segmentace

Segmentace označovaná jako segmentace s multirozlišením rozděluje obraz na homogenní plochy, průměrná velikost jednoho segmentu jako objektu musí odpovídat požadovanému měřítku, protože obrazová analýza je založena na struktuře v rámci určitého měřítka, přičemž velikost segmentů se vzájemně příliš neliší, protože všechny atributy obrazových objektů - barva, textura, tvar, vztahy k sousedním objektům - jsou více či méně funkcí měřítka a kvalitativní porovnání lze provádět pro objekty obdobného měřítka a velikosti.

Způsob segmentace vychází z kritéria, podle něhož průměrná heterogenita obrazových objektů vážená jejich velikostí by měla být minimální. Heterogenita je definována jednak jako heterogenita spektrální neboli barevná podle rovnice (1)

(1)

kde heterogenita h je součet směrodatných odchylek σc ve vrstvách c

vážených vahami wc v každé vrstvě,

a jednak jako heterogenita prostorová, kdy lze podle rovnice (2) vyjádřit odchýlení od kompaktního tvaru

(2)

kde l je délka hranice objektu

a n je plocha objektu v pixelech

nebo lze vyjádřit tzv. hladkost jako poměr délky hranice objektu (l) a nejkratší hranice (b) vytvořené ve směru rastru jako obal plochy podle rovnice (3)

(3)

Volba míry vlivu spektrální heterogenity a prostorové heterogenity, u prostorové heterogenity pak ještě míra vlivu kompaktnosti (Compactness) nebo hladkosti (Smoothness) jsou jedněmi z určujících hodnot pro segmentaci obrazu. Součet měr vlivu je vždy roven jedné - u prostorové i celkové heterogenity.

Segmentace může být provedena simultánně pro hierarchickou síť objektů. Z nejnižší úrovně (úroveň pixelová) vychází 1. úroveň, shlukující určitý počet pixelů do tříd této úrovně, shloučením několika tříd 1. úrovně vzniká třída 2. úrovně apod. Topologicky jsou data mezi úrovněmi čistá, tj. hranice třídy vyšší úrovně je shodná s jednou či více hranicemi tříd nižší úrovně. Segmentace v různých úrovních může vycházet z různých dat. Segmentace s nastavenými parametry se provede vždy pro celý obraz. V některých případech je však potřeba objekty v jednom obraze rozdělit podle odlišných kritérií (například ve městech je mnoho různorodých objektů, které jsou však podstatně menší než okolní zemědělské plochy). Segmentace s různou velikostí objektů je umožněna pomocí funkce hierarchické sítě (Image Object Hierarchy).

Velikost objektů (Scale Parameter) je jedním z rozhodujících kritérií a závisí na účelu, ke kterému chceme výsledky použít, neboť volba příliš velkých či naopak příliš malých objektů může vést k nežádoucí ztrátě informace. Hodnoty velikosti závisejí na zvoleném způsobu segmentace, který je popsán dále v textu.

Kromě všech těchto parametrů je před začátkem segmentace ještě nutné zvolit způsob, kterým bude segmentace probíhat (Segmentation Mode). Normální způsob, vhodný pro většinu případů, umožňuje zadat libovolnou velikost budoucích objektů. Vedle normálního způsobu je možné použít ještě objektovou analýzu liniových prvků nižší úrovně (Sub Object Line Analysis). Zvolená velikost, pohybující se v tomto případě mezi hodnotami 0,5 a 1, určuje maximální relativní délku hranice objektu nižší úrovně v porovnání se sousedními objekty. V případech, kdy je velikost objektu přibližně shodná s velikostí pixelu, nabízí eCognition možnost nastavení diagonálního okolí pixelu (Diagonal Pixel Neighborhood).

Posledním z parametrů, které je třeba definovat, je úroveň (Level), která se prostřednictvím segmentace vytvoří. Zde se nabízí možnost vytvořit novou úroveň, úrovně pod či nad úrovněmi stávajícími anebo možnost tyto úrovně přepsat.

2.2. Hierarchické uspořádání tříd, skupiny, struktury

Hierarchie tříd je velmi podstatným jevem u programu eCognition. Tato hierarchie tvoří stavbu modelu jedním směrem, v němž se vyskytuje vztah dědičnosti mezi mateřskou (vyšší úroveň - např. les) a dceřinou třídou (nižší úroveň - např. jehličnatý les, listnatý les).

Druhým vztahem je pak vztah sémantický, tvořící propojení modelem v jiném směru - městská zeleň, městský park, městské vodní plochy mohou tvořit jednu skupinu, která sdružuje zcela spektrálně i prostorově odlišné objekty.

Třetím sjednocujícím jevem stojícím poněkud zvlášť je struktura, do níž lze propojit různé třídy, které tvořily původně heterogenní plochy. Struktura může být tvořena např. různými třídami vyskytujícími se v městské zástavbě. Fúzí těchto tříd pak vzniká objekt město-nepropustné plochy, kde výchozími třídami byly třídy různých typů střech, silnic, chodníků, parkovišť apod.

2.3. Klasifikace

Klasifikace na rozdíl od segmentace neprobíhá na úrovni jednotlivých pixelů, ale na úrovni objektů vytvořených pomocí segmentace. To do jisté míry urychluje vlastní proces klasifikace, neboť segmentovaných objektů bývá podstatně méně než pixelů.

Nejprve je nutné definovat třídy, do kterých budou objekty podle zvolených kritérií zařazeny. K práci se třídami slouží funkce hierarchie tříd (Class Hierarchy), která umožňuje vytváření nových tříd (Insert Class). U každé třídy se definuje její název, barva a klasifikační metoda (tzv.klasifikátor). Kromě těchto údajů je možné definovat ještě parametry třídy (Class Description), podle kterých se budou objekty klasifikovat. Vytvořené třídy je možné různě seřazovat, přesouvat či vytvářet podtřídy.

Klasifikace vychází z fuzzy logiky pro kvantifikaci nejistých tvrzení. Základní myšlenkou je nahradit dvě striktně logická tvrzení "ano" a "ne" spojitým rozsahem [0 ...1], kde 0 znamená přesně "ne" a 1 znamená přesně "ano". Klasifikace využívající fuzzy logiku je jednoduchá metoda, která převádí hodnoty prvků do fuzzy hodnot mezi 0 a 1, čímž je naznačen stupeň příslušnosti do určité třídy. Převod do fuzzy hodnot umožňuje standardizaci jednotlivých jevů a jejich kombinaci i pro jejich velmi odlišný rozsah a rozměry. Tento převod je zároveň velice transparentní zvláště ve srovnání s neuronovými sítěmi. Dalším znakem pak je možnost formulovat složitý popis prvku s použitím logických operací a hierarchického popisu tříd. Každá třída klasifikačního schématu se skládá ze souboru fuzzy výrazů dovolujících vyhodnocení určitých jevů a jejich logickou operaci.

Výrazy jsou tvořeny jak klasifikátory, tak operátory užívanými v popisu tříd pomocí software eCognition. Každý fuzzy výraz přiděluje fuzzy hodnotu v rozsahu [0 ...1], což je hodnota, odpovídající stupni členství v popisované třídě, která není pravděpodobností tohoto členství. Součet hodnot členství pro jeden objekt není roven jedné.

ECognition používá dva klasifikátory - funkce členství (Membership functions) a nejbližšího souseda (Nearest neighbor) - pro převod hodnot jevů do fuzzy hodnot.

Operátory jsou zvláštní výrazy, které kombinují fuzzy hodnoty pro vytvoření nové fuzzy hodnoty, např.

and (min) - "and"-operátor udělující minimální hodnotu z fuzzy hodnot

and (*) - "and"-operátor udělující součin fuzzy hodnot

or (max) - "or"-operátor udělující maximální hodnotu z fuzzy hodnot.

Výrazy a operátory je možné propojit a vytvořit hierarchický strukturovaný popis třídy. Každý operátor obsahuje soubor dalších výrazů a je současně sám výrazem. Na nejnižší úrovni této struktury jsou všechny výrazy klasifikátory.

Klasifikátor funkce členství je jednoduchou metodou pro převod libovolného rozsahu hodnot do jednotného rozsahu [0 ...1]. Hodnota v tomto rozsahu [0 ...1] je přidělena funkcí členství po vyhodnocení každého jednotlivého jevu tvořícího popis třídy. Je možné např. stanovit rozsah členství pro hodnoty 70 až 82, kde hodnotám 0 - 70 je přidělena fuzzy hodnota rovna 0, hodnotám 82 - 255 (hodnoty stupňů šedi v 8bitovém snímku) fuzzy hodnota rovna 1 a rozsah 70 - 82 bude určen definovanou křivkou členství v programu v rozsahu [0 ...1].

Klasifikátor nejbližšího souseda klasifikuje objekty v daném prostoru jevů s danými vzorky zájmových tříd. Zde je fuzzy hodnota přidělována na základě výpočtu prostorové vzdálenosti obrazového objektu o a vzorového objektu s v n-rozměrném prostoru jevů (viz rovnice (4).

(4)

kde d je vzdálenost mezi vzorovým objektem s a obrazovým objektem o,

vf(s) je hodnota prvku vzorového objektu pro prvek f,

vf(o) je hodnota prvku obrazového objektu pro prvek f,

σf - je směrodatná odchylka hodnot prvku f.

Klasifikátor nejbližšího souseda lépe řeší situace, kde se vyskytuje korelace mezi objekty, neboť funkce členství vymezuje plochu výskytu na základě mezí - čili pomocí rovnoběžnostěnů, narozdíl od klasifikátoru nejbližšího souseda, kde se počítá vzdálenost ke třídám, což lépe vyhoví nepravidelným tvarům těchto tříd.

2.4. Klasifikační proces

Vlastní klasifikace může být provedena dvěma zásadními způsoby. První z nich je způsob, kdy se neberou v úvahu prvky vztažené ke třídám, druhým pak je ten, kdy se tyto prvky v úvahu berou. Druhý způsob je pro zadavatele obtížnější, neboť musí pečlivě připravit popis tříd, aby nedošlo k zacyklení výpočtu, klasifikaci pak je nutno provést několikrát, aby bylo dosaženo skutečně optimalizace ve všech podmínkách. Nesmí být tedy popis třídy vyšší úrovně záviset na hodnotách vztažených ke třídě nižší úrovně, která do té vyšší třídy patří, aby k zacyklení nedošlo.

Prvky používané pro fuzzy popis tříd lze rozdělit na prvky vztažené k objektu, prvky vztažené ke třídě a tzv. termíny. K prvkům vztaženým k objektu lze zařadit:

hodnoty vrstvy

to jsou prvky týkající se hodnot pixelů v kanálech daného obrazového objektu (spektrální prvky),

tvar

těmito prvky lze popsat tvar obrazového objektu pomocí vlastního objektu a případně jeho podobjektů, čili objektů/tříd nižší úrovně

textura

texturální prvky vyhodnocují texturu obrazového objektu založenou na jeho podobjektech,

hierarchie

tyto prvky poskytují informaci o tom, kde se nachází obrazový objekt v celkové hierarchii obrazových objektů,

tématické atributy

jsou atributy objektů převzaté z tématických vrstev. Ty je možné použít pouze tehdy, jsou-li převzaty z externích dat.

K prvkům vztaženým ke třídám patří:

vztahy k sousedním objektům - tyto prvky odkazují na třídy obrazových objektů na stejné úrovni v hierarchii obrazových objektů
vztahy k objektům na nižší úrovni - tyto prvky odkazují na třídy obrazových objektů nižší úrovně
vztahy k objektům vyšší úrovně - tyto prvky odkazují na třídy obrazových objektů vyšší úrovně.

K termínům patří:

klasifikace nejbližšího souseda
směrodatná odchylka klasifikace nejbližšího souseda
podobnost ke třídám
logické termíny.

Podrobný přehled jednoho prvku vztaženého k objektu a označeného jako tvar obsahuje tyto části:

Základní

plocha

 

délka

 

šířka

 

délka hranice

 

délka/šířka

 

index tvaru

 

hustota

 

hlavní směr

 

asymetrie

liniové prvky založené na

liniový ONÚ – délka

objektech nižší úrovně (ONÚ)

liniový ONÚ - šířka

 

liniový ONÚ – křivost/délkou

 

liniový ONÚ –směrodatná odchylka křivosti

umístění

x-ová souřadnice středu

 

y-ová souřadnice středu

 

x - minimální

 

y – minimální

 

x – maximální

 

y – maximální

vztah k objektům vyšší úrovně

relativní vnitřní hranice k objektu vyšší úrovně

 

relativní plocha k objektu vyšší úrovně

 

relativní umístění k objektu vyšší úrovně

Toto je pouze ukázka jednoho přehledu jednoho prvku - tvaru. Je zřejmé, že práce s daty taková, jak ji umožňuje eCognition, je mnohonásobně složitější než veškeré dosud známé metody používané pro klasifikace, že příprava je náročná, ale možnost získat výsledky popisující velmi přesně stav pokryvu půdy je mnohem vyšší než u dosud běžně používaných software.

3. Použití eCognition pro klasifikaci land cover snímku Thematic Mapper

V rámci diplomové práce [8], byl na katedře mapování a kartografie poprvé použit program eCognition pro klasifikaci využití území v oblasti Severočeské hnědouhelné pánve na území okresu Chomutov. Byly zpracovávány snímky z několika různých let.

Obrázky č. 1 a 2 ukazují názvy a barvy tříd zvolených pro klasifikaci a jejich hierarchickou strukturu. Obrázek 1 ukazuje volbu a hierarchii při klasifikaci roku 1994, obrázek 2 ukazuje volbu pro všechny ostatní etapy.

Obrázek č. 1

Obrázek č. 2

V diplomové práci byla použita funkce Membership k vytvoření klasifikačních kriterií při dělení třídy Zástavba u scény z roku 1994 na podtřídy Velmi zastavěno, Středně zastavěno a Málo zastavěno.

Nejprve byly u objektů na území Chomutova vybrány ty, u kterých bylo možno předpokládat vysoké procento zastavěnosti a naopak ty, u kterých byl předpoklad nižšího procenta zastavěnosti. K tomuto výběru byla použita mapa Chomutova v měřítku 1:10000. Následně bylo nalezeno spektrální pásmo, u kterého měly tyto objekty rozdílnou odrazivost. Vybrané pásmo vykazovalo u třídy Zástavba hodnoty 17-45 z intervalu 0-255. Proto byl tento interval rozdělen na tři a tyto hodnoty byly přiděleny nově vzniklým třídám zástavby, aby je upřesnily. V tomto případě byla použita kombinace funkcí Nearest neighbor a Membership, protože první funkce provedla klasifikaci základních tříd, pomocí druhé byla zadána kriteria podtříd zástavby.

Obr. 3

Obr. 4

Obr. 3 představuje výřez města Chomutov před rozdělením třídy Zástavba, obr. 4 zobrazuje totéž území poté.

Po provedení klasifikace je vhodné její výsledky zhodnotit. Na základě tohoto zhodnocení buď provést novou klasifikaci s částečně změněnými podmínkami, nebo uznat kvalitu klasifikace za dostatečnou. K tomuto zhodnocení nám mohou posloužit funkce Best classification result a Classification stability. Tyto funkce barevně odliší objekty podle pevných parametrů.

Funkce Best classification result barevně odliší objekty podle míry podobnosti s třídou, do které byly zařazeny. Tato míra je vyjádřena v procentech. Toto procento není pravděpodobnost zařazení (součet procent všech tříd ( 100%), je to míra pravděpodobnosti zařazení. Pro objekty, které byly použity jako vzorové při použití klasifikátoru Nearest neighbor je procentuální zařazení do třídy 100% a na obrazovce jsou zobrazeny sytě zeleně. Takto jsou zobrazeny i další objekty s velmi vysokou procentuální podobností. Barva podle ztráty procentuální podobností ztrácí skokově sytost zelené a přes žlutou se mění na červenou, kde opět získává sytost. Objekty sytě červené barvy velmi těžko hledaly třídu, do které byly zařazeny, nebo mohly zůstat neklasifikovány. Klasifikace takovýchto objektů může být docíleno změnou funkčního sklonu.

Vhodnější se jeví funkce Classification stability. Tato funkce, jak už bylo zmíněno, barevně odliší objekty podle daného kritéria. Plochy, které byly klasifikovány jako Povrchové doly jsou s vysokou procentuální pravděpodobností kolem 90% zařazeny právě jako Povrchové doly do druhé nejbližší třídy Pole+louky jsou zařazeny s pravděpodobností kolem 50%.

Při zařazení některého z těchto objektů do vzorových objektů pro třídu Pole+louky a provedení nové klasifikace je množství objektů v prostoru těžebních pánví klasifikováno také jako tato třída.

Z toho vyplývá, že pro správnou klasifikaci těchto ploch bychom museli tyto plochy buďto klasifikovat manuálně, nebo pro ně vytvořit novou třídu a pokusit se jí pokud možno vymezit vůči třídě Povrchové doly.

4. Klasifikace černobílého leteckého snímku

V prvním kroku zpracování druhé diplomové práce [9], byla nastavena kritéria segmentace. Jako nejvhodnější se ukázala velikost objektu 130, neboť tak byla většina prvků na snímku představována jen jedním nebo několika málo objekty. Kritériu barva byla přidělena nižší hodnota 0.4; v případě fotografického snímku není spektrální informace pro klasifikaci tolik směrodatná jako například u družicových snímků. Kritériu tvar tedy připadla hodnota 0.6, jelikož součet těchto dvou parametrů je vždy roven jedné. Parametrům hladkost a kompaktnost byla přidělena stejná hodnota 0.5. Také byla zvolena transparentnost objektů, aby bylo možné skrze segmentované objekty identifikovat prvky na snímku.

Dalším krokem bylo vytvoření klasifikačních tříd. Byly vytvořeny pouze tři třídy - zástavba, zeleň a voda. Klasifikace byla provedena jak metodou nejbližšího souseda, tak klasifikátorem Membership. Pro první z metod bylo nutné zadat vzorové objekty pro jednotlivé třídy. Vzorové objekty byly vybrány manuálně přímo ze segmentovaného snímku.

Po vytvoření tříd se přistoupilo k vlastní klasifikaci. Již na první pohled bylo zřejmé, že velká část objektů byla zařazena do nesprávné třídy. To bylo způsobeno skutečností, že přestože program je při klasifikaci schopen brát v úvahu také tvar objektu a jiné faktory (např. polohu sousedních objektů), rozhodujícím klasifikačním kritériem zůstala spektrální informace, neboť jí byla dána 40% váha a prostorové heterogenitě váha 60%.

Z časových důvodů již nebyly provedeny další klasifikace, které jsou plánovány na nadcházející období.

5. Závěr

Na základě prostudovaného manuálu a prvních zkušeností získaných v rámci diplomových prací lze říci, že software eCognition je zcela ojedinělým nástrojem použitelným právě pro data s vysokou rozlišovací schopností a pro radarová data, u nichž proces klasifikace klasickým způsobem selhává, nebo nedosahuje potřebné kvality. Je ale nutné získat nepoměrně hlubší zkušenosti v jeho používání, než jaké měli oba diplomanti, kteří jej měli k dispozici po dobu cca dvou měsíců.

Literatura

  1. ECognition, Object oriented image analysis, Definiens, Mnichov 2000
  2. Halounová, L., Šustera, J., Způsoby komprese a filtrace dat z RADARSATu vhodné pro klasifikaci zemědělských plodin, sem. Aktuální problémy fotogrammetrie a DPZ, Fakulta stavební ČVUT Praha, prosinec 2000, ISBN 80-0102305-2
  3. Halounová, L., Použití radarových dat pro klasifikaci zemědělských plodin, sem. Aktuální problémy fotogrammetrie a DPZ, Fakulta stavební ČVUT Praha, prosinec 2000, ISBN 80-0102305-2
  4. Halounová, L., Klasifikace zeleně na území Prahy z ortofoto snímků již převedených do formátu JPG, GIS Ostrava 2002, leden 2002,
  5. Konečná, L., Klasifikace zeleně v urbanizovaných oblastech pomocí leteckých barevných snímků, diplomová práce, Fakulta stavební ČVUT Praha, 2000
  6. Pek, Vl., Diplomová práce, Fakulta stavební ČVUT Praha, prosinec 1998
  7. Šustera, J., Diplomová práce, Fakulta stavební ČVUT Praha, prosinec 1999
  8. Štolba, R. Diplomová práce, Fakulta stavební ČVUT Praha, prosinec 2001
  9. Žambochová, Kl., Diplomová práce, Fakulta stavební ČVUT Praha, prosinec 2001