13. fejezet - Osztályozás

Tartalom

13.1. Egyszerű példa
13.2. Valódi műholdkép vizsgálata
13.3. Maximum likelihood osztályozás
13.4. Mahalanobis osztályozás
13.5. Minimális távolság (minimum distance) osztályozás
13.6. Paralelepipedon osztályozás

Az osztályozás azon eljárások összefoglaló neve, amely nagyszámú, többcsatornás (ugyanarra az objektumra vonatkozó több független) mérési adatból olyan csoportokat képez, amelyre igaz, hogy az ugyanazon csoportba tartozó adatok „hasonlóak” egymáshoz, a különböző csoportba tartozó adatok pedig „különböznek” egymástól.

Az osztályozási eljárásokat az inverzió statisztikus elmélete alapján tárgyalhatjuk. Az inverzió statisztikus elméletében az osztályozást minőségi interpretációnak nevezik, és azt fejezi ki, hogy a mérési adatok alapján, az objektum lehetséges állapotai között döntünk. Ez a műholdkép osztályozása esetén annak felel meg, hogy egy képpontot csatornánkénti intenzitás (fényesség, radiancia, reflektancia vagy digitális jelszint –CN–) értékei alapján valamilyen felszíntípusként határozzuk meg.

A hasonlóság definiálásához felhasználhatjuk a korábban megismert távolság definíciók (normák) valamelyikét, vagy a valószínűségek definícióját.

13.1. Egyszerű példa

Tekintsünk egy három csatornás, valódi színes műholdképet! Egy ilyen felvétel készítése során minden egyes képponthoz megmérik, hogy mennyi sugárzás érkezik a kék, a zöld és a piros hullámhossztartományban. A műholdképünk legyen 4x4 képpont (pixel) méretű! A képen négy „felszíntípus” legyen látható: a kép bal felső sarkát egy felhő foglalja el, a kép közepén homok látszódjon, a kép jobb alsó sarkában egy mélyvizű tó, a kép bal alsó sarkában pedig egy erdő látszódjon. A kép valahogy így néz ki:

13.1. ábra. Egy 4×4 képpontból álló „műholdkép”. A bal felső sarokban felhő, a bal alsó sarokban erdő, a jobb alsó sarokban egy tó, a kép közepén homokos talaj látszik.

A kép egyes képpontjain látjuk, hogy mit ábrázolnak, ezért ebben az esetben szemre el tudjuk végezni az osztályozást. Az alábbi ábrán az osztályozás eredménye látható

13.2. ábra. A 13.1. ábrán látható műholdkép osztályozásának eredménye. Az egyes képpontok különböző osztályba sorolódtak.

A képen az ’f’ a felhőt, a ’h’ a homokot, az ’e’ az erdőt, a ’v’ a vizet jelöli. Egy színes képen a felhő fehérnek, a homok sárgának, az erdő zöldnek, a víz pedig feketébe hajló sötétkék színűnek látszik.

Ezek a hétköznapi tapasztalatok összhangban vannak a felszínek visszaverő képességének (reflektanciájának) hullámhossz szerinti menetével. A következő ábrán látjuk a képen látható felszínek reflektanciáját a látható hullámhossztartományban.

13.3. ábra. A víz (kék), homokos talaj (sárga), vegetáció (zöld) és a felhőzet (fekete) reflektanicája a hullámhossz függvényében a látható tartományban. A 0,4-0,5 μm a kék, a 0,5-0,6 μm a zöld, 0,6-0,7 μm a piros színnek felel meg.

Készítsünk egy táblázatot, amely az egyes felszíntípusoknak az egyes csatornákon jellemző reflektanciáját tartalmazza! A reflektanicaértékeket skálázzuk át, úgy hogy a 0-10%  reflektanciértékhez a 0 nulla, a 10-20% reflektanciához 1, stb. értékek tartozzanak. Ekkor a táblázat az alábbi alakot ölti:

Kék

0,4-0,5 μm

Zöld

0,5-0,6 μm

Piros

0,6-0,7 μm

Felhő

8

8

8

Erdő

2

4

2

Homok

1

2

3

Víz

0

0

0

13.1. táblázat. A táblázatban a függőleges oszlopokban az egyes csatornákon (színeknek megfeleltethető hullámhosszakon), az egyes felszíntípusokhoz rendelhető átskálázott elméleti intenzitásértékek találhatók.

A táblázat alapján szintetikusan is elő tudjuk állítani, hogy mekkora reflektancia értékeket mérnénk az egyes csatornákon.

13.4. ábra. A „műholdkép” egyes csatornái, a felszíntípusoknak megfelelő átskálázott intenzitásértékekkel.

Hogyan tudnánk egy egyszerű eljárást mondani, ami az egyes pixeleket csoportosítani tudná az intenzitásértékek alapján? Hogyan lehetne algoritmizálni azt az eljárást, amit mi szemmel meg tudunk csinálni, hogy egy képpontra nézve el tudjuk dönteni a színe alapján, hogy az melyik felszíntípusba (osztályba) tartozik?

Ehhez végezzük el az adatok (képpontok) statisztikai elemzését! Készítsük el az egyes csatornák hisztogramját. A hisztogram – a valószínűségszámítást összefoglaló fejezetben leírt definíciónak megfelelően – egy gyakorisági diagram, amely megmondja, hogy egy adatsokaságban a mérési értékek egy-egy meghatározott tartományába hány mért érték esik. A hisztogram vízsintes tengelyén a lehetséges intenzitás értékek, a függőleges tengelyen pedig az adott intenzitásértékű képpontok darabszáma van feltüntetve. Ezen definíció alapján az egyes csatornákra számított hisztogramok a következők:

13.5. ábra. Az egyes csatornák hisztogramjai.

A hisztogrammok vizsgálatával látszik, hogy a Zöld csatornán válnak el legjobban egymásból az egyes felszíntípusok, itt ugyanis annyi csúcs van a hisztogramon, ahány osztályunk van. A zöld csatorna alapján küszöbértékek megadásával egyszerűen el tudnánk határolni az egyes felszíntípusokat: Az „1” reflektanciaértéknél kisebb reflektanciaértékű képpontok a víz, az „1” és „3” reflektanciaiaérték közötti pontok a talaj, „3” és „6” közötti értékek a növényzet és „6”-nál nagyobb értékek a felhők. A növényzet és a felhőzet elhatárolására itt a két csúcs (növényzet a „4”-nél és felhőzet a „8”-nál) közötti „távolság” feléhez húztuk a határt.

Vizsgáljuk meg, hogy milyen lehetőségünk van arra, hogy a többi csatornában levő információt is felhasználjuk az osztályozáshoz!

Ehhez készítsük el két-két csatorna reflektanciaértékeinek együttes gyakorisági diagramját a szkattergramot! A szkattergram két tengelyére felvesszük az egyes csatornákon előforduló intenzitás (reflektancia) értékeket. A szkattergramot úgy készítjük el, hogy végigmegyünk a kiválasztott két csatorna képén a bal felső saroktól kezdődően, és kiolvassuk az egyes képponthoz tartozó intenzitás érték párt. Ez esetünkben a Kék és a Zöld csatorna esetén, a bal felső képpontra: (8; 8). A szkattergram (8;8) cellájában (a példában egy ponttal)  jelezzük, hogy találtunk a képen egy ilyen intenzitás érték párral rendelkező pontot.

13.6. ábra. A Kék és a Zöld csatorna adatainak hisztogramja. A hisztogramba még csak a műholdkép bal felső képpontja került be a (8,8) intenzitásértékekkel jellemzett mezőbe.

A műholdképen végighaladva, a szkattergramba bejelöljük minden képpont intenzitás érték párt. Miután ezzel elkészültünk a szkattergram egyes celláiban a pontokat megszámolva kapjuk a Kék és Zöld csatorna szkattergrammját:

13.7. ábra. A Kék és a Zöld csatorna szkattergramja.

Az elkészült szkattergramba beírt számok összege megadja kép képpontjainak számát (2+7+4+3=16). A fenti módszer segítségével el tudjuk készíteni, a Kék-Piros és a Zöld-Piros csatornák szkattergramjait is.

A szkattergram segítségével elő tudjuk állítani a szkattergram elkészítéséhez felhasznált csatornák hisztogramját. A szkattergramban szereplő számok oszloponkénti összegzésével, és az oszloponkénti összegeket a vízszintes tengelyen levő intenzitásértékek rendelve megkapjuk a Kék csatorna hisztogramját. A szkattergramban szereplő gyakoriságok soronkénti összegzésével, és az összegeknek a függőleges tengelyen felvett intenzitásértékekhez rendelésével kaphatjuk a Zöld csatorna hisztogramját. A művelet nem fordítható meg: a hisztogramokból nem állítható elő a szkattergram.

Az elkészített Kék-Zöld szkattergramon látszik, hogy a négy osztály jól elkülöníthető egymástól. Vizsgáljuk meg, hogy el tudnánk-e különíteni egymástól a felszínosztályokat, ha nem a Kék-Zöld, hanem a Kék-Piros csatornák hisztogramját vizsgálnánk!

13.8. ábra. A Kék és a Piros csatornák szkattergramja.

A Kék-Piros csatornák hisztogramján látszik, hogy a (2,2) intenzitásértékkel jellemzett növényzet és az (1,3) intenzitásértékű homokos talaj egymáshoz „közelebb” van, mint a Kék-Zöld hisztogram esetében. A tapasztalat szerint a különböző hisztogramok segítségével eltérő pontossággal tudjuk elkülöníteni a felszíntípusokat.

Vizsgáljuk meg, hogy hogyan tudnánk valamennyi csatorna adatát felhasználni egy gyakoriság diagram elkészítéséhez! Az eddig eredményeket általánosíthatjuk, úgy, hogy tovább növeljük a gyakoriság diagramon együttesen feldolgozott csatornák számát, ezzel növelve a diagram dimenzióját. Általánosítva tehát a diagram a csatornák absztrakt terét mutatja. Három dimenzió (három csatorna) estén még tudjuk az eredményeinket grafikusan is ábrázolni:

13.9. ábra. A csatornák absztrakt tere, benne a négy felszínelem intenzitásértékeiből képzett 3-dimenziós vektorokhoz tartozó cellák jelölésével.

Az ábrán látszik, hogy a négy felszíntípust jól el tudjuk különíteni egymástól. Mivel valódi 3-dimenziós adatrendszert nem tudunk 2-dimenzióban ábrázolni, a „Piros” tengelyen elfoglalt helyzet érzékeltetésére az egyes cellákat levetítettük a Kék-Zöld csatornaadatok síkjára.

Az eddigi eredményeket további csatornák adataira is általánosíthatjuk. A műholdfelvételeink ugyanis nem csak a látható tartományban, hanem a közeli és távoli infravörös hullámhosszoknál is készülhetnek, így egyetlen képponthoz több (<10, multispektrális) vagy akár nagyszámú (>20, hiperspektrális)  független csatorna tartozik.