13.3. Maximum likelihood osztályozás

Azzal hogy egy általunk ismert felszíntípusú terület képpontjainak a statisztikáját készítettük el, az erre a területre eső képpontokból készült hisztogram azt jellemzi, hogy mi a valószínűsége annak, hogy egy képpont pont egy adott intenzitásértéket vesz fel, ha a felszín egy adott típusú. Ez pontosan az a feltételes valószínűség, amit a normális hibaeloszlású, lineáris additív terű modelleknél az inverzió statisztikai megközelítését tárgyaló fejezetben már felírtunk (5.8):

(5.8)

A fenti képletet egyetlen mérési csoportra vonatkoztatva kapjuk:

(13.4)

A fenti képletben n a dimenzió, vagyis a csatornák száma, az u vektor pedig a mérésünk, vagyis egy képpont csatornánkénti intenzitásértékeiből képzett vektor. Az fν vektor, az adott ν-edik osztályhoz tartozó „elméleti” értékekből képzett vektor. Ez nem más, mint az adott felszíntípus tanulóterület poligonjába eső pontok csatornánkénti átlagai (13.1.). A kettő különbsége a hibavektor, amelyről feltételeztük, hogy normális eloszlású. A mátrix az adott osztályt jellemző kovarianciamátrix, amit a tanulóterület poligonjába eső képpontokból a (13.2) képlet segítségével számíthatunk.

Ez a feltételes valószínűség tehát megadja, hogy egy adott csatornánkénti intenzitásértékekkel jellemzett képpont mekkora valószínűséggel tartozik az adott osztályba. A csatornák absztrakt terében vizsgálva, az osztályközéppont közelében levő pontok nagy valószínűséggel, az attól távolabbi pontok kisebb valószínűséggel tartoznak az adott osztályhoz. Az azonos valószínűségeket n-dimenziós ellipszoid felületek jellemzik. (Két csatorna esetén ezek ellipszisek). Az ellipszoidfelület középpontjában van az osztályközéppont. Az ellipszoid csak akkor kanonikus helyzetű, ha a kovarianciamátrix inverze diagonális, különben az ellipszoid tengelyei szöget zárnak be a koordinátatengelyekkel. A kisebb valószínűségekhez nagyobb tengelyekkel jellemezhető ellipszoid felületek tartoznak, amelyek koncentrikusak, és tengelyirányaik megegyeznek. Ha valamelyik csatornán nagyon nagy szórása van az adatoknak, akkor annak a tengelynek az irányába elnyúlik az ellipszis. Ha csatornánként azonos a szórás, és a kovariancia mátrix nem diagonális elemek kicsik, akkor az ellipszoid egy n-dimenziós gömbbé fajul.

A fenti feltételes valószínűség (13.4) segítségével tehát ki tudjuk számolni, hogy egy adott képpont ebbe az osztályba tartozik (ν), akkor mennyi a valószínűsége, hogy az egyes csatornákon pont a mért intenzitásértéket mérjük (u).

Ahogy korábban láttuk, a Bayes-tétel alapján ezzel a feltételes valószínűség segítségével ki tudjuk fejezni, hogy mi a valószínűsége annak, hogyha az adott képpont esetén ezeket az intenzitásértékeket mértük a csatornákon, akkor a képpont éppen ebbe az osztályba tartozik:

(13.5)

A képlet szerint annak a valószínűsége, hogy adott intenzitásértékekkel jellemzett képpont az adott osztályba tartozik, az adott osztályba tartozás előzetes (a priori) valószínűségének és az adott osztály esetén a mért értékek megvalósulását leíró feltételes valószínűségsűrűségek szorzata.

(Korábban említettük, hogy a nevezőben szereplő valószínűség, vagyis hogy egy mérés során pont a mérési eredményeket mérjük, minden ν osztály feltételes valószínűségében szerepel, ezért ezt egységnyinek választhatjuk.)

A valószínűség az előzetes ismereteinket fejezi ki. A műholdkép esetén, ilyen előzetes ismeret, ha tudjuk, hogy az adott osztály a kép által lefedett terület hányad részét foglalja el. Például ha tudjuk, hogy a terület 50%-a erdő, 30%-a talaj, és 20%-a víz, akkor az ezekhez az osztályokhoz tartozó a priori valószínűségek rendre: 0,50 0,30 0,20.

A maximum likelihood osztályozás során a tanulóterületeinkre elvégzett statisztikai számításból meghatározzuk minden osztályhoz az osztályközepek fv vektorát és az Rv kovariancia mátrixot.

Ezután minden képpontra kiszámoljuk, hogy mekkora a valószínűség, hogy az adott képpont az egyes osztályokba tartozzon. Ezt, egy adott osztályra az adott osztály előzetes valószínűsége és a (13.4) képlettel definiált feltételes valószínűség szorzataként állítjuk elő. Az adott képpontra megvizsgáljuk, hogy melyik az az osztály, amelyikhez a legnagyobb valószínűséget számoltunk, és a képpontot abba az osztályba soroljuk. 

Vizsgáljuk meg, hogy mekkora a valószínűsége, hogy a (13, 28, 18) intenzitásértékekkel jellemzett pont, a 13.2 táblázatban található pontokkal jellemzett osztályhoz tartozik, ha tudjuk, hogy az adott osztály előzetes (a priori) valószínűsége 0,4.

A feltételes valószínűség (13.4) képletébe behelyettesítve a mért pont és az osztályközéppont távolságvektorára:

(13.6)

Szükségünk van az mátrix (13.3) determinánsára, ami:

(13.7)

Az mátrix inverze:

(13.8)

Ezeket a mennyiségeket, valamint a dimenziószámot (n = 3) visszahelyettesítve a feltételes valószínűség képletébe, kapjuk:

(13.9)

A fenti eredmény és az előzetes valószínűség segítségével tehát:

(13.10)

A gyakorlati alkalmazás során az így kapott valószínűséget kell összehasonlítani az adott képpont (13, 28, 18) más osztályokra vonatkozó valószínűségével, és abba az osztályba besorolni, amelyik osztályba tartozás valószínűsége a maximális.