6. fejezet - Lineáris inverzió

Tartalom

Lineáris inverzió túlhatározott probléma esetén
Lineáris inverzió alulhatározott probléma esetén
Lináris inverzió egyidejűleg túl- és alulhatározott problémák esetén

A lineáris inverzió elméletében hasonló alapfogalmakat használunk fel, mint az inverzió statisztikai elméletében.

Jelölje az a modellparamétereket tartalmazó vektort, amely a modelltér egy eleme és a mérési adatokat tartalmazó vektort, ami az adattér egy eleme. A lineáris inverzió elméletében abból indulunk ki, hogy az adatok és a modell között lineáris függvénykapcsolat van, amit egy N × M méretű A mátrix fejez ki.

Az A mátrix minden olyan információt tartalmaz, amit a modellparaméterek meghatározása során fel akarunk használni. Az adatokat zaj terheli. A zaj egy e vektorba foglalható össze, amelynek elemszáma megegyezik a mérések számával, vagyis minden méréshez tartozik a zaj-vektor egy eleme. Összefoglalva:

(6.1)

A modell felépítésének megválasztása (vagyis hogy milyen alakú egyenleteket, hány paramétert használunk) egy szubjektív döntés, bizonyos ésszerűségi határokon belül. Ugyanazon mérési anyagra többféle modellt is illeszthetünk, ez többféle lineáris direkt feladatot, így többféle A mátrixot eredményezhet.

Jelölje az inverzió során meghatározott modellparamétereket . (A hullámvonal itt a „becslés, becsült érték” jelentéssel bír.) Ekkor a fenti egyenletrendszer általános megoldását az alábbi formában írhatjuk fel:

(6.2)

Ahol az A mátrix általánosított inverze (vagy pszeudoinverze). (Ennek meghatározását a „Lineáris algebra összefoglaló” c. fejezetben találhatjuk.) Az előző két egyenletből következik:

(6.3)

A fenti egyenletben az mátrixot felbontás mátrixnak nevezzük. Ideális esetben . A fenti egyenletben az  tag azt fejezi ki, hogy a becsült modellparaméterek a valódi modellparaméterek lineáris kombinációjaként adódnak, azaz az ideális mennyiségeknek csak valamilyen átlagát, elkent értékeit kapjuk vissza. Ideális esetben lenne (I az egységmátrix). Ekkor minden paramétert egymástól függetlenül meg tudnánk becsülni, vagyis a felbontás tökéletes lenne. Néhány elemi példa kivételével erre kevés esélyünk van. A később bemutatásra kerülő elemi példa, az egyenes illesztése azonban ilyen, ott a felbontás mátrix megegyezik az egységmátrixszal.

Az egyenlet másik tagja, az  tag azt fejezi ki, hogy az inverzió miként képezi le a zajt a modell térbe.

Az inverzió statisztikus elméletében láttuk, hogy a becsült modellparaméterek kovarianciáit is meg kell határozzuk. Ha a mérések d vektorának a dj elemét σdj szórású korrelálatlan zaj terheli, akkor az modellparaméter hibaterjedésből eredő hibája a lineáris inverzió elmélete szerint:

(6.4)

A gyakorlatban nem lehet olyan általános inverz mátrixot generálni, ami tökéletes felbontást és zérus hibaterjedést eredményez.

Lineáris inverzió túlhatározott probléma esetén

Túlhatározott egy probléma, ha N > M, vagyis a mérések N száma nagyobb, mint a problémában szereplő paraméterek M száma. Az adathibák miatt itt nem feltétlenül sikerül kielégíteni az  egyenletet.

Példaként tekintsük, hogy megmérjük két tárgy tömegét külön-külön (1. és 2. mérés), és megmérjük együttesen (3. mérés) is. Ebből a három mérésből akarjuk megbecsülni a két test tömegét. A méréseink eredményei:

d1= 1 (kg), d2= 2 (kg), d3= 2 (kg). A két test tömegét jelölje m1 és m2.

Látható, hogy ellentmondásosak a méréseink és a modellünk, nem tudunk két olyan tömeget meghatározni, hogy mind a három egyenlet igaz legyen.

Ekkor a (6.1) képlet alapján, formalizáljuk a méréseinket. A méréseket a paraméterekkel összekapcsoló A mátrix alakja:

(6.5)

A zaj (hiba-) vektor komponenseit fejezzük ki a (6.1) egyenlet segítségével!

(6.6)

Ahogy láttuk, esetünkben nem tudunk olyan m paraméterértékeket meghatározni, hogy az e vektor elemei nullák legyenek. Ezért írjuk elő azt, hogy az e vektor elemei a „lehető legkisebbek” legyenek. A lehető legkisebb fogalmat definiáljuk úgy, hogy az L2 normájuk legyen minimális, vagyis az e vektor elemeinek négyzeteiből képzett összeg legyen minimális. Ez a vektorok skalárszorzásának definícióját felhasználva:

(6.7)

A fenti feltétel átírható

(6.8)

alakban. Ennek az egyenletnek a szélsőértékénél, az egyenletnek az m paramétervektor szerinti deriváltja nulla. A deriválást elvégezve, az egyenletrendszert átrendezve kapjuk, az  becslését:

(6.9)

Látható, hogy itt az mátrix inverze szerepel. Ez az alak megegyezik a már levezetett (5.29) egyenlettel, ami a legkisebb négyzetes becslés. A mátrixszorzások kifejtésével megadható a két test becsült tömege:

(6.10)

Vagyis a két test becsült tömege (kg) és (kg).

Határozzuk meg a felbontás mátrixot! Ez a numerikus pontosság értékén belül:

(6.11)

 Vagyis mindkét paraméter jól meghatározható.