7. fejezet - Az inverzió megoldása a legkisebb négyzetek módszer segítségével

Oldjuk meg az alábbi feladatot! Egy felfüggesztett rugóra különböző tömegeket akasztunk, és mérjük meg a rugó teljes hosszát a ráakasztott tömegek hatására. Ebből határozzuk meg a rugóállandót és a rugó nyugalmi hosszát! (a nehézségi gyorsulás értékét vegyük 9.81m/s2-nek.)

A rugón ébredő rugóerő (Frugó) nagysága a rugóállandó (K) és a rugó megnyúlásának (Δl) szorzata. A rugó megnyúlása (Δl) a rugó hosszának (l) és a nyugalmi hossznak (l0) a különbsége. A rugóerő tart egyensúlyt a rugóra akasztott tömeg (m) súlyerejével (m·g). A két erő egyensúlya az alábbi formában írható:

(7.1)

Ahol az i alsó index az egyes mérések sorszámát jelenti. Az egyenletet átrendezhetjük az alábbi formába:

(7.2)

A képletet megvizsgálva látszik, hogy az mi tömegek az li hosszúságok lineáris függvényének tekinthetők.

A mérési adatokat egy koordinátarendszerben ábrázolhatjuk, amelynek vízszintes tengelyére az li hosszúságokat, a függőleges tengelyre pedig az mi tömegeket mérjük fel. Ideális esetben, a mért tömegek a rugó hosszának függvényei lennének, vagyis a koordinátarendszerbe felvitt mérési pontok pontosan egy egyenesre esnének. Az egyenes meredeksége a fenti képlet alapján K/g, tengelymetszete pedig -K·l0/g lenne. Az egyenes ezen két paraméterét ha leolvassuk a grafikonról, azokból kiszámolhatjuk K és l0 értékét.

Tényleges mérési adatok esetén a mérési pontok várhatóan nem esnek egy egyenesbe. Ennek egyik oka a mérés pontatlansága. Ilyen például a leolvasott rugóhosszúság hibája, illetve a méréshez használt tömegek nem pontosan egyeznek meg a ráírt értékekkel. Ezeket a hibákat, ebben a helyzetben, összefoglalóan mérési hibáknak nevezzük.

A másik ok lehet például, hogy a rugó nem pontosan követi a lineáris megnyúlási törvényt, és nagy ráakasztott tömegek esetén a vártnál jobban megnyúlik. Az ilyen típusú hibákat modellhibáknak nevezzük.

Lehetséges, hogy a mérés vagy a jegyzőkönyv elkészítése során egy súlyértéket rosszul olvasunk le, vagy az adatok számítógépes rögzítésénél egy helyiértéket tévedésből rosszul írunk. Ekkor olyan pontot kapunk, ami nem illeszkedik a trendbe, az ilyen típusú hibát durva hibának nevezzük. Az ilyen típusú hibákat el kell távolítani az adatrendszerből, mivel a bemutatásra kerülő legkisebb négyzetek elvét használó módszer érzékeny a durva hibákra.

A mérési pontokra grafikusan is illeszthetünk egy egyenest. Ekkor egy olyan egyenest próbálunk rajzolni, amely a pontok „között” húzódik, illetve leginkább a pontokon megy át. A grafikus illesztésnél azt próbáljuk elérni, hogy nagyjából ugyanannyi pont legyen az egyenes alatt, mint fölötte. Az így berajzolt egyenes tengelymetszetéből és meredekségéből számítjuk ki a K és l0 értékeit. Ezzel a feladatot visszavezettük egy – a mérési pontokra legjobban illeszkedő – egyenes tengelymetszetének és meredekségének meghatározására.

A konkrét mérésünktől elvonatkoztatva, egy olyan adatrendszert vizsgálhatunk, amelyben N darabadatpárunk van és amelynek elemeit xi-vel és yi-vel jelöljük, és ezekre az adatokra szeretnénk egyenest illeszteni.

Az egyenes egyenlete:

(7.3)

Amelyben a0 és a1 az egyenes meghatározandó paraméterei a tengelymetszet és a meredekség.

A problémát Gauss 1808-ban úgy fogalmazta meg, hogy a legjobban illeszkedő egyenesnek azt tekinthetjük, amelyik egyenes esetén a mérési pontokban (az x koordinátákhoz) tartozó y koordináták a lehető legközelebb vannak a pontokra illeszkedő egyeneshez (illetve az egyenes azon pontjához, ami ugyanahhoz az x koordinátához tartozik). A feladat megfogalmazásában szereplő „lehető legközelebb” kitétel tulajdonképpen egy minimumfeltétel. Gauss – elméleti megfontolásokból kiindulva – és ahogy később látjuk majd, a számítási egyszerűség miatt is, ezen eltérések négyzeteinek összegének a minimumát írta elő, ezért a módszert a legkisebb négyzetek módszerének nevezzük.

Egyetlen mérési pontban az xi-hez tartozó mért yi mennyiség és ugyanahhoz az xi ponthoz az egyenes egyenletéből számolt elméleti y érték különbsége:

(7.4)

Ahol mennyiségek a reziduálok. (Nevezzük még maradékhibának vagy később részletezett okokból javításoknak is.) A legkisebb négyzetek módszere szerint tehát az

(7.5)

feltétel kell teljesüljön, vagyis a fenti összeg minimális kell legyen az a0 és a1 paraméterek függvényében.

A legkisebb négyzetek módszerét elvnek tekintjük, az előző fejezetben láttuk a kapcsolatát a maximum likelihood becsléssel. A későbbiekben látni fogjuk ennek a módszernek a széleskörű alkalmazhatóságát és az alkalmazás korlátait. A legkisebb négyzetek módszere – „A geofizikai inverzió statisztikai megközelítése” c. fejezetben részletesen tárgyalt esetekben – azonos eredményt ad az inverzióelmélet valószínűségelméleti megalapozásából levezethető módszerekkel.

A fenti feltétel, vagyis hogy a négyzetösszeg minimális legyen az a0 és a1 paraméterek függvényében, azt jelenti, hogy az összegnek ezen két paraméter szerint deriváltja nulla legyen. (Szükséges továbbá, hogy a második deriváltja negatív legyen de ezt most nem vizsgáljuk.)

(7.6, 7.7)

Az összeg deriváltja a deriváltak összegével egyezik meg. A deriválást elvégezve és az összegzés elé kiemelve a bennük szereplő tagokat kapjuk:

(7.8, 7.9)

Az egyenleteket 2-vel osztva és átrendezve kapjuk:

(7.10, 7.11)

A fenti két egyenlet mátrix alakban írva:

(7.12)

A fenti egyenletet normálegyenletnek nevezzük. Ez egy lineáris egyenletrendszer, amelynek megoldása szolgáltatja az a0 és a1 elemekből álló „paraméter vektor”-t.

Az egyenletet általános alakja:

(7.13)

Ahol a vastag szedés nagybetű esetén mátrixot, kisbetű esetén vektort jelent.

N a normálmátrix, és itt x vektor jelöli a meghatározandó paraméterek vektorát. Az N mátrix mindig szimmetrikus. A normálegyenletet megoldását az

(7.14)

egyenlet szolgáltatja. Az N-1 mátrix az N mátrix inverze. (Ha det(N) = 0, akkor az általánosított inverzek segítségével kapunk megoldást.)