12. fejezet - Csillapított (regularizált) legkisebb négyzetes becslés

Vizsgáljuk meg az alábbi kiegyenlítési feladatot, amelyben mérésekkel azonos számú paraméter értékét akarjuk meghatározni a legkisebb négyzetek módszer segítségével.

A Balatonon egycsatornás vizi szeizmikus mérést végzünk több időpontban. A különböző időpontokban mért mérések nyomvonalai több helyen elmetszik egymást. Az egymást metsző szelvényeken egy jól azonosítható réteghatár mélysége nem egyezik meg a különböző szelvényeken a szelvények metszéspontjában, aminek a különböző időpontokban eltérő vízállás az oka. Korrigáljuk a 3 szelvényt egy-egy, szelvényenként konstans magasságtolással, hogy a szelvények metszéspontjában a korrigált mélységek lehetőleg megegyezzenek!

Szelvények metszéspontja

Szelvény száma

Magasság

Szelvény száma

Magasság

I

1

101,57

2

101,83

II

1

100,23

3

100,39

III

2

99,82

3

99,71

12.1. táblázat. Három szelvény, összesen három metszéspontjában az egyes szelvénypárokon azonosítható szintfelületek magasságai

Határozzuk meg először a direkt feladatot és a javítási egyenletet!

A három meghatározandó paraméter az egyes szelvények magassági korrekció értékei x=(x1, x2, x3). Ezeket a korrekciókat hozzáadva az adott szelvényen mért magasságokhoz, akkor a korrigált magasságokat kapjuk. 

A korrigált magasságokra írhatjuk fel a feltételi egyenleteket: A szelvények metszéspontjában a korrigált magasságok eltérése minimális kell legyen.

(12.1)

A feltételi egyenletekbe behelyettesítve a paraméterek kiinduló értékeit (nullákat) az egyenlet jobb oldalán áll a tisztatag vektort (l) kapjuk (amelynek elemei: l1 = -0,26 l2 = -0,16 l3 = 0,11) Elemezzük a tisztatag vektort! Az első mennyiség azt fejezi ki, hogy a 1. szelvény és az 2. szelvény között mennyi a magasságkülönbség, a második tag az 1. és 3. szelvény, a harmadik tag pedig a 2. és 3. szelvények közötti magasságkülönbséget fejezi ki. Ideális esetben a három tag összege nulla lenne, vagyis az egyes szelvényekhez lehet találni olyan eltolást, hogy azok hatására a magasságkülönbségek eltűnnek. Ezzel ellentétben látni fogjuk, hogy közel 1 cm-es, maradék ellentmondást nem lehet feloldani. A mérési és leolvasási hibák miatt nem meglepő, hogy a kiegyenlítés ellenére is marad ellentmondás a magasságokban.

Készítsük el az A alakmátrixot, a feltételi egyenleteknek a paraméterek szerinti deriváltját!

(12.2)

Próbáljuk meg meghatározni a paraméterek x vektorát a (8.29) egyenlet segítségével!

(12.3)

A problémát az jelenti, hogy az mátrix determinánsa nulla, így nem invertálható.

Próbáljuk meg elemi megfontolások alapján meghatározni, hogy mi lehet a probléma. Tételezzük fel, hogy ha az első szelvényhez 0,1 méter, a második szelvényhez 0,2 méter, a harmadikhoz 0,3 méter korrekciót adnánk hozzá, és ezeket a korrekciókat a (12.1) egyenletbe beírva a kiszámolhatnánk a tisztatag vektor. Ha a szelvényeket ehelyett rendre 1,1  1,2 és 1,3 méterrel korrigálnánk, akkor ugyanazokat a tisztatag vektor elemeket kapnánk az egyenletek alakjából következően. Ez azt jelenti, hogy több különböző paraméterkombináció esetén is a (12.1) feltételi egyenlet jobb oldalán ugyanazok a mennyiségek szerepelnek, ami egyenértékű azzal, hogy a fentebbi (12.1) egyenletnek nincs egyértelmű megoldása.

Az adott probléma esetén két lehetséges kezelési mód rögtön kínálkozik.

Az első lehetőség, ha rögzítjük az első szelvény magasságát, vagyis x1 = 0.

Innentől megint két irányba mehetünk tovább: vagy átfogalmazzuk a feladatot, hogy csak 2 paramétert becslünk, vagy pedig kényszerfeltételként előírjuk, hogy x1 = 0, ekkor a „Kényszerfeltételek alkalmazása” c. fejezetben leírt utat követjük.

A második lehetőség, hogy valamilyen további feltételt vezetünk, be, például, hogy a paraméterekre előírjuk, hogy a négyzetösszegük legyen minimális. (Ezt általánosságban nevezhetjük a paraméterek normájára vonatkozó feltételnek.) Ez a konkrét példa esetén azt jelenti, hogy mind a három szelvényhez meghatározunk korrekció értékeket, úgy, hogy ezeknek a négyzetösszege a lehető legkisebb legyen.  Ekkor az

(12.4)

feltételnek kell teljesülni.

A gyakorlatban ilyen esetekben lehetséges, hogy fontosabbnak találjuk a kis reziduálértékeket elfogadva a paraméterek nagyobb javításértékeit (és ezzel együtt nagyobb változékonyságukat) de az is lehet, hogy nagyobb reziduálértékeket is elfogadunk a paraméterek kis (vagy kevésbé változékony) javításértékeiért cserébe.

Ezt a két véglet közötti kompromisszumot egy γ csillapítási tényező (trade-off  paraméter) bevezetésével érhetjük el. Ekkor a felírható feltétel:

(12.5)

Ebből a feltételből vezethetjük le (6.17-6.18) egyenletekhez hasonlóan, hogy a paraméterek az alábbi módon számíthatók:

(12.6)

Oldjuk meg az egyenletet γ = 1 esetben, és vizsgáljuk meg a kapott megoldást!

Ekkor a paraméterek javításai:

(12.7)

A paraméterek javításaival kifejezett eltolások hatására a metszéspontok magassága az egyes szelvényeken:

      

magasság

magasság

I

101,675

101,738

II

100,335

100,378

III

99,728

99,698

12.2. táblázat. A három metszéspontban az egyes szelvénypárokon azonosítható szintfelületek korrigált magasságai γ=1 esetén.

A metszéspontokban a maradékhibák:

(12.8)

Vagyis mind a paraméterek javításai, mind a maradékhibák a centiméteres nagyságrendbe esnek.

Ha gamma értékét nagynak választom (pl. γ = 10000), akkor a paraméterek javításai:

(12.9)

vagyis a milliméter tört része. Ennek következtében, a korrigált magasságok is csak kicsit módosulnak a kiinduló magasságadatokhoz képest:

magasság

magasság

I

101,570

101,830

II

100,230

100,390

III

99,820

99,710

12.3. táblázat. A három metszéspontban az egyes szelvénypárokon azonosítható szintfelületek korrigált magasságai γ=10000 esetén.

Ennek hatására a maradékhibák kevéssé térnek el a kiinduló tisztatagvektor értékeitől:

(12.10)

Ha gamma értékét kicsinek választom (pl. γ = 0.00001), akkor a paraméterek javításai:

(12.11)

Aminek a hatására a korrigált magasságok:

magasság

magasság

I

101,710

101,707

II

100,370

100,373

III

 99,697

99,693

12.4. táblázat. A három metszéspontban az egyes szelvénypárokon azonosítható szintfelületek korrigált magasságai γ=0,00001 esetén.

Jól látszik, hogy a korrigált magasságok csak néhány milliméterrel térnek el egymástól, amit a feltételi egyenletekből számított reziduál is kifejez:

(12.12)

 A reziduálértékeket vizsgálva jól látszik, hogy a közel centiméteres hiba, ami nem feloldható ellentmondásként van jelen az adatokban, a három feltételi egyenlet között egyenletesen oszlik el.

 Ez a tapasztalat összhangban van tehát a feladat elején megfogalmazott elvárásainkkal, vagyis hogy találunk majd olyan megoldást, ahol a feltételi egyenletekkel kifejezett maradékhibák kicsik. Ez annak a következménye, hogy kis γ értéket választottunk, emiatt a reziduálokra vonatkozó feltételt nagy súllyal, a paraméterek normájára vonatkozó feltételt pedig kis súllyal vettük figyelembe.

Az itt bemutatott példánál az volt a feltételünk, hogy a modellparaméterek javításvektorának elemeiből képzett négyzetösszeg a minimális legyen, úgy, hogy a modellparaméterek kiinduló értékei nullák voltak.

A gyakorlatban előfordulnak olyan esetek, amikor azt a feltételt tesszük, hogy a modellparaméterek egy előzetesen megadott x(0) paramétervektortól való eltérése legyen minimális. Ilyen eset fordul elő multielektródás szelvények inverziójánál, ahol a a szelvényre merőlegesen elhelyezkedő, rögzített geometriájú  félvégtelen hasábok fajlagos ellenállásai a modellparaméterek. A modellparaméterek száma összemérhető a mérések számával, ezért az itt bemutatott regularizált megoldást alkalmazzák, úgy, hogy a hasábok vezetőképességének kiinduló értékéül a mért látszólagos fajlagos ellenállás értékeket választják.

 A regularizált megoldást nagy sikerrel alkalmazták szeizmikus tomográfiai problémák esetén. A tomográfiai problémák esetében a rugalmas hullámokkal átjárt térrész rácsfelbontásával nyert cellák szeizmikus sebessége a meghatározandó paraméterek együttese, a mérések pedig az ismert keltési és észlelési hely közötti futásidők. A korlátozott mérésszám miatt lehetséges, hogy vannak olyan cellák, amelyeken nem halad át hullám, így nem befolyásolják egyetlen hullám terjedési idejét sem. További probléma, hogy olyan mérési geometria is lehetséges, amelyben egy cellán áthaladó hullám mindig áthalad a mellette levő cellán is, így nincs lehetőség a két sebesség külön-külön meghatározására. A probléma kezelésére alkalmazott regularizált megoldás azokra a cellákra, amelyeken nem halad át hullám, a területre vonatkozó átlagos sebességet rendeli, a nem elkülöníthető cella párokhoz viszont az adott útszakaszhoz tartozó átlagos sebességet.