10. fejezet - Kényszerfeltételek alkalmazása

Tartalom

10.1. A feltételes szélsőérték keresés
10.2. Egyenes illesztése – lineáris kényszerfeltétel
10.3. Egyenes illesztése – nem lineáris kényszerfeltétel

Az inverzió során, amikor egy modell paramétereit határozzuk meg, lehetséges, hogy vannak előzetes – a priori – ismereteink a modellparaméterekről. Ezeket az előzetes ismereteket valamilyen matematika formában kell megfogalmaznunk.

Amennyiben ezek az előzetes ismeretek determinisztikusak, vagyis mindenképpen teljesülniük kell, ezeket összefoglalóan kényszerfeltételeknek nevezzük. Van olyan kényszerfeltétel, amit valamilyen egyenlőtlenség formájában tudunk megfogalmazni. Ilyen feltétel lehet, hogy egy paraméter csak egy bizonyos tartományba eső értéket vehet fel. Más esetben egy egyenlőség formájában tudjuk megadni, a függvénykapcsolatot, vagyis hogy a paraméterek valamilyen függvénye egy konkrét értéket vegyen fel.

Eszerint a kényszerfeltételek alkalmazása az inverzió során azt jelenti, hogy úgy szeretnénk a paramétereket meghatározni, hogy a kritériumfüggvényünk (a reziduálok négyzetösszege) minimális legyen, de közben az vagy több kényszerfeltételi egyenletünk is teljesüljön. Ez egy feltételes szélsőérték keresési probléma, amit Lagrange oldott meg a XIX század elején.

10.1. A feltételes szélsőérték keresés

Tekintsünk egy E függvényt, amely két változó (x és y) függvénye: E(x,y). (Egy kétváltozós skalárfüggvény egy felületként ábrázolható, ahol a függvény értéke egy z magasság az x-y sík felett.) Minimalizáljuk úgy az E függvényt, hogy közben az x és y változókra teljesül, a implicit alakban felírt kényszerfeltétel. A kényszerfeltételnek egy görbe felel meg az x-y síkon. Amennyiben ebből a kényszerfeltételből ki tudnánk fejezni akár y(x)-t akár x(y)-t, azt visszahelyettesíthetnénk az E függvénybe, és ezután egyetlen változó szerint kellene E minimumát meghatározni. Sajnos ezt az esetek többségében nem tudjuk megvalósítani, ezért az alább vázolt módszert kell követnünk.

10.1 ábra: Az E(x,y) kétváltozós függvény szintvonalai (kék szaggatott vonalak) és egy, a változók közötti, Φ(x,y)=0 kényszerfeltételnek eleget tevő pontok halmaza (piros görbe). Abban a pontban, ahol a függvény értéke a görbe mentén minimális, a függvény gradiense és a görbe normálisa párhuzamosak.

A 10.1 ábrán látszik, hogy az E függvény minimumánál a függvény gradiense nulla.

Az E függvény gradiense az alábbi vektor:

(10.1)

Látszik, hogy a gradiens merőleges az E függvény egyenlő értékeket felvevő szintvonalaira (ekvipotenciális görbéire).

Az ábrába berajzoltunk egy kényszerfeltételi egyenletnek megfelelő görbét. A görbe normálvektora a görbére az adott pontjában húzott érintőre merőleges vektor, amely a kényszerfeltételi egyenletnek a változók szerinti parciális deriváltjaiból képezhető:

(10.2)

Az ábrán látszik, a görbe azon pontja, ahol az E függvénynek minimuma van, ott az E függvény gradiense, és a görbe normálisa párhuzamosak. Ezt úgy fejezhetjük ki, hogy a 

(10.3)

 ahol λ egy skalár, arányossági tényező. Ezt elemenként kiírva, és nullára rendezve az alábbi két egyenletet kapjuk:

(10.4)

(10.5)

Ez a két egyenlet annak felel meg, mintha az

(10.6)

összegfüggvénynek keresnénk a minimumát, ugyanis ennek az összegfüggvénynek az adott pontban a változók szerint parciális deriváltja nullák, tehát ennek az összegfüggvénynek szélső értéke van.

A fenti két egyenlet mellé felhasználva a kényszerfeltételi egyenletet, összesen három egyenletünk van, és három ismeretlenünk (x,y,λ), amivel a probléma már megoldható.

A fenti eredményeket p=1,2,…,P változóból álló x paramétervektor, és r=1,2,…,R darab kényszerfeltétel esetére is általánosíthatjuk. Valamennyi p esetére teljesülnie kell az alábbi feltételnek:

(10.7)

Valamint valamennyi r esetére:

(10.8)

Ez összesen P+R számú meghatározandó ismeretlent jelent, P+R egyenletből.

A fenti eredményeket felhasználjuk a továbbiakban.

A fenti példában egy E skalárfüggvény szélsőértékét kerestük. A legkisebb négyzetek alkalmazásának bevezetőjében láttuk, hogy a minimalizálandó skalárfüggvény a reziduálok négyzetösszege. Ha tehát az E skalárfüggvényt megfeleltetjük a reziduálok négyzetösszegének és a kényszerfeltételeinket fel tudjuk írni (10.8) alakban, akkor ennek segítségével meg tudjuk oldani a kiegyenlítést kényszerfeltételek alkalmazása mellett.

A korábbi fejezetekben láttuk, hogy a reziduálokat (javításokat) fel tudjuk írni, mint a paraméterek lineáris függvényét (8.9 egyenlet).

Szükségünk van még a kényszerfeltételi egyenletek átalakítására, hogy azok is a paraméterek lineáris függvényei legyenek. Láttuk, hogy r=1,2,…,R darab kényszerfeltételi egyenletünk van. Minden egyenlet az alábbi alakú:

(10.9)

A paramétervektor az alábbi alakú:

(10.10)

Amennyiben a fenti egyenlet az x paramétervektor lineáris függvénye, az r-edik lineáris kényszerfeltétel az alábbi alakba írható:

(10.11)

Ahol a cr1,cr2,…, crP együtthatók az x paramétervektor szorzói, a wr mennyiség pedig a konstans tag.

Az R darab lineáris kényszerfeltételt az alábbi mátrix-vektor formába is átírhatjuk:

(10.12)

Ezzel a kényszerfeltételi egyenletet

(10.13)

alakban sikerült felírnunk.

A nemlineáris kényszerfeltételek esetében, csakúgy, mint a nemlineáris direktfeladat esetén, fel kell vegyünk a paramétereknek előzetes értéket x0-t, és az x vektor ezeknek az előzetes paramétereknek a javítása.

A kényszerfeltételek linearizálásakor tehát abból indulunk ki, hogy az x vektor a paraméterek kiinduló értékeiből képzett x(0) kezdeti paramétervektorhoz hozzáadandó javítás. Ekkor a kényszerfeltételi egyenletet x(0) körül, x szerint sorbafejtve, és a sorfejtést csak a lineáris tagig meghagyva kapjuk:

(10.14)

A fenti mennyiség a kényszerfeltétel definíciójából adódóan nulla. Az (10.14) egyenletet nullára rendezve, és a lineáris esetnél tárgyalt (10.12) mátrix-vektor formára hozva, kapjuk az alábbi alakot:

(10.15)

A fenti (10.15) és a lineáris esetben kapott (10.12) alakok összehasonlításából látszik, hogy:

(10.16)

Visszatérve az összegfüggvényhez, most már a minimalizálandó függvényt felírhatjuk a linearizált javítási- és a feltételi egyenletek segítségével:

(10.17)

A minimalizálandó függvényben itt a λ helyett – célszerűségi okokból – a tag szerepel. A k vektort korreláta-vektornak nevezzük.

A függvénynek ott lesz szélsőértéke, ahol a teljes differenciál nulla lesz. A teljes differenciál alakja a következő:

(10.18)

Felhasználva a linearizált javítási egyenletet:

(10.19)

Kapjuk, hogy

(10.20)

Amit visszaírva a teljes differenciálba, a következő parciális deriváltakhoz jutunk:

(10.21 -10.22)

A fenti egyenletbe visszaírva a (10.19) javítási egyenletet, kapjuk:

(10.23 -10.24)

A fenti két egyenlet hipermátrix formában is felírható:

(10.25)

Ez a feladat megoldásához szükséges normálegyenlet. Amennyiben a normálegyenlet együtthatómátrixa nem szinguláris (invertálható), a fenti egyenletből kifejezhetjük a paraméterek és a korreláták vektorát:

(10.26)

A feltételes szélsőértékkeresési feladat megoldására itt kapott eredményeket nem csak a kényszerfeltételek, hanem a csak mért mennyiségeket tartalmazó kiegyenlítési feladatban is felhasználjuk.