8.3. Trendelemzés, regresszió

A trendelemzés során azt vizsgáljuk, hogy a mintaelemek idősorában felfedezhető-e valamilyen szabályszerűség. Leggyakrabban lineáris trendet, tehát egy lineáris függvénykapcsolatot keresünk. Ehhez az y=ax+b alakú lineáris regressziós összefüggést kell felállítanunk. A lineáris regressziós egyenes meghatározásánál egy optimalizációs feladatot hajtunk végre, azaz megkeressük azt az egyenest, amelyet a mintaelemekre a legkisebb négyzetes hibával tudunk illeszteni. A lineáris regressziós egyenes egyenletében szereplő a együtthatót nevezzük lineáris trendegyütthatónak. Ha a kapott egyenes nem párhuzamos az x-tengellyel, azaz az a együttható nem egyenlő nullával, akkor növekvő (a>0), illetve csökkenő (a<0) trendről beszélünk. A trendegyütthatóra vonatkozóan minden esetben meg kell vizsgálni, hogy 0-tól szignifikánsan eltérő-e. Ehhez a kapott trendegyütthatót a mintaelemek standard hibájával kell leosztani, mely a t-próba elvégzéséhez szükséges A próbastatisztika értékét adja meg az alábbi képlet szerint:

.

(8.4)

Az elemzés során az A próbastatisztika értékét hasonlítjuk össze az N–2 (N a mintaelem-szám) szabadsági fokú t-eloszlás kritikus értékével 0,95 valószínűség esetére (ez a valószínűség adja meg a szignifikancia szintet), melyet a 8.1. táblázatban adunk közre. Ha az A-ra kapott érték abszolút értékben meghaladja a t-eloszlás kritikus értékét, akkor a kapott lineáris trendegyüttható szignifikánsan eltér 0-tól.

8.1. táblázat. A t-eloszlás értékei különböző szabadsági fokokra, 0,95 valószínűség esetére

Szabadsági fok

Az eloszlásfüggvény értéke

1

12,706

2

4,303

3

3,182

4

2,776

5

2,571

6

2,447

7

2,365

8

2,306

9

2,263

10

2,228

11

2,201

12

2,179

13

2,160

14

2,145

15

2,131

16

2,120

17

2,110

18

2,101

19

2,093

20

2,089

40

2,021

60

2,000

80

1,990

100

1,984

120

1,980

Példaként a budapesti hőmérsékleti mérések alapján számított fagyos napok (amikor Tmin < 0 °C) évi számának trendelemzését mutatjuk be a 8.2. ábrán. Az idősorra három különböző hosszúságú időintervallumra illesztettünk lineáris trendet: 1901–2000, 1951–2000 és 1975–2000 időszakokra. A kapott trendegyütthatók értéke, vagyis az illesztett lineáris regressziós egyenesek meredeksége rendre –0,13 nap/év, –0,24 nap/év, illetve –0,15 nap/év. Mindhárom időszakban csökkenő trendet detektálhatunk. Habár a teljes évszázadra vonatkozó trendegyüttható értéke abszolút értékben a legkisebb, mégis ez az egyetlen, amely az elvégzett t-próba alapján 95%-os szinten szignifikánsan eltér nullától. A számítások során a vizsgálandó próbastatisztikák értéke rendre –2,2-nek, –1,4-nek, illetve –0,3-nak adódott. A t-eloszlás kritikus értéke 100–2=98 szabadsági fok esetén 1,984, 50–2=48 szabadsági fok esetén 2,011, s 26–2=24 szabadsági fok esetén 2,064. Az összehasonlítandó értékpárok ezek szerint rendre: 2,2>1,984, 1,4<2,011, illetve 0,3<2,064. Ebből jól látszik, hogy csupán az első esetben – vagyis a teljes 1901–2000 időszakra vonatkozóan – teljesül a számított próbastatisztika kritikus értéket meghaladási követelménye, melynek oka a mintaelemek relatíve kisebb arányú szóródása. A példából is kitűnik, hogy a trendegyüttható megadása önmagában nem elegendő a lineáris trend jellemzésére, a t-próba eredményét is figyelembe kell vennünk.

Lineáris trendelemzés Budapestre. A fagyos napok számának alakulása 1901-2000 időszakban. Az illesztett trend a teljes 100 évre, az utolsó 50 évre és az utolsó 26 évre.

8.2. ábra. Lineáris trendelemzés Budapestre. A fagyos napok számának alakulása 1901-2000 időszakban. (Adatok forrása: www.met.hu)