3.3. A valószínűségi változók jellemzői

Egy valószínűségi változó eloszlás vagy sűrűségfüggvénye pontosan jellemzi a változó viselkedését. Képezhetünk azonban olyan mennyiségeket, amelyek segítségével egyszerűbben és szemléletes módon jellemezhetünk egy valószínűségi változót.

A várható érték

Egy valószínűségi változó várható értéke egy skalár mennyiség, ami a ξ valószínűségi változó függvénye. A várható érték képzés jele: M(ξ)

Folytonos változó esetén:

(3.12)

Integrál adja meg az eloszlás várható értékét, diszkrét változó esetén, amikor a ξ változó az x1,x2,…,xn érékeket veheti fel, az egyes értékekhez p1, p2,…, pn valószínűségek rendelhetők, akkor a várható érték:

(3.13)

A medián

A medián az az érték, amelynél a valószínűségi változó 0,5 valószínűséggel vesz fel kisebb értéket. Egy valószínűségi változó mediánjára igaz, hogy

(3.14)

Ahol me a medián.

A szórás

A másik fontos mennyiség, amivel egy eloszlást jellemezhetünk a szórás és annak négyzete a variancia.

A szórásnégyzet definíció szerint a várható értéktől való eltérés négyzeteinek várható értéke, képlettel:

(3.15)

Ez kifejthető:

(3.16)

Vagyis a változók négyzeteinek várható értékéből kivonva a várható érték négyzetét. Ez a mennyiség mindig pozitív.

Momentumok és centrális momentumok

A ξ valószínűségi változó k-adik momentuma:

(3.17)

A k-adik centrális momentum:

(3.18)

A második centrális momentum a szórásnégyzet.

Két vagy több változó együttes eloszlását jellemző mennyiségek

Két valószínűségi változó, vagyis egy kételemű valószínűségi vektorváltozó várható értéke az egyes változó-elemek várható értéke:

(3.19)

Ahol a szögletes zárójel a vektorképzés jele.

A fenti képlet szerint, egy valószínűségi vektorváltozó esetén a elemek várható értékei a várható érték vektor elemei.

Valószínűségi vektorváltozókra a vektoriális felírást alkalmazva, írhatjuk, hogy:

(3.20)

Ahol a a várható érték vektor, f(x) az együttes sűrűségfüggvény.

A szórás (3.16) egyenletben szereplő definícióját általánosíthatjuk két változóra, vagy egy vektorváltozóra is, úgy hogy a várható értéktől való eltérés négyzetét a vektorváltozó két elemének a saját várható értéküktől való eltérésének szorzatával helyettesítjük:

(3.21)

a cij mennyiségek egy mátrix, a kovariancia-mátrix (C) elemei. A mátrix főátlójában az egyes változók szórásnégyzetei (varianciái) állnak.

 

(3.22)

A kovariancia-mátrix mindig szimmetrikus (cij = cji). A kovariancia-mátrix egy nem diagonális eleme (cij) a valószínűségi vektorváltozó vektor két elemének (ξi, ξj) az együttes varianciáját jellemzik. A mátrix valamelyik sora tehát az adott indexű változónak a többi változóhoz való viszonyát jellemzik.

A fenti képlet a vektoriális felírás alkalmazásával:

(3.23)

A kovariancia-mátrix egyes sorait osszuk végig az sor i indexével azonos indexű változó szórásértékeivel, -vel! A kapott mátrix oszlopait osszuk végig az adott oszlop j indexének megfelelő szórásértékkel, -vel :

(3.24)

Az így kapott mátrixelemek az ún. korrelációs mátrix (R) elemei. Ennek főátlójában – a definícióból könnyen levezethetően – 1-ek állnak, a nem-diagonális elemekre pedig érvényes hogy:

A korrelációs mátrix elemei azt fejezik ki, hogy két valószínűségi változó mennyire „korrelál”, vagyis mennyire erős kapcsolatban vannak egymással.

 A főátlóban szereplő 1 értékek azt fejezik ki, hogy egy mennyiség saját magával tökéletesen korrelál. A nem diagonális helyen levő, 1-hez közeli érték azt fejezi ki, hogy a két változó (amelynek indexeit a sor és az oszlop sorszáma adja meg) erősen korrelál, a -1 közeli érték erős negatív korrelációt jelent.

Ha két valószínűségi változó független, (vagyis egymásra vonatkozó feltételes valószínűségük 0) akkor a köztük levő korrelációs együttható értéke 0. (Fordítva azonban nem igaz, két változó 0 korrelációja nem jelenti a két változó függetlenségét.)