niedziela, 11 listopada 2012

Metody probabilistyczne i statyczne prof. Ihor Ohirko 05.11.2012



Zależność statystyczna zmiennych losowych (korelacja) – związek pomiędzy dwiema zmiennymi losowymi X i Y.

Intuicyjnie, zależność dwóch zmiennych oznacza, że znając wartość jednej z nich, dałoby się przynajmniej w niektórych sytuacjach dokładniej przewidzieć wartość drugiej zmiennej, niż bez tej informacji.

Mogą być trzy przypadki:
1. Między cechami występuje korelacja dodatnia.
2. Między cechami występuje korelacja ujemna.
3. Między cechami nie wystepuje korelacja.
Co to znaczy, że między cechami występuje korelacja dodatnia?
Weźmy przykład z zarobkami i wydatkami na lody. Im więcej zarabiam tym więcej mogę wydać na lody. Im mniej zarabiam tym mniej mogę wydać na lody. Zmiany wartości obu cech następują w tym samym kierunku. Albo obie rosną (zarobki i ilość kupowanych lodów rośnie) albo obie maleją (zarobki i ilość kupowanych lodów maleje).
Korelacja dodatnia oznacza, że wartości obu cech zmieniają się w tym samym kierunku (obie rosną bądź obie maleją).
Co to znaczy, że między cechami występuje korelacja ujemna?
Jeśli cena lodów rośnie kupuję ich mniej (jakby pudełko lodów kosztowało 1000zł w ogóle bym ich nie kupował).
Gdy cena lodów spada kupuję ich więcej (gdyby pudełko lodów kosztowało 1zł, codziennie na śniadanie jadłbym jedno - ze stratą dla mojej sylwetki no ale coś za coś…).
Zmiany wartości obu cech następują w przeciwnych kierunkach. Gdy wartości jednej cechy rosną (rośnie cena lodów), wartości drugiej cechy maleją (kupuję mniej lodów). I na odwrót. Gdy wartości jednej cechy maleją (maleje cena lodów), wartości drugiej cechy rosną (kupuję więcej lodów).
Korelacja ujemna oznacza, że wartości obu cech zmieniają się w przeciwnym kierunku (gdy jedna rośnie, druga maleje).
Co to znaczy, że między cechami nie występuje korelacja?
Czy pomiędzy moimi zarobkami a liczbą bocianów na łące istnieje jakiś związek?
Nie, nie ma związku. Moje zarobki nie wpływają na liczbę bocianów (no chyba, że bym je dokarmiał kupując żaby)  ani liczba bocianów nie wpływa na moje zarobki! Między tymi cechami nie ma związku - czyli nie ma korelacji!
W jaki sposób obliczyć korelację?
To, że między zarobkami a wydatkami na lody istnieje korelacja jest tylko przypuszczeniem (graniczącym z pewnością ale wciąż przypuszczeniem). Aby być tego pewnym musimy to… policzyć!
Jest wiele miar służących do wyliczania korelacji między badanymi cechami. Najpopularniejszymi z nich są:

1.Współczynnikkorelacji liniowej Pearsona.
2.Współczynnik korelacji rang Spearmana.


 

 

3. Współczynnik zbieżności Czuprowa.



Miernik ten oparty jest na teście chi – kwadrat (c2). Wielkość c2 jest podstawą do określenia unormowanej funkcji zależności cech zwanej współczynnikiem zbieżności Czuprowa. Określa go wzór:



Współczynnik ten przyjmuje wartość z przedziału , gdy                   badane zmienne są stochastycznie niezależne. Przy zależności funkcyjnej zmiennych, T = 0.

Im bardziej współczynnik zbieżności jest bliższy zeru, tym słabsza jest zależność między zmiennymi.

Przy wyznaczaniu współczynnika zbieżności nie jest ważne, którą z cech traktuje się jako zależną a którą jako niezależną – co jest istotne przy badaniu zależności w sensie korelacyjnym. Własność tę określa się mianem symetryczności:



Zaletą współczynnika zbieżności jest to, że może być stosowany do mierzenia współzależności zarówno cech mierzalnych jak i niemierzalnych. Jego wadą jest natomiast to, że nie wskazuje kierunku korelacji (jest zawsze dodatni).

Do oceny natężenia korelacji między zmiennymi X i Y wykorzystuje się również współczynnik determinacji.



Miara ta wskazuje, w ilu procentach zmienność zmiennej zależnej jest określona zmiennością zmiennej niezależnej. Tak więc o ile z rachunkowego punktu widzenia T ocenia zarówno zależność cechy X od cechy Y jak i cechy Y od X , o tyle interpretacja współczynnika zbieżności musi jednoznacznie określać charakter zmiennych, tzn. która z nich jest zmienną zależną, a która niezależną.

Z uwagi na to, że przy obliczaniu współczynnika zbieżności brane są pod uwagę jedynie liczebności odpowiednich rozkładów, a nie ich parametry, współczynnik zależności jest przede wszystkim miarą zależności stochastycznej dwóch zmiennych. Ponieważ zależność korelacyjna jest pojęciem węższym od zależności stochastycznej można go wykorzystać jako miarę siły związku korelacyjnego.

Źródła:
WWW.wikipedia.org
http://stata.aula.pl/co-to-jest-korelacja

Brak komentarzy:

Prześlij komentarz