Formula koeficienta korelacije (vsebina)
- Formula
- Primeri
Kakšna je formula koeficienta korelacije?
V statistiki obstajajo določeni rezultati, ki so neposredno povezani z drugimi situacijami ali spremenljivkami, koeficient korelacije pa je merilo te neposredne povezave dveh spremenljivk ali situacij. Te spremenljivke imajo pozitiven koeficient korelacije, kadar se hkrati premikajo v isto smer. Podobno je, če se premikajo v drugo in nasprotno smer, so rekli, da imajo koeficient negativne korelacije. Na primer: Če se obrestna mera na trgu zniža, bodo posojila podjetjem cenejša in gospodarstvo se bo povečalo. Torej imata obrestna mera in rast gospodarstva pozitiven korelacijski koeficient. Vrednost korelacijskega koeficienta določa moč povezave med spremenljivkami. Najvišja vrednost korelacijskega koeficienta je bila od +1 do -1. Če je koeficient korelacije +1, potem so spremenljivke popolnoma pozitivno korelirane in če je ta vrednost -1, potem se imenuje popolnoma negativno korelirana.
Predpostavimo, da imamo 2 niza podatkov, ki jih podata X (X1, X2… Xn) in Y (Y1, Y2… Yn).
Formulo za korelacijski koeficient poda:
Correlation Coefficient = Σ ((X – X m ) * (Y – Y m )) / √ (Σ (X – X m ) 2 * Σ (Y – Y m ) 2 )
Kje:
- X - Podatkovne točke v podatkovnem nizu X
- Y - Podatkovne točke v podatkovnem nizu Y
- X m - povprečje nabora podatkov X
- Y m - povprečje podatkovnega niza Y
Ta formula je na začetku zelo zamudna in zmedena.
Obstaja še en način izračuna izračuna korelacijskega koeficienta z uporabo funkcije CORREL () v excelu. Obe formuli korelacijskega koeficienta bom razložil s primeri.
Primeri formule koeficienta korelacije (s predlogo Excel)
Vzemimo primer, da bolje razumemo izračun koeficienta korelacije.
Predlogo Excel predloge za formulo korelacijske korekcije prenesete tukaj - Predloga korelacijskega koeficienta Formula ExcelFormula koeficienta korelacije - Primer 1
Recimo, da imamo dva podatkovna niza X&Y in vsak vsebuje 20 naključnih podatkovnih točk. Izračunajte korelacijski koeficient za podatkovni niz X & Y.
Rešitev:
Srednja vrednost se izračuna kot:
- Srednja vrednost nabora podatkov X = 15.6
- Srednja vrednost nabora podatkov Y = 13.8
Zdaj moramo izračunati razliko med podatkovnimi točkami in srednjo vrednostjo.
Podobno izračunajte za vse vrednosti niza podatkov X.
Podobno izračunajte za vse vrednosti niza podatkov Y.
Izračunajte kvadrat razlike za oba niza podatkov X in Y.
Pomnožite razliko v X z Y.
Korelacijski koeficient se izračuna po spodnji formuli
Korelacijski koeficient = Σ ((X - X m ) * (Y - Y m )) / √ (Σ (X - X m ) 2 * Σ (Y - Y m ) 2 )
Korelacijski koeficient = 0, 343264
Torej pomeni, da imata oba nabora podatkov pozitivno korelacijo in je dana 0, 343264 .
Formula koeficienta korelacije - Primer # 2
Recimo, da želite vložiti denar na borzo in želite investirati v dve delnici in želite izbrati te delnice na način, da bo vaš portfelj raznolik. Pomeni, da če vam en prinese negativni donos, vam bodo drugi pomagali do pozitivnega donosa in obratno. Torej želite vložiti v delnice, ki imajo negativno korelacijo. Imate dve zalogi in dobili ste podatke o njihovih preteklih donosnosti v zadnjih 15 letih.
Rešitev:
Korelacijski koeficient se izračuna po formuli excel.
Korekcijski koeficient = -0, 45986
Tu smo uporabili funkcijo CORREL () excela, da vidimo koeficient korelacije za 2 zalogi. Vidite, da je korelacijska funkcija negativna vrednost, kar pomeni, da imata obe zalogi negativno korelacijo. Torej je vaša izbira primerna glede na vaše zahteve.
Pojasnilo
Vemo in razpravljamo, da je korelacijski koeficient merilo obsega razmerja med dvema spremenljivkama, toda ulov je, da lahko meri le razmerje, ki je linearno. To orodje ni učinkovito pri zajemu nelinearnih odnosov. Obstaja tudi nekaj drugih lastnosti koeficienta korelacije:
- Korelacijski koeficient je orodje brez enote. To je zelo uporabna lastnost, saj omogoča primerjavo podatkov z različnimi enotami. Na primer, cene delnic so odvisne od različnih parametrov, kot so inflacija, obrestne mere itd. Tako lahko uporabimo javne informacije za določitev korelacije med njimi.
- Kot smo razpravljali zgoraj, je njegova vrednost med + 1 do -1. Torej je +1 popolnoma pozitivno korelirano, -1 pa popolnoma negativno povezano.
Ustreznost in uporaba formule koeficienta korelacije
Korekcijski koeficient nam pomaga bolje razumeti nabore podatkov in njihovo razmerje ter ima veliko uporabnosti v financah in ekonomiji. Finančni inštituti, banke, podjetja in celo vlade uporabljajo koeficient korelacije, da bi izsledili pretekle podatke in črpali pomembne informacije ter na učinkovit način napovedovali tržne trge. Korelacijski koeficient je zelo zmogljivo orodje, vendar ga ne smemo uporabljati v silosu in uporabljati skupaj z drugimi orodji. Razlog za to je preprost: ne moremo se preprosto zanesti na podatke in podatki nam včasih dajo nesmiselne popolne informacije. Na primer: Če ste zbrali informacije in vedeli, da obstaja pozitivna povezava med dežjem in smrtjo psov. Pomeni, da je v letu, ko je bilo dežja več, umrlo več psov. Čeprav obstaja korelacija, ki sploh ni smiselna. Temu rečemo lažna korelacija. Zato bodite zelo previdni, medtem ko odločitve sprejemate le na podlagi podatkov.
Priporočeni članki
To je vodnik za formulo korelacijske koeficienta. Tukaj razpravljamo, kako izračunati korelacijski koeficient po formuli skupaj s praktičnimi primeri in naloženo predlogo Excela. Če želite izvedeti več, si oglejte tudi naslednje članke -
- Vodnik za koeficient formule določitve
- Formula za izračun prilagojenega R kvadrata
- Kako izračunati kovarijance s formulo?
- Primeri korelacijske formule s predlogo Excel