Coeficientul de determinare - Definiție, interpretare, calcul

Coeficientul de determinare (R² sau r-pătrat) este o măsură statistică într-un model de regresie care determină proporția de varianță în variabila dependentă care poate fi explicată de variabila independentă Variabilă independentă O variabilă independentă este o intrare, o presupunere sau un driver aceasta este modificată pentru a evalua impactul acesteia asupra unei variabile dependente (rezultatul). . Cu alte cuvinte, coeficientul de determinare ne arată cât de bine se potrivesc datele modelului (bunătatea potrivirii).

Coeficient de determinare

Deși coeficientul de determinare oferă câteva informații utile cu privire la modelul de regresie, nu ar trebui să ne bazăm doar pe măsură în evaluarea unui model statistic. Nu dezvăluie informații despre relația de cauzalitate între variabilele independente și dependente Variabila dependentă O variabilă dependentă este una care se va schimba în funcție de valoarea unei alte variabile, numită variabilă independentă. și nu indică corectitudinea modelului de regresie. Prin urmare, utilizatorul ar trebui să tragă întotdeauna concluzii despre model analizând coeficientul de determinare împreună cu alte variabile într-un model statistic.

Coeficientul de determinare poate lua orice valori cuprinse între 0 și 1. În plus, metrica statistică este frecvent exprimată în procente.

Interpretarea coeficientului de determinare (R²)

Cea mai comună interpretare a coeficientului de determinare este cât de bine se potrivește modelul de regresie cu datele observate. De exemplu, un coeficient de determinare de 60% arată că 60% din date se potrivesc modelului de regresie. În general, un coeficient mai mare indică o potrivire mai bună pentru model.

Cu toate acestea, nu întotdeauna este cazul ca un r-pătrat mare să fie bun pentru modelul de regresie. Calitatea coeficientului depinde de mai mulți factori, inclusiv unitățile de măsură ale variabilelor, natura variabilelor utilizate în model și transformarea datelor aplicate. Astfel, uneori, un coeficient ridicat poate indica probleme cu modelul de regresie.

Nicio regulă universală nu guvernează modul de încorporare a coeficientului de determinare în evaluarea unui model. Contextul în care se bazează prognoza sau experimentul este extrem de important și, în diferite scenarii, ideile din metrica statistică pot varia.

Calculul coeficientului

Matematic, coeficientul de determinare poate fi găsit folosind următoarea formulă:

Formulă

Unde:

  • Regresie SS - suma pătratelor datorate regresiei (suma explicată a pătratelor)
  • SS total - suma totală a pătratelor

Deși termenii „suma totală a pătratelor” și „suma pătratelor datorate regresiei” par confuze, semnificațiile variabilelor sunt directe.

Suma totală a pătratelor măsoară variația datelor observate (date utilizate în modelarea de regresie). Suma pătratelor datorate regresiei măsoară cât de bine reprezintă modelul de regresie datele care au fost utilizate pentru modelare.

Mai multe resurse

Finance este furnizorul oficial al analistului global de modelare și evaluare financiară (FMVA) ™ Certificare FMVA® Alăturați-vă peste 350.600 de studenți care lucrează pentru companii precum programul de certificare Amazon, JP Morgan și Ferrari, conceput pentru a ajuta pe oricine să devină un analist financiar de talie mondială . Pentru a continua să învățați și să vă avansați cariera, resursele financiare suplimentare de mai jos vor fi utile:

  • Concepte statistice de bază în finanțe Concepte statistice de bază pentru finanțe O înțelegere solidă a statisticilor este crucială pentru a ne ajuta să înțelegem mai bine finanțele. Mai mult, conceptele statistice pot ajuta investitorii să monitorizeze
  • Distribuția binomială Distribuția binomială Distribuția binomială este o distribuție comună de probabilitate care modelează probabilitatea de a obține unul dintre cele două rezultate într-un număr dat de parametri
  • Teorema limitei centrale Teorema limitei centrale Teorema limitei centrale afirmă că media eșantionului unei variabile aleatoare va presupune o distribuție aproape normală sau normală dacă dimensiunea eșantionului este mare
  • Analiza de regresie Analiza de regresie Analiza de regresie este un set de metode statistice utilizate pentru estimarea relațiilor dintre o variabilă dependentă și una sau mai multe variabile independente. Poate fi utilizat pentru a evalua puterea relației dintre variabile și pentru modelarea relației viitoare dintre ele.

Postări recente