Il Coefficiente di Correlazione Lineare

Il Coefficiente di Correlazione Lineare (o Coefficiente di Correlazione di Pearson, indicato con $r$) è l’indice statistico primario utilizzato per quantificare l’intensità e la direzione di un legame di tipo lineare esistente tra due variabili quantitative $X$ e $Y$. Ci dice quanto bene i punti di un grafico a dispersione si dispongono lungo una linea retta.


Formule del Coefficiente di Correlazione

La formula definisce $r$ come il rapporto tra la Covarianza (la misura di quanto $X$ e $Y$ variano insieme) e il prodotto delle deviazioni standard di $X$ e $Y$, che normalizza il risultato nell’intervallo $[-1, 1]$.

Formula Standard (Con Scarti dalla Media)

La formula concettuale si basa sugli scarti dalla media:

$$\mathbf{r} = \frac{\sum_{i=1}^{n} (x_i – \bar{x})(y_i – \bar{y})}{\sqrt{\sum_{i=1}^{n} (x_i – \bar{x})^2 \sum_{i=1}^{n} (y_i – \bar{y})^2}}$$

Formula Alternativa (Di Calcolo)

Una formula algebricamente equivalente, spesso più comoda per i calcoli manuali, è la seguente:

$$\mathbf{r} = \frac{n \sum_{i=1}^{n} x_i y_i – (\sum_{i=1}^{n} x_i)(\sum_{i=1}^{n} y_i)}{\sqrt{\left[n \sum_{i=1}^{n} x_i^2 – \left(\sum_{i=1}^{n} x_i\right)^2\right] \left[n \sum_{i=1}^{n} y_i^2 – \left(\sum_{i=1}^{n} y_i\right)^2\right]}}$$


Proprietà e Interpretazione

Il coefficiente $r$ è sempre compreso tra $-1$ e $1$: $\mathbf{-1 \le r \le 1}$.

Valore di $r$InterpretazioneDirezione del Legame
$\mathbf{r = 1}$Correlazione Perfetta Positiva. Le variabili crescono insieme in modo perfettamente lineare.Crescente $\nearrow$
$\mathbf{0 < r < 1}$Correlazione Positiva Forte/Debole. Le variabili tendono a crescere insieme.Crescente $\nearrow$
$\mathbf{r = 0}$Assenza di Correlazione Lineare. Non c’è relazione lineare.Assente –
$\mathbf{-1 < r < 0}$Correlazione Negativa Forte/Debole. Una variabile cresce mentre l’altra diminuisce.Decrescente $\searrow$
$\mathbf{r = -1}$Correlazione Perfetta Negativa. Le variabili si muovono in direzioni opposte in modo perfettamente lineare.Decrescente $\searrow$

Esempio Numerico: Ore di Studio e Voto

Obiettivo: Calcolare $r$ tra Ore di Studio ($X$) e Voto all’Esame ($Y$) per $n=5$ studenti.

Studente$X_i$ (Ore)$Y_i$ (Voto)$\mathbf{X_i Y_i}$$\mathbf{X_i^2}$$\mathbf{Y_i^2}$
1218364324
24228816484
352512525625
472819649784
51030300100900
Somme$\mathbf{\sum X = 28}$$\mathbf{\sum Y = 123}$$\mathbf{\sum XY = 745}$$\mathbf{\sum X^2 = 194}$$\mathbf{\sum Y^2 = 3117}$

Applicazione della Formula Alternativa: ($n=5$)

$$\mathbf{r} = \frac{5 \cdot 745 – (28)(123)}{\sqrt{\left[5 \cdot 194 – (28)^2\right] \left[5 \cdot 3117 – (123)^2\right]}} \approx \mathbf{0,965}$$

Il risultato $\mathbf{r \approx 0,97}$ indica una correlazione positiva molto forte, suggerendo che le ore di studio e il voto all’esame sono quasi perfettamente allineate in questo campione.

IMPARA LA STATISTICA

Comincia un fantastico viaggio alla scoperta di questa affascinante materia partendo da zero.

Si comincia dalla statistica descrittiva, passando per le probabilità si arriva all’inferenza.

Comincia subito il tuo percorso e migliora le tue abilità.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *