Il Coefficiente di Correlazione Lineare (o Coefficiente di Correlazione di Pearson, indicato con $r$) è l’indice statistico primario utilizzato per quantificare l’intensità e la direzione di un legame di tipo lineare esistente tra due variabili quantitative $X$ e $Y$. Ci dice quanto bene i punti di un grafico a dispersione si dispongono lungo una linea retta.
INDICE
Formule del Coefficiente di Correlazione
La formula definisce $r$ come il rapporto tra la Covarianza (la misura di quanto $X$ e $Y$ variano insieme) e il prodotto delle deviazioni standard di $X$ e $Y$, che normalizza il risultato nell’intervallo $[-1, 1]$.
Formula Standard (Con Scarti dalla Media)
La formula concettuale si basa sugli scarti dalla media:
$$\mathbf{r} = \frac{\sum_{i=1}^{n} (x_i – \bar{x})(y_i – \bar{y})}{\sqrt{\sum_{i=1}^{n} (x_i – \bar{x})^2 \sum_{i=1}^{n} (y_i – \bar{y})^2}}$$
Formula Alternativa (Di Calcolo)
Una formula algebricamente equivalente, spesso più comoda per i calcoli manuali, è la seguente:
$$\mathbf{r} = \frac{n \sum_{i=1}^{n} x_i y_i – (\sum_{i=1}^{n} x_i)(\sum_{i=1}^{n} y_i)}{\sqrt{\left[n \sum_{i=1}^{n} x_i^2 – \left(\sum_{i=1}^{n} x_i\right)^2\right] \left[n \sum_{i=1}^{n} y_i^2 – \left(\sum_{i=1}^{n} y_i\right)^2\right]}}$$
Proprietà e Interpretazione
Il coefficiente $r$ è sempre compreso tra $-1$ e $1$: $\mathbf{-1 \le r \le 1}$.
| Valore di $r$ | Interpretazione | Direzione del Legame |
|---|---|---|
| $\mathbf{r = 1}$ | Correlazione Perfetta Positiva. Le variabili crescono insieme in modo perfettamente lineare. | Crescente $\nearrow$ |
| $\mathbf{0 < r < 1}$ | Correlazione Positiva Forte/Debole. Le variabili tendono a crescere insieme. | Crescente $\nearrow$ |
| $\mathbf{r = 0}$ | Assenza di Correlazione Lineare. Non c’è relazione lineare. | Assente – |
| $\mathbf{-1 < r < 0}$ | Correlazione Negativa Forte/Debole. Una variabile cresce mentre l’altra diminuisce. | Decrescente $\searrow$ |
| $\mathbf{r = -1}$ | Correlazione Perfetta Negativa. Le variabili si muovono in direzioni opposte in modo perfettamente lineare. | Decrescente $\searrow$ |
Esempio Numerico: Ore di Studio e Voto
Obiettivo: Calcolare $r$ tra Ore di Studio ($X$) e Voto all’Esame ($Y$) per $n=5$ studenti.
| Studente | $X_i$ (Ore) | $Y_i$ (Voto) | $\mathbf{X_i Y_i}$ | $\mathbf{X_i^2}$ | $\mathbf{Y_i^2}$ |
|---|---|---|---|---|---|
| 1 | 2 | 18 | 36 | 4 | 324 |
| 2 | 4 | 22 | 88 | 16 | 484 |
| 3 | 5 | 25 | 125 | 25 | 625 |
| 4 | 7 | 28 | 196 | 49 | 784 |
| 5 | 10 | 30 | 300 | 100 | 900 |
| Somme | $\mathbf{\sum X = 28}$ | $\mathbf{\sum Y = 123}$ | $\mathbf{\sum XY = 745}$ | $\mathbf{\sum X^2 = 194}$ | $\mathbf{\sum Y^2 = 3117}$ |

Applicazione della Formula Alternativa: ($n=5$)
$$\mathbf{r} = \frac{5 \cdot 745 – (28)(123)}{\sqrt{\left[5 \cdot 194 – (28)^2\right] \left[5 \cdot 3117 – (123)^2\right]}} \approx \mathbf{0,965}$$
Il risultato $\mathbf{r \approx 0,97}$ indica una correlazione positiva molto forte, suggerendo che le ore di studio e il voto all’esame sono quasi perfettamente allineate in questo campione.
IMPARA LA STATISTICA
Comincia un fantastico viaggio alla scoperta di questa affascinante materia partendo da zero.
Si comincia dalla statistica descrittiva, passando per le probabilità si arriva all’inferenza.
Comincia subito il tuo percorso e migliora le tue abilità.