La Scomposizione della Varianza (ANOVA)

La scomposizione della varianza è una tecnica statistica, nota anche come analisi della varianza (ANOVA) che permette di scomporre la variabilità totale di una variabile quantitativa $Y$ in due componenti: la variabilità dovuta alla differenziazione in gruppi (Varianza Tra) e la variabilità residua all’interno dei gruppi (Varianza Nei).

La relazione fondamentale per la scomposizione della varianza è:

$$\sigma^2_{\text{tot}} = \sigma^2_{\text{tra}} + \sigma^2_{\text{nei}}$$

Esempio Pratico: Dati da Tabella a Doppia Entrata

Si considerano $N=100$ unità statistiche classificate in base a un fattore qualitativo $X$ (4 modalità) e una variabile quantitativa $Y$ (3 modalità: 1, 2, 3). La tabella seguente mostra le frequenze assolute ($n_{ij}$).

Tabella 1: Frequenze Assolute (N=100)

| x1 | x2 | x3 | x4 | Totale Y (ni.)

y1=1 | 10 | 0 | 40 | 5 | 55
y2=2 | 0 | 30 | 0 | 0 | 30

y3=3 | 10 | 0 | 0 | 5 | 15

Totale X | 20 | 30 | 40 | 10 | N=100

1. Calcolo della Varianza Totale ($\sigma^2_{\text{tot}}$)

La varianza totale di $Y$ si calcola sull’intera distribuzione marginale di $Y$:
$$\sigma^2_{\text{tot}} = \frac{1}{N} \sum_{i=1}^{3} (y_i – \bar{y}{\text{tot}})^2 n{i \cdot}$$

A. Media Totale ($\bar{y}_{\text{tot}}$)

$$\bar{y}{\text{tot}} = \frac{1}{N} \sum{i=1}^{3} y_i n_{i \cdot} = \frac{(1 \cdot 55) + (2 \cdot 30) + (3 \cdot 15)}{100} = \frac{55 + 60 + 45}{100} = \frac{160}{100} = \mathbf{1.6}$$

B. Varianza Totale ($\sigma^2_{\text{tot}}$)

$$\sigma^2_{\text{tot}} = \frac{1}{100} \left[ (1 – 1.6)^2 \cdot 55 + (2 – 1.6)^2 \cdot 30 + (3 – 1.6)^2 \cdot 15 \right]$$
$$\sigma^2_{\text{tot}} = \frac{1}{100} \left[ (0.36 \cdot 55) + (0.16 \cdot 30) + (1.96 \cdot 15) \right]$$
$$\sigma^2_{\text{tot}} = \frac{1}{100} [ 19.8 + 4.8 + 29.4 ] = \frac{54}{100} = \mathbf{0.54}$$

2. Calcolo della Varianza Tra i Gruppi ($\sigma^2_{\text{tra}}$ – Between)

Questa componente è la varianza delle medie condizionate, ponderata con le frequenze marginali di $X$.
$$\sigma^2_{\text{tra}} = \frac{1}{N} \sum_{j=1}^{4} (\bar{y}j – \bar{y}{\text{tot}})^2 n_{\cdot j}$$

A. Medie Condizionate ($\bar{y}_j$)

GruppoFreq. (n.j)CalcoloMedia ($\bar{y}_j$)
$x_1$20$\frac{1 \cdot 10 + 3 \cdot 10}{20}$2.0
$x_2$30$\frac{2 \cdot 30}{30}$2.0
$x_3$40$\frac{1 \cdot 40}{40}$1.0
$x_4$10$\frac{1 \cdot 5 + 3 \cdot 5}{10}$2.0

B. Varianza Tra i Gruppi ($\sigma^2_{\text{tra}}$)

Questa componente è la varianza delle medie dei gruppi:

$$\sigma^2_{\text{tra}} = \frac{1}{100} \left[ (2.0 – 1.6)^2 \cdot 20 + (2.0 – 1.6)^2 \cdot 30 + (1.0 – 1.6)^2 \cdot 40 + (2.0 – 1.6)^2 \cdot 10 \right]$$
$$\sigma^2_{\text{tra}} = \frac{1}{100} \left[ (0.16 \cdot 20) + (0.16 \cdot 30) + (0.36 \cdot 40) + (0.16 \cdot 10) \right]$$
$$\sigma^2_{\text{tra}} = \frac{1}{100} [ 3.2 + 4.8 + 14.4 + 1.6 ] = \frac{24}{100} = \mathbf{0.24}$$

3. Calcolo della Varianza Nei Gruppi ($\sigma^2_{\text{nei}}$ – Within)

Questa componente è la media ponderata delle varianze interne ($\sigma^2_j$) di ciascun gruppo.
$$\sigma^2_{\text{nei}} = \sum_{j=1}^{4} \sigma^2_j \cdot f_{\cdot j} \quad \text{dove } \sigma^2_j = \frac{1}{n_{\cdot j}} \sum_{i=1}^{3} (y_i – \bar{y}j)^2 n{ij}$$

A. Varianze Condizionate ($\sigma^2_j$)

GruppoMedia ($\bar{y}_j$)CalcoloVarianza ($\sigma^2_j$)
$x_1$2.0$\frac{1}{20} [ (-1)^2 \cdot 10 + (1)^2 \cdot 10 ]$1.0
$x_2$2.0$\frac{1}{30} [ 0 ]$0
$x_3$1.0$\frac{1}{40} [ 0 ]$0
$x_4$2.0$\frac{1}{10} [ (-1)^2 \cdot 5 + (1)^2 \cdot 5 ]$1.0

B. Varianza Nei Gruppi ($\sigma^2_{\text{nei}}$)

$$\sigma^2_{\text{nei}} = \left( 1.0 \cdot \frac{20}{100} \right) + \left( 0 \cdot \frac{30}{100} \right) + \left( 0 \cdot \frac{40}{100} \right) + \left( 1.0 \cdot \frac{10}{100} \right)$$
$$\sigma^2_{\text{nei}} = 0.20 + 0 + 0 + 0.10 = \mathbf{0.30}$$

4. Conclusione

La scomposizione della varianza è verificata:
$$\sigma^2_{\text{tot}} = \sigma^2_{\text{tra}} + \sigma^2_{\text{nei}}$$
$$0.54 = 0.24 + 0.30$$

Tabella 2: Risultati della Scomposizione

ComponenteValore
Varianza Totale0.54
Varianza Tra i Gruppi0.24
Varianza Nei Gruppi0.30

Il 44.4\% (ottenuto da $0.24/0.54$) della variabilità totale di $Y$ è spiegato dalle differenze tra i gruppi definiti da $X$.

IMPARA LA STATISTICA

Comincia un fantastico viaggio alla scoperta di questa affascinante materia partendo da zero.

Si comincia dalla statistica descrittiva, passando per le probabilità si arriva all’inferenza.

Comincia subito il tuo percorso e migliora le tue abilità.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *