La scomposizione della varianza è una tecnica statistica, nota anche come analisi della varianza (ANOVA) che permette di scomporre la variabilità totale di una variabile quantitativa $Y$ in due componenti: la variabilità dovuta alla differenziazione in gruppi (Varianza Tra) e la variabilità residua all’interno dei gruppi (Varianza Nei).
La relazione fondamentale per la scomposizione della varianza è:
$$\sigma^2_{\text{tot}} = \sigma^2_{\text{tra}} + \sigma^2_{\text{nei}}$$
INDICE
- 1 Esempio Pratico: Dati da Tabella a Doppia Entrata
- 2 | x1 | x2 | x3 | x4 | Totale Y (ni.)
- 3 y3=3 | 10 | 0 | 0 | 5 | 15
- 4 1. Calcolo della Varianza Totale ($\sigma^2_{\text{tot}}$)
- 5 2. Calcolo della Varianza Tra i Gruppi ($\sigma^2_{\text{tra}}$ – Between)
- 6 3. Calcolo della Varianza Nei Gruppi ($\sigma^2_{\text{nei}}$ – Within)
- 7 4. Conclusione
- 8 IMPARA LA STATISTICA
Esempio Pratico: Dati da Tabella a Doppia Entrata
Si considerano $N=100$ unità statistiche classificate in base a un fattore qualitativo $X$ (4 modalità) e una variabile quantitativa $Y$ (3 modalità: 1, 2, 3). La tabella seguente mostra le frequenze assolute ($n_{ij}$).
Tabella 1: Frequenze Assolute (N=100)
| x1 | x2 | x3 | x4 | Totale Y (ni.)
y1=1 | 10 | 0 | 40 | 5 | 55
y2=2 | 0 | 30 | 0 | 0 | 30
y3=3 | 10 | 0 | 0 | 5 | 15
Totale X | 20 | 30 | 40 | 10 | N=100
1. Calcolo della Varianza Totale ($\sigma^2_{\text{tot}}$)
La varianza totale di $Y$ si calcola sull’intera distribuzione marginale di $Y$:
$$\sigma^2_{\text{tot}} = \frac{1}{N} \sum_{i=1}^{3} (y_i – \bar{y}{\text{tot}})^2 n{i \cdot}$$
A. Media Totale ($\bar{y}_{\text{tot}}$)
$$\bar{y}{\text{tot}} = \frac{1}{N} \sum{i=1}^{3} y_i n_{i \cdot} = \frac{(1 \cdot 55) + (2 \cdot 30) + (3 \cdot 15)}{100} = \frac{55 + 60 + 45}{100} = \frac{160}{100} = \mathbf{1.6}$$
B. Varianza Totale ($\sigma^2_{\text{tot}}$)
$$\sigma^2_{\text{tot}} = \frac{1}{100} \left[ (1 – 1.6)^2 \cdot 55 + (2 – 1.6)^2 \cdot 30 + (3 – 1.6)^2 \cdot 15 \right]$$
$$\sigma^2_{\text{tot}} = \frac{1}{100} \left[ (0.36 \cdot 55) + (0.16 \cdot 30) + (1.96 \cdot 15) \right]$$
$$\sigma^2_{\text{tot}} = \frac{1}{100} [ 19.8 + 4.8 + 29.4 ] = \frac{54}{100} = \mathbf{0.54}$$
2. Calcolo della Varianza Tra i Gruppi ($\sigma^2_{\text{tra}}$ – Between)
Questa componente è la varianza delle medie condizionate, ponderata con le frequenze marginali di $X$.
$$\sigma^2_{\text{tra}} = \frac{1}{N} \sum_{j=1}^{4} (\bar{y}j – \bar{y}{\text{tot}})^2 n_{\cdot j}$$
A. Medie Condizionate ($\bar{y}_j$)
| Gruppo | Freq. (n.j) | Calcolo | Media ($\bar{y}_j$) |
|---|---|---|---|
| $x_1$ | 20 | $\frac{1 \cdot 10 + 3 \cdot 10}{20}$ | 2.0 |
| $x_2$ | 30 | $\frac{2 \cdot 30}{30}$ | 2.0 |
| $x_3$ | 40 | $\frac{1 \cdot 40}{40}$ | 1.0 |
| $x_4$ | 10 | $\frac{1 \cdot 5 + 3 \cdot 5}{10}$ | 2.0 |
B. Varianza Tra i Gruppi ($\sigma^2_{\text{tra}}$)
Questa componente è la varianza delle medie dei gruppi:
$$\sigma^2_{\text{tra}} = \frac{1}{100} \left[ (2.0 – 1.6)^2 \cdot 20 + (2.0 – 1.6)^2 \cdot 30 + (1.0 – 1.6)^2 \cdot 40 + (2.0 – 1.6)^2 \cdot 10 \right]$$
$$\sigma^2_{\text{tra}} = \frac{1}{100} \left[ (0.16 \cdot 20) + (0.16 \cdot 30) + (0.36 \cdot 40) + (0.16 \cdot 10) \right]$$
$$\sigma^2_{\text{tra}} = \frac{1}{100} [ 3.2 + 4.8 + 14.4 + 1.6 ] = \frac{24}{100} = \mathbf{0.24}$$
3. Calcolo della Varianza Nei Gruppi ($\sigma^2_{\text{nei}}$ – Within)
Questa componente è la media ponderata delle varianze interne ($\sigma^2_j$) di ciascun gruppo.
$$\sigma^2_{\text{nei}} = \sum_{j=1}^{4} \sigma^2_j \cdot f_{\cdot j} \quad \text{dove } \sigma^2_j = \frac{1}{n_{\cdot j}} \sum_{i=1}^{3} (y_i – \bar{y}j)^2 n{ij}$$
A. Varianze Condizionate ($\sigma^2_j$)
| Gruppo | Media ($\bar{y}_j$) | Calcolo | Varianza ($\sigma^2_j$) |
|---|---|---|---|
| $x_1$ | 2.0 | $\frac{1}{20} [ (-1)^2 \cdot 10 + (1)^2 \cdot 10 ]$ | 1.0 |
| $x_2$ | 2.0 | $\frac{1}{30} [ 0 ]$ | 0 |
| $x_3$ | 1.0 | $\frac{1}{40} [ 0 ]$ | 0 |
| $x_4$ | 2.0 | $\frac{1}{10} [ (-1)^2 \cdot 5 + (1)^2 \cdot 5 ]$ | 1.0 |
B. Varianza Nei Gruppi ($\sigma^2_{\text{nei}}$)
$$\sigma^2_{\text{nei}} = \left( 1.0 \cdot \frac{20}{100} \right) + \left( 0 \cdot \frac{30}{100} \right) + \left( 0 \cdot \frac{40}{100} \right) + \left( 1.0 \cdot \frac{10}{100} \right)$$
$$\sigma^2_{\text{nei}} = 0.20 + 0 + 0 + 0.10 = \mathbf{0.30}$$
4. Conclusione
La scomposizione della varianza è verificata:
$$\sigma^2_{\text{tot}} = \sigma^2_{\text{tra}} + \sigma^2_{\text{nei}}$$
$$0.54 = 0.24 + 0.30$$
Tabella 2: Risultati della Scomposizione
| Componente | Valore |
|---|---|
| Varianza Totale | 0.54 |
| Varianza Tra i Gruppi | 0.24 |
| Varianza Nei Gruppi | 0.30 |
Il 44.4\% (ottenuto da $0.24/0.54$) della variabilità totale di $Y$ è spiegato dalle differenze tra i gruppi definiti da $X$.
IMPARA LA STATISTICA
Comincia un fantastico viaggio alla scoperta di questa affascinante materia partendo da zero.
Si comincia dalla statistica descrittiva, passando per le probabilità si arriva all’inferenza.
Comincia subito il tuo percorso e migliora le tue abilità.