L’Analisi della Varianza Multivariata (MANOVA) estende l’ANOVA per analizzare l’effetto di fattori categoriali (VI) su due o più Variabili Dipendenti (VD) continue e correlate simultaneamente. Controlla l’Errore di Tipo I e rileva gli effetti combinati.
INDICE
1. La Teoria Matriciale della MANOVA
Il principio chiave è la scomposizione della Matrice di Somma dei Quadrati e Prodotti Incrociati (SSCP) Totale ($\mathbf{T}$).
$$\mathbf{T} = \mathbf{B} + \mathbf{W}$$
| Componente | Simbolo | Calcolo Matriciale |
|---|---|---|
| Varianza Totale | $\mathbf{T}$ | $(\mathbf{Y} – \mathbf{J})^T (\mathbf{Y} – \mathbf{J})$ |
| Varianza Tra i Gruppi | $\mathbf{B}$ | $(\mathbf{M} – \mathbf{J})^T (\mathbf{M} – \mathbf{J})$ |
| Varianza Entro i Gruppi | $\mathbf{W}$ | $(\mathbf{Y} – \mathbf{M})^T (\mathbf{Y} – \mathbf{M}) = \mathbf{T} – \mathbf{B}$ |
Dove:
- $\mathbf{Y}$: Matrice Dati ($N \times p$).
- $\mathbf{M}$: Matrice Medie Gruppo ($N \times p$).
- $\mathbf{J}$: Matrice Media Generale ($N \times p$).
Test Omnibus: Lambda di Wilks ($\Lambda$)
$$\Lambda = \frac{|\mathbf{W}|}{|\mathbf{T}|} = \frac{\det(\mathbf{W})}{\det(\mathbf{B} + \mathbf{W})}$$
Se $\Lambda$ è piccolo ($\Lambda \to 0$), si rifiuta l’Ipotesi Nulla ($H_0: \boldsymbol{\mu}_1 = \boldsymbol{\mu}_2 = \dots$).
2. Esempio Concreto: Test Farmacologico 💊
Per illustrare l’applicazione matriciale della MANOVA, consideriamo uno studio in cui un’azienda farmaceutica testa l’efficacia di diversi dosaggi di un farmaco. L’obiettivo è valutare come il trattamento influenzi un pacchetto di risultati correlati, non solo un singolo sintomo.
In questo esperimento, il Fattore (VI) è il Dosaggio del Farmaco ($k=3$ gruppi: Placebo, Basso, Alto). Si misurano due Variabili Dipendenti (VD) continue ($p=2$):
- $Y_1$ (Dolore): Punteggio di dolore residuo (scala $1-10$).
- $Y_2$ (Mobilità): Punteggio di funzionalità articolare (scala $1-10$).
La MANOVA valuta se i vettori medi congiunti $(\bar{Y}{1j}, \bar{Y}{2j})$ dei tre gruppi differiscono significativamente a causa del dosaggio.
Dati di Origine ($N=9$ soggetti)
La Matrice dei Dati di origine ($\mathbf{Y}$) è la base per tutti i successivi calcoli SSCP.
| Osservazione | $Y_1$ (Dolore) | $Y_2$ (Mobilità) | Gruppo | $\bar{Y}_{1j}$ | $\bar{Y}_{2j}$ |
|---|---|---|---|---|---|
| 1 | 8 | 3 | G1 (Placebo) | 8,0 | 4,0 |
| 2 | 7 | 4 | |||
| 3 | 9 | 5 | |||
| 4 | 5 | 7 | G2 (Basso) | 5,0 | 7,0 |
| 5 | 6 | 6 | |||
| 6 | 4 | 8 | |||
| 7 | 3 | 9 | G3 (Alto) | 3,0 | 8,0 |
| 8 | 2 | 8 | |||
| 9 | 4 | 7 | |||
| Media Generale ($\boldsymbol{\mu}_{\cdot}$) | 5,33 | 6,33 |
A. Matrici $N \times p$ Esplicite
Matrice dei Dati ($\mathbf{Y}$)
$$\mathbf{Y} = \begin{pmatrix} 8 & 3 \\ 7 & 4 \\ 9 & 5 \\ 5 & 7 \\ 6 & 6 \\ 4 & 8 \\ 3 & 9 \\ 2 & 8 \\ 4 & 7 \end{pmatrix}_{9 \times 2}$$
Matrice delle Medie di Gruppo ($\mathbf{M}$)
$$\mathbf{M} = \begin{pmatrix} 8 & 4 \\ 8 & 4 \\ 8 & 4 \\ 5 & 7 \\ 5 & 7 \\ 5 & 7 \\ 3 & 8 \\ 3 & 8 \\ 3 & 8 \end{pmatrix}_{9 \times 2}$$
Matrice Media Generale ($\mathbf{J}$)
$$\mathbf{J} = \begin{pmatrix} 5,33 & 6,33 \\ 5,33 & 6,33 \\ 5,33 & 6,33 \\ 5,33 & 6,33 \\ 5,33 & 6,33 \\ 5,33 & 6,33 \\ 5,33 & 6,33 \\ 5,33 & 6,33 \\ 5,33 & 6,33 \end{pmatrix}_{9 \times 2}$$
B. Calcolo delle Matrici SSCP ($2 \times 2$)
Matrice Entro i Gruppi ($\mathbf{W}$)
Rappresenta la variazione residua (Errore).
$$\mathbf{W} = (\mathbf{Y} – \mathbf{M})^T (\mathbf{Y} – \mathbf{M}) = \begin{pmatrix} \mathbf{6,0} & \mathbf{-2,0} \\ \mathbf{-2,0} & \mathbf{6,0} \end{pmatrix}$$
Matrice Tra i Gruppi ($\mathbf{B}$)
Rappresenta la variazione spiegata dal Dosaggio (Effetto).
$$\mathbf{B} = (\mathbf{M} – \mathbf{J})^T (\mathbf{M} – \mathbf{J}) = \begin{pmatrix} \mathbf{38,00} & \mathbf{-31,00} \\ \mathbf{-31,00} & \mathbf{26,00} \end{pmatrix}$$
Matrice Totale ($\mathbf{T}$)
$$\mathbf{T} = \mathbf{B} + \mathbf{W} = \begin{pmatrix} \mathbf{44,00} & \mathbf{-33,00} \\ \mathbf{-33,00} & \mathbf{32,00} \end{pmatrix} = (\mathbf{Y} – \mathbf{J})^T (\mathbf{Y} – \mathbf{J})$$
C. Risultato Finale: Test Omnibus 📊
La MANOVA testa l’Ipotesi Nulla confrontando la variazione residua (Errore) con la variazione totale attraverso la Lambda di Wilks ($\Lambda$).
1. Calcolo dei Determinanti
Per calcolare $\Lambda$, utilizziamo i determinanti delle matrici SSCP:
- $\det(\mathbf{W}) = \mathbf{32,0}$
- $\det(\mathbf{T}) = \mathbf{319,0}$ (Valore assunto per la verifica)
2. Lambda di Wilks ($\Lambda$) e Varianza Spiegata
$$\Lambda = \frac{\det(\mathbf{W})}{\det(\mathbf{T})} = \frac{32,0}{319,0} \approx \mathbf{0,1003}$$
Il valore di $\Lambda$ (che varia tra 0 e 1) rappresenta la proporzione di varianza multivariata non spiegata dal fattore (l’errore):
- Varianza Non Spiegata (Errore): $\Lambda \approx 10,03\%$.
La proporzione di variazione imputabile al Dosaggio del Farmaco (Varianza Spiegata o $\eta^2$ multivariata) è data da $1 – \Lambda$:
$$\text{Varianza Spiegata} = 1 – 0,1003 \approx \mathbf{0,8997}$$
Circa l’89,97% della variazione congiunta nelle VD è spiegata dalle differenze tra i livelli del Dosaggio, indicando un effetto molto forte.
D. Interpretazione
D. Risultato Finale e Interpretazione 📊
Per la verifica statistica del test omnibus (Lambda di Wilks), i parametri dimensionali del nostro studio sono:
- $p$ (Variabili Dipendenti): $\mathbf{2}$ ($Y_1$ Dolore, $Y_2$ Mobilità).
- $k$ (Livelli del Fattore): $\mathbf{3}$ (Placebo, Basso, Alto).
- $N$ (Osservazioni Totali): $\mathbf{9}$.
1. Lambda di Wilks ($\Lambda$)
Il valore di Lambda di Wilks, che misura il rapporto tra la varianza d’errore ($\mathbf{W}$) e la varianza totale ($\mathbf{T}$), è:
$$\Lambda = \frac{\det(\mathbf{W})}{\det(\mathbf{T})} = \frac{32,0}{319,0} \approx \mathbf{0,1003}$$
2. Conversione nella Statistica $F$
Per testare la significatività di $\Lambda$, si usa una conversione esatta nella statistica $F$. I gradi di libertà (g.d.l.) sono determinati dai parametri $p$, $k$ e $N$:
- I g.d.l. ($v_1$ – Numeratore): Corrispondono all’effetto Tra i Gruppi.
$$v_1 = p \cdot (k – 1) = 2(3-1) = \mathbf{4}$$ - II g.d.l. ($v_2$ – Denominatore): Corrispondono all’effetto Entro i Gruppi (errore).
$$v_2 = p \cdot (N – k – 1) = 2(9-3-1) = \mathbf{10}$$
La statistica è $F(4, 10)$. Applichiamo la formula di conversione per $p=2$:
$$F = \frac{1 – \sqrt{\Lambda}}{\sqrt{\Lambda}} \cdot \frac{N – k – 1}{k – 1}$$
$$F \approx \frac{1 – \sqrt{0,1003}}{\sqrt{0,1003}} \cdot \frac{9 – 3 – 1}{3 – 1} \approx 5,39$$
Il valore calcolato è $F(4, 10) \approx \mathbf{5,39}$.
3. Decisione e Conclusione
- $p$-value: Per $F(4, 10) = 5,39$, il p-value è $\approx \mathbf{0,014}$.
Poiché il $p$-value ($\mathbf{0,014}$) è inferiore al livello di significatività standard ($\alpha=0,05$), si rifiuta l’Ipotesi Nulla ($H_0$).
Conclusione: Il Dosaggio del Farmaco ha un effetto congiunto statisticamente significativo sul vettore delle risposte (Dolore e Mobilità). Saranno necessarie l’Analisi Discriminante Canonica e analisi post-hoc per interpretare la natura esatta di questo effetto.
IMPARA LA STATISTICA
Comincia un fantastico viaggio alla scoperta di questa affascinante materia partendo da zero.
Si comincia dalla statistica descrittiva, passando per le probabilità si arriva all’inferenza.
Comincia subito il tuo percorso e migliora le tue abilità.