Analisi della Varianza Multivariata (MANOVA):

L’Analisi della Varianza Multivariata (MANOVA) estende l’ANOVA per analizzare l’effetto di fattori categoriali (VI) su due o più Variabili Dipendenti (VD) continue e correlate simultaneamente. Controlla l’Errore di Tipo I e rileva gli effetti combinati.


1. La Teoria Matriciale della MANOVA

Il principio chiave è la scomposizione della Matrice di Somma dei Quadrati e Prodotti Incrociati (SSCP) Totale ($\mathbf{T}$).

$$\mathbf{T} = \mathbf{B} + \mathbf{W}$$

ComponenteSimboloCalcolo Matriciale
Varianza Totale$\mathbf{T}$$(\mathbf{Y} – \mathbf{J})^T (\mathbf{Y} – \mathbf{J})$
Varianza Tra i Gruppi$\mathbf{B}$$(\mathbf{M} – \mathbf{J})^T (\mathbf{M} – \mathbf{J})$
Varianza Entro i Gruppi$\mathbf{W}$$(\mathbf{Y} – \mathbf{M})^T (\mathbf{Y} – \mathbf{M}) = \mathbf{T} – \mathbf{B}$

Dove:

  • $\mathbf{Y}$: Matrice Dati ($N \times p$).
  • $\mathbf{M}$: Matrice Medie Gruppo ($N \times p$).
  • $\mathbf{J}$: Matrice Media Generale ($N \times p$).

Test Omnibus: Lambda di Wilks ($\Lambda$)

$$\Lambda = \frac{|\mathbf{W}|}{|\mathbf{T}|} = \frac{\det(\mathbf{W})}{\det(\mathbf{B} + \mathbf{W})}$$
Se $\Lambda$ è piccolo ($\Lambda \to 0$), si rifiuta l’Ipotesi Nulla ($H_0: \boldsymbol{\mu}_1 = \boldsymbol{\mu}_2 = \dots$).


2. Esempio Concreto: Test Farmacologico 💊

Per illustrare l’applicazione matriciale della MANOVA, consideriamo uno studio in cui un’azienda farmaceutica testa l’efficacia di diversi dosaggi di un farmaco. L’obiettivo è valutare come il trattamento influenzi un pacchetto di risultati correlati, non solo un singolo sintomo.

In questo esperimento, il Fattore (VI) è il Dosaggio del Farmaco ($k=3$ gruppi: Placebo, Basso, Alto). Si misurano due Variabili Dipendenti (VD) continue ($p=2$):

  1. $Y_1$ (Dolore): Punteggio di dolore residuo (scala $1-10$).
  2. $Y_2$ (Mobilità): Punteggio di funzionalità articolare (scala $1-10$).

La MANOVA valuta se i vettori medi congiunti $(\bar{Y}{1j}, \bar{Y}{2j})$ dei tre gruppi differiscono significativamente a causa del dosaggio.

Dati di Origine ($N=9$ soggetti)

La Matrice dei Dati di origine ($\mathbf{Y}$) è la base per tutti i successivi calcoli SSCP.

Osservazione$Y_1$ (Dolore)$Y_2$ (Mobilità)Gruppo$\bar{Y}_{1j}$$\bar{Y}_{2j}$
183G1 (Placebo)8,04,0
274
395
457G2 (Basso)5,07,0
566
648
739G3 (Alto)3,08,0
828
947
Media Generale ($\boldsymbol{\mu}_{\cdot}$)5,336,33

A. Matrici $N \times p$ Esplicite

Matrice dei Dati ($\mathbf{Y}$)

$$\mathbf{Y} = \begin{pmatrix} 8 & 3 \\ 7 & 4 \\ 9 & 5 \\ 5 & 7 \\ 6 & 6 \\ 4 & 8 \\ 3 & 9 \\ 2 & 8 \\ 4 & 7 \end{pmatrix}_{9 \times 2}$$

Matrice delle Medie di Gruppo ($\mathbf{M}$)

$$\mathbf{M} = \begin{pmatrix} 8 & 4 \\ 8 & 4 \\ 8 & 4 \\ 5 & 7 \\ 5 & 7 \\ 5 & 7 \\ 3 & 8 \\ 3 & 8 \\ 3 & 8 \end{pmatrix}_{9 \times 2}$$

Matrice Media Generale ($\mathbf{J}$)

$$\mathbf{J} = \begin{pmatrix} 5,33 & 6,33 \\ 5,33 & 6,33 \\ 5,33 & 6,33 \\ 5,33 & 6,33 \\ 5,33 & 6,33 \\ 5,33 & 6,33 \\ 5,33 & 6,33 \\ 5,33 & 6,33 \\ 5,33 & 6,33 \end{pmatrix}_{9 \times 2}$$

B. Calcolo delle Matrici SSCP ($2 \times 2$)

Matrice Entro i Gruppi ($\mathbf{W}$)

Rappresenta la variazione residua (Errore).
$$\mathbf{W} = (\mathbf{Y} – \mathbf{M})^T (\mathbf{Y} – \mathbf{M}) = \begin{pmatrix} \mathbf{6,0} & \mathbf{-2,0} \\ \mathbf{-2,0} & \mathbf{6,0} \end{pmatrix}$$

Matrice Tra i Gruppi ($\mathbf{B}$)

Rappresenta la variazione spiegata dal Dosaggio (Effetto).
$$\mathbf{B} = (\mathbf{M} – \mathbf{J})^T (\mathbf{M} – \mathbf{J}) = \begin{pmatrix} \mathbf{38,00} & \mathbf{-31,00} \\ \mathbf{-31,00} & \mathbf{26,00} \end{pmatrix}$$

Matrice Totale ($\mathbf{T}$)

$$\mathbf{T} = \mathbf{B} + \mathbf{W} = \begin{pmatrix} \mathbf{44,00} & \mathbf{-33,00} \\ \mathbf{-33,00} & \mathbf{32,00} \end{pmatrix} = (\mathbf{Y} – \mathbf{J})^T (\mathbf{Y} – \mathbf{J})$$

C. Risultato Finale: Test Omnibus 📊

La MANOVA testa l’Ipotesi Nulla confrontando la variazione residua (Errore) con la variazione totale attraverso la Lambda di Wilks ($\Lambda$).

1. Calcolo dei Determinanti

Per calcolare $\Lambda$, utilizziamo i determinanti delle matrici SSCP:

  • $\det(\mathbf{W}) = \mathbf{32,0}$
  • $\det(\mathbf{T}) = \mathbf{319,0}$ (Valore assunto per la verifica)

2. Lambda di Wilks ($\Lambda$) e Varianza Spiegata

$$\Lambda = \frac{\det(\mathbf{W})}{\det(\mathbf{T})} = \frac{32,0}{319,0} \approx \mathbf{0,1003}$$

Il valore di $\Lambda$ (che varia tra 0 e 1) rappresenta la proporzione di varianza multivariata non spiegata dal fattore (l’errore):

  • Varianza Non Spiegata (Errore): $\Lambda \approx 10,03\%$.

La proporzione di variazione imputabile al Dosaggio del Farmaco (Varianza Spiegata o $\eta^2$ multivariata) è data da $1 – \Lambda$:

$$\text{Varianza Spiegata} = 1 – 0,1003 \approx \mathbf{0,8997}$$

Circa l’89,97% della variazione congiunta nelle VD è spiegata dalle differenze tra i livelli del Dosaggio, indicando un effetto molto forte.


D. Interpretazione

D. Risultato Finale e Interpretazione 📊

Per la verifica statistica del test omnibus (Lambda di Wilks), i parametri dimensionali del nostro studio sono:

  • $p$ (Variabili Dipendenti): $\mathbf{2}$ ($Y_1$ Dolore, $Y_2$ Mobilità).
  • $k$ (Livelli del Fattore): $\mathbf{3}$ (Placebo, Basso, Alto).
  • $N$ (Osservazioni Totali): $\mathbf{9}$.

1. Lambda di Wilks ($\Lambda$)

Il valore di Lambda di Wilks, che misura il rapporto tra la varianza d’errore ($\mathbf{W}$) e la varianza totale ($\mathbf{T}$), è:

$$\Lambda = \frac{\det(\mathbf{W})}{\det(\mathbf{T})} = \frac{32,0}{319,0} \approx \mathbf{0,1003}$$


2. Conversione nella Statistica $F$

Per testare la significatività di $\Lambda$, si usa una conversione esatta nella statistica $F$. I gradi di libertà (g.d.l.) sono determinati dai parametri $p$, $k$ e $N$:

  • I g.d.l. ($v_1$ – Numeratore): Corrispondono all’effetto Tra i Gruppi.
    $$v_1 = p \cdot (k – 1) = 2(3-1) = \mathbf{4}$$
  • II g.d.l. ($v_2$ – Denominatore): Corrispondono all’effetto Entro i Gruppi (errore).
    $$v_2 = p \cdot (N – k – 1) = 2(9-3-1) = \mathbf{10}$$

La statistica è $F(4, 10)$. Applichiamo la formula di conversione per $p=2$:

$$F = \frac{1 – \sqrt{\Lambda}}{\sqrt{\Lambda}} \cdot \frac{N – k – 1}{k – 1}$$
$$F \approx \frac{1 – \sqrt{0,1003}}{\sqrt{0,1003}} \cdot \frac{9 – 3 – 1}{3 – 1} \approx 5,39$$

Il valore calcolato è $F(4, 10) \approx \mathbf{5,39}$.


3. Decisione e Conclusione

  • $p$-value: Per $F(4, 10) = 5,39$, il p-value è $\approx \mathbf{0,014}$.

Poiché il $p$-value ($\mathbf{0,014}$) è inferiore al livello di significatività standard ($\alpha=0,05$), si rifiuta l’Ipotesi Nulla ($H_0$).

Conclusione: Il Dosaggio del Farmaco ha un effetto congiunto statisticamente significativo sul vettore delle risposte (Dolore e Mobilità). Saranno necessarie l’Analisi Discriminante Canonica e analisi post-hoc per interpretare la natura esatta di questo effetto.

IMPARA LA STATISTICA

Comincia un fantastico viaggio alla scoperta di questa affascinante materia partendo da zero.

Si comincia dalla statistica descrittiva, passando per le probabilità si arriva all’inferenza.

Comincia subito il tuo percorso e migliora le tue abilità.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *