VARIANZA E VARIANZA PONDERATA – LA FORMULA SINTETICA

In questo articolo vediamo come si calcolano la varianza e la varianza ponderata.

VARIANZA – DEFINIZIONE E FORMULE

Per ottenere la varianza facciamo la media dei quadrati degli scarti dalla media.

Oppure possiamo fare differenza tra la media dei quadrati dei dati e il quadrato della media.

(Non diventate matti su queste definizioni poiché servono almeno tre esempi pratici per comprenderle)

La lettera solitamente utilizzata per indicare la varianza è il sigma greco (𝜎) elevato alla seconda

Le formule per il calcolo della varianza con i dati sfusi è:

$$ \text{var}(x) = \sigma ^2 _x = \frac{\sum (x_i- \bar{x})^2}{n} = \frac{\sum x_i^2}{n} – \bar{x}^2 $$

La prima espressione dopo il primo simbolo di uguale è quella relativa alla media dei quadrati degli scarti (dalla media).

Mentre nella seconda espressione di fa riferimento alla differenza tra la media dei quadrati e il quadrato della media

Mentre le formula per il calcolo della varianza ponderata (con i dati tabellari con le frequenze) è

$$ \text{var}(x) = \sigma ^2 _x = \frac{\sum (x_i- \bar{x})^2 \cdot n_i}{n} = \frac{\sum x_i^2 \cdot n_i}{n} – \bar{x}^2 $$

Presenteremo meglio nel dettaglio queste formule nei paragrafi successivi

VARIANZA CON I DATI SFUSI 

Supponiamo di intervistare 5 giovani chiedendo loro quante ore al giorno dedicano tra social e serie tv.

Nella tabella sotto sono riportate le loro risposte.

Vogliamo ora calcolare la varianza delle ore passate tra tv e social.

Per prima cosa ci troviamo la media del numero di ore.

Sommiamo i dati relativi alle ore e dividiamo per il numero totale di soggetti.

Per calcolare la media usiamo la seguente formula:

$$ \bar{x} = \frac{ \sum_{i=1}^n x_i}{n} = \frac{ \sum x_i}{n} $$

(la seconda formulazione è una semplificazione in quanto non viene detto che la somma delle xi va dal valore 1 al valore n del pedice i)

Andiamo quindi a sommare i quadrati dei dati dividendoli per il numero totale dei soggetti intervistati e sottrarre la media elevata alla seconda

FORMULA DELLA VARIANZA CON I DATI SFUSI

La formula per il calcolo della varianza è la seguente:

$$ \text{var}(x) = \sigma ^2 _x = \frac{\sum (x_i- \bar{x})^2}{n} = \frac{\sum x_i^2}{n} – \bar{x}^2 $$

$$ x_i = \text{i-esima unità considerata} $$

$$ n = \text{numero delle unità statistiche} $$

$$ \bar{x} = \text{media delle x} $$

CALCOLO DELLA MEDIA

Partendo dai dati sfusi

Applichiamo la formula della media:

$$ \bar{x} = \mu_x = E(x) = \frac{5+3+2+7+4}{5} = 4,2 $$

Per indicare la media possiamo usare la “mu greca”, la “x barrata” oppure la scrittura “E(x)” dove la E indica il valore atteso (expected in inglese)

Ora applichiamo la formula della varianza .

Nel primo calcolo vediamo la classica definizione di varianza: media dei quadrati degli scarti (dalla media):

$$ \text{var}(x) = \sigma ^2 _x = \frac{\sum (x_i- \bar{x})^2}{n} $$

$$ \sigma ^2 _x = \frac{(5-4,2)^2 + (3-4,2)^2 + (2-4,2)^2 + (7-4,2)^2 + (4-4,2)^2 }{5} = 2,96 $$

Vediamo quindi anche la seconda definizione: differenza tra la media dei quadrati e il quadrato della media

$$ \sigma ^2 _x = \frac{ 5^2 +3^2 +2^2 +7^2 +4^2 }{5} – 4,2^2 = 2,96 $$

$$ \sigma ^2 _x = \frac{\sum x_i^2}{n} – \bar{x}^2 $$

CALCOLI CON EXCEL

Con Excel il calcolo è molto semplice.

Dopo aver riportato i dati usiamo la formula:

$$ = \text{VAR.P ( intervallo dati ) } $$

Dove al posto di DATI  selezioniamo l’intervallo dei dati relativi alle ore.

MEDIA E VARIANZA PONDERATA

Quando gli stessi dati si ripetono più di una volta conviene riorganizzarli in una tabella di frequenza.

Quando calcoliamo la media e la varianza teniamo conto di queste ripetizioni ponderando il dato (modalità) ripetuto per la sua frequenza.

DAI DATI SFUSI AI DATI RIORGANIZZATI

Consideriamo la stessa indagine di prima fatta su una popolazione di 10 soggetti.

Riportiamo i risultati nella seguente tabella.

DATI RIORGANIZZATI NELLA TABELLA DI FREQUENZA

Come potete notare i numeri 2, 3, 4 e 5 si ripetono più di una volta.

Pertanto possiamo costruire una tabella dove nella prima colonna inseriamo le modalità assunte dal carattere (variabile) e nella seconda colonna la frequenza di queste modalità.

Questa tabella prende il nome di tabella di frequenza.

FORMULA DELLA VARIANZA PONDERATA

Le formule per il calcolo della varianza ponderata è la seguente:

$$ \text{var}(x) = \sigma ^2 _x = \frac{\sum (x_i- \bar{x})^2 \cdot n_i}{n} = \frac{\sum x_i^2 \cdot n_i}{n} – \bar{x}^2 $$

$$ x_i = \text{i-esima modalità di x} $$

$$ n_i =\text{ frequenza assoluta (numerosità) della i-esima modalità di x} $$

$$ n = \sum n_i \text{numero delle unità statistiche: è la somma degli ni} $$

$$ \bar{x} = \text{media delle x} $$

Da notare che in questo caso l’indice i identifica l’i-esima modalità del carattere x che possiamo assumere vada da 1 a k

Nel nostro caso pratico abbiamo 5 modalità per il valore della x (0,1,2,3,4,5), dunque k=5.

Quindi se dovessimo scrivere in forma più estesa la formula avremo che:

$$ \text{var}(x) = \sigma ^2 _x = \frac{\sum_\color{red}{i=1} ^\color{red}{k} (x_i- \bar{x})^2 \cdot n_i}{n} = \frac{\sum_\color{red}{i=1} ^\color{red}{k} x_i^2 \cdot n_i}{n} – \bar{x}^2 $$

Ma non volevo appesantire troppo la scrittura soprattutto per coloro che sono alle prime armi.

Si tratta della media ponderata dei quadrati meno il quadrato della media ponderata 

CALCOLO DELLA VARIANZA PONDERATA

Passiamo ora al calcolo pratico fedelmente alla tabella di frequenza che abbiamo costruito:

Per prima cosa calcoliamo la media ponderata:

$$ \bar{x} = \frac{ \sum x_i \cdot n_i}{n} $$

$$ \bar{x} = \frac{ 1 \cdot 1 + 2 \cdot 3 + 3 \cdot 2 + 4 \cdot 2 + 5 \cdot 2 }{10} = 3,1 $$

In secondo luogo calcoliamo la varianza con la prima formulazione: media (ponderata) dei quadrati degli scarti:

$$ \sigma ^2 _x = \frac{ (1 -3,1)^2 \cdot 1 + (2 -3,1)^2 \cdot 3 + (3 -3,1)^2 \cdot 2 + (4 -3,1)^2 \cdot 2 + (5 -3,1)^2 \cdot 2 }{10} = 1,69 $$

$$ \sigma ^2 _x = \frac{\sum (x_i- \bar{x})^2 \cdot n_i}{n} $$

La varianza della distribuzione è di 1,69 ore al quadrato.

Applichiamo ora la seconda definizione di varianza: è la media (ponderata) dei quadrati meno il quadrato della media:

$$ \sigma ^2 _x = \frac{\sum x_i^2 \cdot n_i}{n} – \bar{x}^2 $$

$$ \sigma ^2 _x = \frac{1^2 \cdot 1 + 2^2 \cdot 3 + 3^2 \cdot 2 + 4^2 \cdot 2 + 5^2 \cdot 2 }{10} – 3,1^2 = 1,69 $$

IMPARA I SEGRETI DELLA STATISTICA

Comincia il tuo percorso alla scoperta di un mondo affascinante !!!

PROCEDURA CON EXCEL

Dopo aver riportato i dati scriviamo in modo ordinato le modalità delle x sulla prima colonna

1) Troviamo le frequenze di ogni modalità con la funzione:

$$ = \text{ CONTA.SE ( <intervallo dati >; <modalità>} $$

Poi facciamo il copia e incolla nelle celle sotto

2) Calcoliamo il totale facendo:

$$ = \text{SOMMA (<dati>}

3) Ora calcoliamo la media con la funzione:

$$ = \frac{ \text{MATR.SOMMA.PRODOTTO (<modalità>; <frequenze>}}{ \text{numero totale} } $$

4) Infine troviamo la varianza:

$$ = \frac{ \text{MATR.SOMMA.PRODOTTO (<modalità> ; <modalità> ; <frequenze>}}{ \text{numero totale} } – {\text{ media}}^2$$

GUARDA IL VIDEO DI YOUTUBE SULLA VARIANZA E LA VARIANZA PONDERATA

DOMANDE SUGGERITE

La varianza è un dato sufficiente a descrivere la variabilità di una popolazione?

Se il dato iniziale fosse in metri la varianza si calcolerebbe in metri alla seconda. Esiste un modo per riportare i dati in metri?

Si potrebbe esprimere la variabilità percentualmente?

IMPARA LA STATISTICA

Comincia un fantastico viaggio alla scoperta di questa affascinante materia partendo da zero.

Un percorso che parte dalla statistica descrittiva, passando per le probabilità si arriva all’inferenza.

Comincia subito il tuo percorso e migliora le tue abilità.

scopri il canale Youtube

L’ARTICOLO TI è PIACIUTO ?

Se questo contenuto ti è piaciuto e vorresti che anche altri utenti possano goderne di questo ed altri ancora sostieni il progetto offrendomi un semplice caffè virtuale

Questo semplice gesto per me significa moltissimo e può essere un forte impulso per lo sviluppo di tutto il progetto di divulgazione matematica

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *