
CALCOLO DELLA MEDIA ARITMETICA
Per ottenere la media aritmetica sommiamo tutti i dati di una certa distribuzione e dividiamo per la numerosità degli stessi.
DATI SFUSI
Supponiamo di intervistare 5 giovani chiedendo loro quante ore al giorno dedicano tra social e serie tv.
Nella tabella sotto sono riportate le loro risposte.

FORMULA
Vogliamo ora calcolare il numero medio di ore passate tra tv e social.
Andiamo quindi a sommare i dati dividendoli per il numero totale dei soggetti intervistati.
La formula per il calcolo della media è la seguente:



La media è la sommatoria degli xi con la i che va da 1 a n divisa per n, dove n è il numero totale dei dati.
Come potete notare ho dato quattro diverse rappresentazioni della media.
Il primo modo di identificare la media è mediante il simbolo greco µ “mu”, che sarebbe la nostra lettere m nell’alfabeto greco.
Per essere più precisi possiamo usare il simbolo µ con un pedice x.
Questa scrittura ad esempio risulta comoda quando abbiamo più variabili come x, y e z.
Il terzo modo è la x con il trattino sopra.
Un quarto modo è la scrittura E(x) che in inglese sta per “expected value of x“, ovvero valore atteso della x, che nel contesto delle probabilità sta appunto per media.
Nei calcoli usiamo solamente una di queste.
CALCOLI

Applichiamo ora la formula sopra e otteniamo:

CALCOLI CON EXCEL
Se vogliamo calcolare con Excel la media dopo aver riportato i dati, basta che usiamo la formula:

CALCOLI CON EXCEL
Se vogliamo calcolare con Excel la media dopo aver riportato i dati, basta che usiamo la formula:

MEDIA PONDERATA
Quando gli stessi dati si ripetono più di una volta conviene riorganizzarli in una tabella di frequenza.
Quando calcoliamo la media teniamo conto di queste ripetizioni ponderando il dato (modalità) ripetuto per la sua frequenza.
DAI DATI SFUSI AI DATI RIORGANIZZATI
Consideriamo la stessa indagine di prima fatta su una popolazione di 10 soggetti.
Riportiamo i risultati nella seguente tabella.

DATI RIORGANIZZATI NELLA TABELLA DI FREQUENZA
Come potete notare i numeri 2, 3, 4 e 5 si ripetono più di una volta.
Pertanto possiamo costruire una tabella dove nella prima colonna inseriamo le modalità assunte dal carattere (variabile) e nella seconda colonna la frequenza di queste modalità.
Questa tabella prende il nome di tabella di frequenza.

FORMULA DELLA MEDIA PONDERATA
Per calcolare la media ponderata della nostra distribuzione di dati andiamo a sommare i valori delle modalità ponderandoli per la frequenza, dividendo il tutto per la frequenza (numerosità) totale.





CALCOLO DELLA MEDIA PONDERATA

Passando al calcolo della media ponderata avremo che:

Mediamente il gruppo intervistato passa 3,1 ore davanti ai social e serie tv/intrattenimento.
- Per riorganizzare i dati scrivi sotto la x le modalità 1, 2, 3, 4 e 5.Nella colonna delle frequenza fai la formula:

2. Metti il totale dei dati con la funzione

3. Calcola la media con la funzione

dividendola per il totale dei dati n.

HAI QUALCHE DOMANDA SULLA MEDIA O SULLA MEDIA PONDERATA?
Se hai qualche domanda scrivila sotto nei commenti.
Molti utenti potrebbero avere domande simili alle tue.
In questo modo potrai aiutare questi utenti a risolvere i loro dubbi.
Se vuoi approfondire dai un’occhiata ai corsi di statistica.
Acquistando il corso darai una spinta più forte a questo progetto.
Visita anche il canale YouTube con tanti video e Playlist intere dedicate alla statistica.
Ciao Andrea, ho questo quesito da proporti.
Ho una variabile X che si presenta con modalità:
2,3,4,5,6
Di frequenze cumulate pari a
3, 4, 6, 8, 10
L’esercizio mi chiede di calcolare la media e la varianza della distribuzione.
Ho applicato la formula della media e della varianza ponderate.
Per la media ho fatto il seguente calcolo:
Media = (2*3+3*4+4*6+5*8+6*10)/(3+4+6+8+10)=4,58
Successivamente ho calcolato la varianza con la formula:
Varianza = (2^2*3+3^2*4+4^2*6+5^2*8+6^2*10)/(3+4+6+8+10)–4,58^2=1,73
Non capisco come mai nella soluzione i risultati sono:
Media=3,9, varianza=2,39
Sto impazzendo!!!
Ciao Elena,
Grazie per l’interessante domanda.
Le formule e i calcoli che hai utilizzato per risolvere l’esercizio sono corrette.
Ti prego però di notare che le frequenze che ti fornisce l’esercizio sono quelle CUMULATE assolute.
Sarebbe stato tutto corretto se avessi utilizzato le frequenze assolute.
Dalle frequenze cumulate puoi facilmente ricavare le frequenze assolute.
Esse risultano pari alla differenza tra le due cumulate successive:
3–0=3 , 4–3=1, 6–4=2 , 8–6=2 , 10–8=2.
Ricapitolando:
Le modalità della variabile x sono:
2,3,4,5,6
E le frequenze associate risultano:
3, 1, 2, 2, 2
Per tanto la media risulta essere:
Media = (2*3+3*1+4*2+5*2+6*2)/(3+1+2+2+2)=3,9
E dai qui possiamo facilmente calcolare la varianza come segue:
Varianza = (2^2*1+3^2*2+4^2*2+5^2*2+6^2*2)/10–3,9^2=2,39
E con questo il problema dovrebbe essere risolto 😉
Ciao Andrea, perdonami, ho due domande:
1) guardando la formula della media ponderata al denominatore giustamente hai posto n. Poi hai specificato dicendo che essa sarebbe la Sommatoria di ni (quindi la somma delle frequenze assolute). Però sarebbe stato ugualmente giusto scrivere
Sommatoria di nk al denominatore in quanto nk sono le singole frequenze assolute?
2) si può scrivere la formula della media ponderata cosi:
Sommatoria di xi ni
——
Sommatoria di ni anziché solo n e basta?
3) allo stesso modo é possibile invece scrivere? : Sommatoria di xi fi
– – – – – – – – – – – – – –
Sommatoria di fi
Grazie per la risposta in anticipo
Ciao Erika, Grazie per le osservazioni.
A tutte e tre le domande ti rispondo in modo affettivo.
Alla numero 1, dico che alcuni usano l’indice i, altri ,l’indice k, quindi l’importante è capire in presenza di più indici (non è un problema nostro) quale sia fisso e quale variabile.
Per la seconda assolutamente si: media = somma (xi*ni)/somma(ni)
La terza anche Poiché fi = ni/somma(ni)
Ah capito quindi nel caso di ni e ny che sono due indici capiamo che ny forse é quello variabile e ni quello fisso, sempre se non erro.
Un altro dubbio che mi é arrivato:
Per rappresentare la formula della media della popolazione é possibile così? Mu=E(x). E(x) =Mu. Mu(x) =E(x)
E(x) =Mu(x)
E quella della media campionaria invece
X barrato =E(x) E(x) =X barrato sarebbe giusta?
Inoltre la formula lunga che hai scritto della media:
Mu=mu di x= x barrato (media campionaria) = E(x)
Sarebbe anche giusta scriverla così per intero o bisogna scegliere solo una parte? E poi questa formula lunga é per la media campionaria o della popolazione?
Scusami la miriade di domande
Via Erika
Si tutti quelli che hai citato sono sinonimi di media
Solitamente in ambito campionario si predilige la x con la barra sopra per indicare la media del campione
Mentre il mu (lettera greca) si usa di più per indicare la media di una popolazione
Quando però siamo nella statistica descrittiva di usano tutti questi nomi indistintamente
Quindi se ho capito bene, ad esempio, la formula della media campionaria é :
X bar Sommatoria di xi/n
Però si potrebbe ad esempio anche scrivere :
E(x) = x bar Sommatoria di xi/n
Stessa cosa con mu
Mu Sommatoria di xi/N
Oppure volendo solo
E(x) = mu Sommatoria di xi/N
giusto?
Si
Un’altra cosa che mi sono dimenticata di chiedere: media ponderata e media con frequenze assolute sono due cose uguali o diverse?
Nel senso che la formula della media ponderata é praticamente
Sommatoria di x pi/sommatoria di pi
Quindi scrivere Sommatoria di x ni/ somm.di ni non é sbagliato? Grazie ancora
La media ponderata e media con frequenze è la STESSA COSA.
Infatti la ponderazione avviene proprio tramite le frequenze, che sono i pesi.
Circa le due formule che hai citato:
Sommatoria di x pi/sommatoria di pi
Sommatoria di x ni/ somm.di ni
Sono la STESSA formula.
Alcuni testi chiamano ni le frequenze assolute
Alcuni testi chiamano fi le frequenze assolute
Alcuni testi chiamano pi le frequenze relative
alcuni testo chiamano pi le frequenze percentuali
Alcuni testi non fanno nessuna distinzione tra quelle percentuali e relative.
L’importante per evitare confusioni è CAPIRE I CONCETTI SOTTOSTANTI facendo 2 o 3 esempi per ogni formula.
Usare la stessa simbologia per almeno 10/20 volte.
Fatto questo fissi delle informazioni.
Poi la terza fase può anche essere quella di provare dei cambiamenti.
L’importante è fare più esercizi possibili in caso di dubbio
Grazie davvero di cuore 🙂