MEDIA E MEDIA PONDERATA

In questo articolo vediamo come si calcolano la media e la media ponderata.

CALCOLO DELLA MEDIA ARITMETICA

Per ottenere la media aritmetica sommiamo tutti i dati di una certa distribuzione e dividiamo per la numerosità degli stessi.

Le due principali formule utilizzate sono quelle relative alla media semplice (con i dati sfusi) e alla media ponderata (con i dati tabellari di frequenza)

$$ \mu_x = \bar{x} = E(x) = \frac{\sum_{i=1}^n x_i}{n}= \frac{\sum x_i}{n}$$

$$ \mu_x = \bar{x} = E(x) = \frac{\sum_{i=1}^k x_i \cdot n_i}{n}= \frac{\sum x_i \cdot n_i}{n}$$

In quest’ultimo caso esiste anche un’altra formula che sfrutta le frequenze relative fi.

$$ \mu_x = \bar{x} = E(x) = \sum_{i=1}^n x_i \cdot f_i= \sum x_i \cdot f_i$$

Nella nostra discussione vedremo meglio le prime due formulazioni

MEDIA CON I DATI SFUSI 

Supponiamo di intervistare 5 giovani chiedendo loro quante ore al giorno dedicano tra social e serie tv.

Nella tabella sotto sono riportate le loro risposte.

media ponderata: dati tabella

FORMULA DELLA MEDIA SEMPLICE

Vogliamo ora calcolare il numero medio di ore passate tra tv e social.

Andiamo quindi a sommare i dati dividendoli per il numero totale dei soggetti intervistati.

La formula per il calcolo della media è la seguente:

$$ \mu_x = \bar{x} = E(x) = \frac{\sum_{i=1}^k}{x_i}= \frac{\sum x_i}{n}$$

$$ x_i = {valore i-esima unità considerata }

$$ n = \text{numero di unità statistiche} $$

La media è la sommatoria degli xi con la i che va da 1 a n divisa per n, dove n è il numero totale dei dati.

Nell’ultimo calcolo (dopo l’ultimo uguale) ho eliminato per semplicità da 1 a n sottintendendo che è una sommatoria su tutte le xi.

Come potete notare ho dato quattro diverse rappresentazioni della media.

Il primo modo di identificare la media è mediante il simbolo greco µ “mu”, che sarebbe la nostra lettere m nell’alfabeto greco.

Per essere più precisi possiamo usare il simbolo µ con un pedice x.

Questa scrittura ad esempio risulta comoda quando abbiamo più variabili come x, y e z.

Il terzo modo è la x con il trattino sopra.

Un quarto modo è la scrittura E(x) che in inglese sta per “expected value of x“, ovvero valore atteso della x, che nel contesto delle probabilità sta appunto per media.

Nei calcoli usiamo solamente una di queste.

CALCOLI

Applichiamo ora la formula sopra e otteniamo: 

$$ \mu_x = \frac{5+3+2+7+4}{5} = 4,2 $$

Come vedete è più facile a fare il calcolo pratico che a descriverlo con una formula.

CALCOLI CON EXCEL

Se vogliamo calcolare con Excel la media dopo aver riportato i dati, basta che usiamo la formula:

$$ = \text{MEDIA (<dati>)} $$

media. calcoli con excel

MEDIA PONDERATA

Quando gli stessi dati si ripetono più di una volta conviene riorganizzarli in una tabella di frequenza.

Quando calcoliamo la media teniamo conto di queste ripetizioni ponderando il dato (modalità) ripetuto per la sua frequenza.

DAI DATI SFUSI AI DATI RIORGANIZZATI

Consideriamo la stessa indagine di prima fatta su una popolazione di 10 soggetti.

Riportiamo i risultati nella seguente tabella.

DATI RIORGANIZZATI NELLA TABELLA DI FREQUENZA

Come potete notare i numeri 2, 3, 4 e 5 si ripetono più di una volta.

Pertanto possiamo costruire una tabella dove nella prima colonna inseriamo le modalità assunte dal carattere (variabile) e nella seconda colonna la frequenza di queste modalità.

Questa tabella prende il nome di tabella di frequenza.

media ponderata: tabella dei dati con frequenze

FORMULA DELLA MEDIA PONDERATA

Per calcolare la media ponderata della nostra distribuzione di dati andiamo a sommare i valori delle modalità ponderandoli per la frequenza, dividendo il tutto per la frequenza (numerosità) totale. 

$$ \mu_x = \bar{x} = E(x) = \frac{\sum_{i=1}^k x_i \cdot n_i}{n}= \frac{\sum x_i \cdot n_i}{n}$$

$$ k = \ \text{ il numero delle modalità della x} $$

$$ x_i = \ \text{i-esima modalità della x} $$

$$ n_i = \ \text{frequenza assoluta (numerosità) della modalità x_i} $$

$$ n = \sum_{i=1} ^k x_i \ \text{numero di unità statistiche: somma degli ni} $$

CALCOLO DELLA MEDIA PONDERATA

media ponderata: tabella dati

Passando al calcolo della media ponderata avremo che:

$$ \bar{x} = \frac{1 \cdot 1 + 2 \cdot 3 + 3 \cdot 2 + 4 \cdot 2 + 5 \cdot 2 }{10} = 3,1 $$

Mediamente il gruppo intervistato passa 3,1 ore davanti ai social e serie tv/intrattenimento.

CALCOLI CON EXCEL PER LA MEDIA PONDERATA

  1. Per riorganizzare i dati scrivi sotto la x le modalità 1, 2, 3, 4 e 5.Nella colonna delle frequenza fai la formula:

$$ = \text{CONTA.SE (<DATI (fissati con \$)> ; <MODALITÀ>} $$

2. Metti il totale dei dati con la funzione 

$$ = \text{SOMMA (< DATI>)} $$

NB: La presenza dei simboli <…> indica che bisogna inserire i dati.

3. Calcola la media con la funzione 

$$ = \text{MATR.SOMMA. PRODOTTO (<MODALITÀ>; <FREQUENZA>} $$

dividendola per il totale dei dati n.

media ponderata: passaggi con excel

IMPARA LA STATISTICA

Comincia un fantastico viaggio alla scoperta di questa affascinante materia partendo da zero.

Un percorso che parte dalla statistica descrittiva, passando per le probabilità si arriva all’inferenza.

Comincia subito il tuo percorso e migliora le tue abilità.

L’ARTICOLO TI è PIACIUTO ?

Se questo contenuto ti è piaciuto e vorresti che anche altri utenti possano goderne di questo ed altri ancora sostieni il progetto offrendomi un semplice caffè virtuale

Questo semplice gesto per me significa moltissimo e può essere un forte impulso per lo sviluppo di tutto il progetto di divulgazione matematica

11 risposte

  1. Ciao Andrea, ho questo quesito da proporti.
    Ho una variabile X che si presenta con modalità:
    2,3,4,5,6
    Di frequenze cumulate pari a
    3, 4, 6, 8, 10

    L’esercizio mi chiede di calcolare la media e la varianza della distribuzione.

    Ho applicato la formula della media e della varianza ponderate.

    Per la media ho fatto il seguente calcolo:

    Media = (2*3+3*4+4*6+5*8+6*10)/(3+4+6+8+10)=4,58

    Successivamente ho calcolato la varianza con la formula:

    Varianza = (2^2*3+3^2*4+4^2*6+5^2*8+6^2*10)/(3+4+6+8+10)–4,58^2=1,73

    Non capisco come mai nella soluzione i risultati sono:
    Media=3,9, varianza=2,39
    Sto impazzendo!!!

    1. Ciao Elena,
      Grazie per l’interessante domanda.
      Le formule e i calcoli che hai utilizzato per risolvere l’esercizio sono corrette.
      Ti prego però di notare che le frequenze che ti fornisce l’esercizio sono quelle CUMULATE assolute.
      Sarebbe stato tutto corretto se avessi utilizzato le frequenze assolute.

      Dalle frequenze cumulate puoi facilmente ricavare le frequenze assolute.
      Esse risultano pari alla differenza tra le due cumulate successive:

      3–0=3 , 4–3=1, 6–4=2 , 8–6=2 , 10–8=2.

      Ricapitolando:
      Le modalità della variabile x sono:
      2,3,4,5,6
      E le frequenze associate risultano:
      3, 1, 2, 2, 2

      Per tanto la media risulta essere:

      Media = (2*3+3*1+4*2+5*2+6*2)/(3+1+2+2+2)=3,9

      E dai qui possiamo facilmente calcolare la varianza come segue:

      Varianza = (2^2*1+3^2*2+4^2*2+5^2*2+6^2*2)/10–3,9^2=2,39

      E con questo il problema dovrebbe essere risolto 😉

  2. Ciao Andrea, perdonami, ho due domande:
    1) guardando la formula della media ponderata al denominatore giustamente hai posto n. Poi hai specificato dicendo che essa sarebbe la Sommatoria di ni (quindi la somma delle frequenze assolute). Però sarebbe stato ugualmente giusto scrivere
    Sommatoria di nk al denominatore in quanto nk sono le singole frequenze assolute?

    2) si può scrivere la formula della media ponderata cosi:
    Sommatoria di xi ni
    ——
    Sommatoria di ni anziché solo n e basta?

    3) allo stesso modo é possibile invece scrivere? : Sommatoria di xi fi
    – – – – – – – – – – – – – –
    Sommatoria di fi
    Grazie per la risposta in anticipo

    1. Ciao Erika, Grazie per le osservazioni.
      A tutte e tre le domande ti rispondo in modo affettivo.
      Alla numero 1, dico che alcuni usano l’indice i, altri ,l’indice k, quindi l’importante è capire in presenza di più indici (non è un problema nostro) quale sia fisso e quale variabile.
      Per la seconda assolutamente si: media = somma (xi*ni)/somma(ni)
      La terza anche Poiché fi = ni/somma(ni)

      1. Ah capito quindi nel caso di ni e ny che sono due indici capiamo che ny forse é quello variabile e ni quello fisso, sempre se non erro.

        Un altro dubbio che mi é arrivato:
        Per rappresentare la formula della media della popolazione é possibile così? Mu=E(x). E(x) =Mu. Mu(x) =E(x)
        E(x) =Mu(x)
        E quella della media campionaria invece
        X barrato =E(x) E(x) =X barrato sarebbe giusta?
        Inoltre la formula lunga che hai scritto della media:
        Mu=mu di x= x barrato (media campionaria) = E(x)
        Sarebbe anche giusta scriverla così per intero o bisogna scegliere solo una parte? E poi questa formula lunga é per la media campionaria o della popolazione?
        Scusami la miriade di domande

        1. Via Erika
          Si tutti quelli che hai citato sono sinonimi di media
          Solitamente in ambito campionario si predilige la x con la barra sopra per indicare la media del campione
          Mentre il mu (lettera greca) si usa di più per indicare la media di una popolazione
          Quando però siamo nella statistica descrittiva di usano tutti questi nomi indistintamente

          1. Quindi se ho capito bene, ad esempio, la formula della media campionaria é :
            X bar Sommatoria di xi/n
            Però si potrebbe ad esempio anche scrivere :
            E(x) = x bar Sommatoria di xi/n
            Stessa cosa con mu
            Mu Sommatoria di xi/N
            Oppure volendo solo
            E(x) = mu Sommatoria di xi/N
            giusto?

  3. Un’altra cosa che mi sono dimenticata di chiedere: media ponderata e media con frequenze assolute sono due cose uguali o diverse?
    Nel senso che la formula della media ponderata é praticamente
    Sommatoria di x pi/sommatoria di pi
    Quindi scrivere Sommatoria di x ni/ somm.di ni non é sbagliato? Grazie ancora

    1. La media ponderata e media con frequenze è la STESSA COSA.
      Infatti la ponderazione avviene proprio tramite le frequenze, che sono i pesi.
      Circa le due formule che hai citato:
      Sommatoria di x pi/sommatoria di pi
      Sommatoria di x ni/ somm.di ni
      Sono la STESSA formula.
      Alcuni testi chiamano ni le frequenze assolute
      Alcuni testi chiamano fi le frequenze assolute
      Alcuni testi chiamano pi le frequenze relative
      alcuni testo chiamano pi le frequenze percentuali
      Alcuni testi non fanno nessuna distinzione tra quelle percentuali e relative.
      L’importante per evitare confusioni è CAPIRE I CONCETTI SOTTOSTANTI facendo 2 o 3 esempi per ogni formula.
      Usare la stessa simbologia per almeno 10/20 volte.
      Fatto questo fissi delle informazioni.
      Poi la terza fase può anche essere quella di provare dei cambiamenti.
      L’importante è fare più esercizi possibili in caso di dubbio

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *