Skip to main content

MEDIANA – DEFINIZIONE 

La mediana è la modalità  che occupa la posizione centrale di una distribuzione ordinata di dati. 

Mediana significa “ciò che sta di mezzo

PREREQUISITO PER IL CALCOLO DELLA MEDIANA

Il prerequisito fondamentale è perciò che i dati siano ordinabili.

La mediana può essere calcolata quando il carattere considerato è:

  • Qualitativo ordinabile
  • quantitativo

CARATTERI QUALITATIVI ORDINABILI

Analizziamo ora i caratteri qualitativi ordinabili.

Prendiamo un esempio in cui sono intervistati 5 consumatori circa il loro grado di soddisfazione per aver usufruito di un certo prodotto o servizio.

Consideriamo 5 possibili modalità di questo carattere riassunte qui sotto:

CARATTERE : 

Soddisfazione   di un cliente

MODALITÀ : 

N = non soddisfatto

P = poco soddisfatto

S = soddisfatto

M = molto soddisfatto

NUMEROSITÀ DISPARI

Cominciamo con il considerare il caso  in cui il numero degli elementi della popolazione ( o del campione) considerato sia dispari.

Nella tabella sotto sono riportate le risposte di 5 consumatori:

RIORDINIAMO I DATI

Per prima cosa riordiniamo i dati in nostro possesso dalla modalità minore a quella maggiore ovvero in ordine crescente.

CALCOLO MEDIANA CON n DISPARI

Quando il numero di soggetti intervistati è dispari avremo una sola mediana.

La mediana è il dato (modalità) che occupa la posizione (n+1)/2.

Nel nostro caso il numero n di elementi è:

Perciò la  posizione occupata dalla mediana rispetto ai dati riordinati è:

Nella situazione analizzata diremo che:

Dobbiamo quindi andare a ricercare la terza posizione:

La mediana della distribuzione risulta essere S ovvero SODDISFATTO.

Da notare che rispetto alla terza posizione troviamo 2 posizioni che hanno una modalità inferiore o uguale e due modalità che occupano una posizione maggiore o uguale della media.

Perciò possiamo dire che il 50% delle unità statistiche considerate ha un grado di soddisfazione <= di SODDISFATTO.

Analogamente risulta che  il 50% dei consumatori ha un grado di soddisfazione >= a SODDISFATTO.

NUMEROSITÀ PARI

Vediamo cosa succede nel caso in cui il numero di soggetti intervistati risulta pari.

Prendiamo come riferimento la stessa indagine ma con un numero di consumatori pari a 6 e riportiamo come prima i risultati nella tabella qui sotto.

RIORDINIAMO I DATI

Anche qui andiamo a riordinare in maniera crescente le modalità:

CALCOLO MEDIANA CON n pari

Quando la numerosità delle unità statistiche è pari la mediana occupa due posizioni: n/2 e n/2+1.

Nel caso considerato la numerosità è pari a:

Le due posizioni ricercate all’interno dei dati riordinati sono:

Ovvero in numeri:

Ricerchiamo perciò la terza e la quarta posizione:

Essendo che la modalità assunta dal carattere considerato nelle due posizioni è sempre la stessa diremo che esiste un’unica mediana pari  a S = SODDISFATTO.

Anche qui notiamo che prima della terza posizione e dopo la quarta posizione ci sono lo stesso numero di unità, due in questo caso.

IL CASO DELLA DOPPIA MEDIANA

Ovviamente potremmo analizzare la situazione di una doppia mediana.

Consideriamo ad esempio il caso presentato dalla tabella sottostante in cui i dati sono già riordinati.

Essendo il numero degli intervistati pari a 6 (pari) dobbiamo guardare le posizioni 3 e 4.

In questo caso abbiamo due mediane : S e M.

Non essendo dei dati numerici non possiamo fare la media di questi due dati.

Per questo motivo in questa distribuzione le mediane sono due.

MEDIANA CON LA TABELLA DI FREQUENZA

Potremo ripetere l’esercizio precedente sul calcolo della mediana riorganizzando i dati in una tabella di frequenza.

Il nostro punto di partenza sono i dati sfusi e riordinati.

TABELLA DI FREQUENZA

Partendo da questi dati andiamo a costruire la tabella delle frequenze.

Sulla prima colonna, che chiamiamo X ovvero il carattere considerato, scriviamo lemodalità dalla più bassa alla più alta.

Scriviamo quindi in ordine: N, P, S e M.

Nella seconda colonna, denominata ni, andiamo a riportare le frequenze, ovvero andiamo a contare quante volte quella tal modalità si presenta all’interno del gruppo analizzato.

La terza colonna Ni rappresenta le frequenze assolute cumulate, ovvero facciamo la somma delle ni fino a quella modalità.

RICERCA DELLA MEDIANA

Siccome abbiamo 6 dati dobbiamo ricercare le posizioni 3 e 4.

Andiamo a ricercarle nella colonna delle frequenze cumulate Ni.

Il 4 scritto nelle frequenze cumulate in corrispondenza della modalità S indica che li ci sono proprio le posizioni 3 e 4.

Infatti la frequenza cumulata della classe precedente è 2.

MEDIANA CON DATI NUMERICI

Passiamo ora ai caratteri quantitativi, partendo dal caso discreto.

Consideriamo subito il seguente esempio.

Intervistiamo dieci individui chiedendogli quante sigarette fumano ogni giorno.

Riportiamo i risultati nella tabella sottostante:

TABELLA DI FREQUENZA

Riorganizziamo i dati nella tabelle delle frequenze.

Sulla prima colonna X riportiamo le modalità assunte dal carattere: numero di sigarette fumate in un giorno.

Nella seconda colonna ni riportiamo le frequenze assolute, ovvero il conteggio dei dati che presentano quella tal modalità.

Infine costruiamo la colla delle frequenze assolute cumulate Ni.

RICERCA DELLA MEDIANA

Essendo il totale delle unità statistiche pari a 10 (pari) ricerchiamo nelle frequenze assolute cumulate n/2 e n/2+1, ovvero 5 e 6.

Entrambe queste posizioni si trovano in corrispondenza della modalità x=3 sigarette.

Il numero 7 delle frequenze cumulate indica che in quella modalità troviamo le posizioni 5,6 e 7.

La frequenza cumulata della modalità precedente (ovvero 2 sigarette) è infatti pari a 4.

Con i dati a disposizione non abbiamo dubbio che la mediana è pari a 3 sigarette.

SCOPRI I VIDEO CORSI DEDICATI ALLA STATISTICA

Se vuoi approfondire gli argomenti della statistica scopri i video corsi dedicati.

Visita il canale You Tube con tanti video e playlist dedicate alla statistica.

DOPPIA MEDIANA CON CARATTERI QUANTITATIVI

Potrebbe ovviamente capitare il caso il caso di una doppia mediana.

Consideriamo la situazione che segue, basata sulla stessa indagine sul numero di sigarette fumate. 

TABELLA DI FREQUENZA

Come al solito riportiamo i dati nella tabella delle frequenze:

RICERCA DELLA MEDIANA

Anche qui ricerchiamo la posizione 5 e 6.

Notiamo che la posizione 5 è associata alla modalità 2 sigarette.

Mentre la posizione 6 è associata alla modalità successiva 3 sigarette.

In questo caso abbiamo due mediane ovvero 2 e 3 sigarette.

Essendo dei dati numerici possiamo fare tranquillamente la media, ovvero 2,5.

Il 50% delle unità statistiche intervistate  fuma meno di 2,5 sigarette al giorno.

MEDIANA CON LE CLASSI

Il caso certamente più ostico per il calcolo della mediana si verifica quando abbiamo a che fare con caratteri quantitativi continui che sono raggruppati in classi.

Consideriamo la seguente indagine statistica.

Intervistiamo 100 automobilisti circa la spesa mensile misurata in euro di gasolio/ benzina:

14 individui affermano che la loro spesa per carburante è inferiore a 50 euro.

29 individui hanno una spesa compresa tra i 50 (incluso ) e i 100 euro (esclusi).

37 individui hanno una spesa tra i 100 e i 150 euro.

17 individui hanno una spesa compresa tra i 150 e i 250 euro.

I restanti 3 individui hanno una spesa compresa tra i 250 e i 400 euro.

Nella tabella sottostante riportiamo i risultati.

La prima colonna rappresenta le classi di spesa. 

Quando utilizziamo la parentesi quadra [] intendiamo prendere il valore, mentre con la parentesi tonda () lo rifiutiamo.

Nella seconda e terza colonna  ni vi sono rispettivamente  le frequenze assolute ni e le frequenze assolute cumulate Ni.

La quarta colonna Fi rappresenta le frequenze relative cumulate che sono ottenute dividendo la relativa frequenza assoluta cumulata per N totale: 

L’ultima colonna ai, rappresenta l’ampiezza di classe data dalla differenza tra l’estremo massimo e quello minimo di ogni classe:

Ad esempio la prima classe di spesava da 0 a 50 euro , perciò la sua ampiezza è pari a 50.

La quarta classe di spesa va dai 150 ai 250 euro, quindi la sua ampiezza è pari a 100 euro.

INDIVIDUIAMO LA CLASSE MEDIANA

Per individuare la mediana risulta molto comodo utilizzare la frequenza relativa cumulata Fi.

Siccome la mediana rappresenta il 50% percentile o anche il quantile 0,50, ovvero:

ricerchiamo proprio 0,50 all’interno delle frequenze cumulate.

In questo caso 0,50 è compreso tra 0,43 e 0,80.

La classe mediana sarà dunque quella che va da 100 a 150.

FORMULA PER LA MEDIANA CON LE CLASSI

Ora però vogliamo essere più precisi e all’interno di questa classe vogliamo individuare un solo valore per la mediana.

Ci avvaliamo perciò della seguente formula:

Il valore minimo della classe mediana X_min.MED vale 100.

La frequenza cumula della classe mediana F_MED vale 0,80

La frequenza cumulata della classe precedente alla mediana F_MED-1 vale 0,43

L’ampiezza della classe mediana a_med  vale 50.

Controllate tutti i dati nella tabella di frequenza:

Ora non ci resta che applicare la formula per calcolare la mediana:

La rappresentazione qui sotto dovrebbe rendere più comprensibile i dati inseriti nella formula:

HAI QUALCHE DOMANDA?

Se hai qualche domanda scrivila sotto nei commenti.

Molti utenti potrebbero avere domande simili alle tue.

In questo modo potrai aiutarli a risolvere i loro dubbi.

Per approfondire dai un’occhiata si corsi di statistica.

Acquistando il corso darai una spinta più forte a questo progetto.

Visita anche il canale YouTube con tanti video e intere Playlist dedicate alla statistica.

Leave a Reply