L’Istogramma per Distribuzioni in Classi

L’Istogramma è la rappresentazione grafica più appropriata per distribuzioni di frequenza di caratteri quantitativi continui (o discreti con molte modalità) raggruppati in classi.

A differenza del diagramma a barre, dove l’altezza rappresenta la frequenza, nell’istogramma è l’area di ciascun rettangolo a rappresentare la frequenza, garantendo che classi con ampiezza diversa siano rappresentate correttamente.


Teoria e Principi di Costruzione

L’istogramma è composto da rettangoli adiacenti, dove:

  1. Base del Rettangolo: Corrisponde all’ampiezza della classe ($\Delta_i = estremo superiore – estremo inferiore$).
  2. Area del Rettangolo: Deve essere proporzionale alla frequenza della classe ($n_i$ o $f_i$).
  3. Altezza del Rettangolo: È la Densità di Frequenza ($h_i$), calcolata come il rapporto tra la frequenza della classe e la sua ampiezza.

La Formula della Densità di Frequenza

La densità di frequenza ($h_i$) è l’elemento chiave che rende l’istogramma corretto quando le classi hanno ampiezza differente.

$$\mathbf{h_i = \frac{n_i}{\Delta_i}}$$

dove:

  • $n_i$ è la frequenza assoluta (o $f_i$ se si usano le frequenze relative).
  • $\Delta_i$ è l’ampiezza della classe $i$.

L’uso della densità assicura che, se due classi contengono lo stesso numero di osservazioni, ma una è due volte più larga dell’altra, l’area della seconda sia suddivisa su una base più ampia, risultando in un’altezza (densità) dimezzata.


Applicazione: Spesa per Vacanze

L’Esercizio 1 del Tema 3 fornisce la distribuzione di frequenze assolute ($n_i$) per la Spesa per vacanze di $N=500$ famiglie milanesi, suddivise in 4 classi. La richiesta è di rappresentare graficamente la distribuzione delle frequenze relative percentuali ($f_i\%$).

Dati Iniziali

Classe ($i$)Spesa per vacanze (migliaia di euro)$n_i$ (Freq. Assoluta)$f_i$ (Freq. Relativa)
1$0 \rightarrow 0,5$100$100/500 = 0.20$
2$0,5 \rightarrow 1,5$150$150/500 = 0.30$
3$1,5 \rightarrow 3$200$200/500 = 0.40$
4$3 \rightarrow 5$50$50/500 = 0.10$
Totale$\mathbf{N=500}$$\mathbf{1.00}$

Passo 1: Calcolo dell’Ampiezza di Classe ($\Delta_i$)

Si calcola l’ampiezza di ciascuna classe sottraendo l’estremo inferiore dall’estremo superiore.

Classe ($i$)Intervallo$\Delta_i = \text{Estremo Sup.} – \text{Estremo Inf.}$
1$0 \rightarrow 0,5$$0,5 – 0 = \mathbf{0,5}$
2$0,5 \rightarrow 1,5$$1,5 – 0,5 = \mathbf{1,0}$
3$1,5 \rightarrow 3$$3 – 1,5 = \mathbf{1,5}$
4$3 \rightarrow 5$$5 – 3 = \mathbf{2,0}$

Si nota che le classi hanno ampiezze diverse (0.5, 1.0, 1.5, 2.0). L’uso della densità di frequenza ($h_i$) è obbligatorio.

Passo 2: Calcolo della Densità di Frequenza ($h_i$)

Poiché l’istogramma richiesto si basa sulle frequenze relative percentuali ($f_i\%$), calcoleremo la densità usando le frequenze relative ($f_i$).

$$h_i = \frac{f_i}{\Delta_i}$$

$i$$f_i$ (Freq. Relativa)$\Delta_i$ (Ampiezza)$\mathbf{h_i = f_i / \Delta_i}$ (Densità)
10.200.5$0.20 / 0.5 = \mathbf{0.400}$
20.301.0$0.30 / 1.0 = \mathbf{0.300}$
30.401.5$0.40 / 1.5 \approx \mathbf{0.267}$
40.102.0$0.10 / 2.0 = \mathbf{0.050}$

Passo 3: Rappresentazione Grafica (Descrizione)

Per costruire l’istogramma, si riportano sull’asse orizzontale (asse $x$) i valori della variabile “Spesa per vacanze” (0, 0.5, 1.5, 3, 5). Sull’asse verticale (asse $y$) si riportano i valori della Densità di Frequenza ($h_i$).

  1. Rettangolo 1 (Spesa $0 \rightarrow 0,5$): Base da 0 a 0,5; Altezza 0.400.
  2. Rettangolo 2 (Spesa $0,5 \rightarrow 1,5$): Base da 0,5 a 1,5; Altezza 0.300.
  3. Rettangolo 3 (Spesa $1,5 \rightarrow 3$): Base da 1,5 a 3,0; Altezza 0.267.
  4. Rettangolo 4 (Spesa $3 \rightarrow 5$): Base da 3,0 a 5,0; Altezza 0.050.

L’area di ciascun rettangolo, calcolata come Base $\times$ Altezza, ripristinerà la frequenza relativa della classe. Ad esempio, per la prima classe: Area $= 0.5 \times 0.400 = 0.20$, che è la frequenza relativa della classe.


3. Commento sull’Istogramma

L’istogramma mostra una distribuzione asimmetrica positiva (o obliqua a destra).

  • La classe con la massima densità di osservazioni è la prima ($0 \rightarrow 0,5$), con $h_1 = 0.400$.
  • La classe con la massima frequenza assoluta/relativa è la terza ($1,5 \rightarrow 3$), con $f_3 = 0.40$.

Nonostante la terza classe abbia la frequenza più alta, la sua minore densità (0.267) rispetto alla prima classe (0.400) indica che in quell’intervallo più ampio le osservazioni sono più sparse. Il grafico mostrerebbe che le frequenze tendono a diminuire drasticamente man mano che la spesa aumenta, con una lunga coda a destra verso le spese più elevate.

IMPARA LA STATISTICA

Comincia un fantastico viaggio alla scoperta di questa affascinante materia partendo da zero.

Si comincia dalla statistica descrittiva, passando per le probabilità si arriva all’inferenza.

Comincia subito il tuo percorso e migliora le tue abilità.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *