Il Teorema di Chebyshev: Misurare l’Incertezza

Il Teorema (o Disuguaglianza) di Chebyshev (in russo Čebyšëv) è uno strumento fondamentale nella teoria della probabilità e della statistica.

La sua importanza risiede nel fatto che, a differenza di altre regole che richiedono di conoscere la distribuzione di probabilità esatta dei dati (come la distribuzione normale), il Teorema di Chebyshev fornisce un limite minimo di probabilità che una variabile casuale assuma valori vicini alla sua media, indipendentemente dalla forma della sua distribuzione.


1. Cos’è e Cosa Dice l’Enunciato

Il Teorema di Chebyshev, dal nome del matematico russo Pafnutij L’vovič Čebyšëv (1821–1894), stabilisce una relazione rigorosa tra la media, la deviazione standard (o varianza) di una distribuzione e la probabilità che un risultato si discosti da quella media.

Enunciato (Formulazione Statistica):

Per qualsiasi distribuzione di probabilità (con varianza finita) e per qualsiasi costante $k>1$ (dove $k$ rappresenta il numero di deviazioni standard), la probabilità che una variabile casuale $X$ assuma un valore che si discosti dalla sua media $\mu$ per più di $k$ deviazioni standard ($\sigma$) è minore o uguale a $\frac{1}{k^2}$.

Formula:

$$P(|X – \mu| \geq k\sigma) \leq \frac{1}{k^2}$$

In modo equivalente, e spesso più utile, si può formulare il teorema per trovare il limite inferiore di probabilità che i dati cadano all’interno di quell’intervallo:

$$P(|X – \mu| < k\sigma) \geq 1 – \frac{1}{k^2}$$

Significato: Il teorema garantisce che almeno una frazione $1 – \frac{1}{k^2}$ dei dati cadrà entro $k$ deviazioni standard dalla media, qualunque sia la forma della distribuzione.


2. Esempio Pratico

Supponiamo di avere una popolazione di studenti di cui conosciamo solo l’altezza media e la deviazione standard, senza conoscere se la distribuzione delle altezze sia normale o asimmetrica.

  • Media (\mu$): 170 cm
  • Deviazione Standard ($\sigma$): 5 cm

Vogliamo sapere almeno quale percentuale degli studenti ha un’altezza compresa tra 160 cm e 180 cm.

Passaggio 1: Determinare $k$ (Il Numero di Deviazioni Standard)

L’intervallo $[160,180]$ si estende per 10 cm sopra e 10 cm sotto la media.

$$\text{Scostamento Massimo} = 180 – 170 = 10 \text{ cm}$$

Il valore di $k$ si calcola dividendo lo scostamento massimo per la deviazione standard:

$$k = \frac{\text{Scostamento Massimo}}{\sigma} = \frac{10 \text{ cm}}{5 \text{ cm}} = 2$$

Quindi, stiamo cercando la probabilità che l’altezza cada entro $k=2$ deviazioni standard dalla media.

Passaggio 2: Applicare il Teorema

Usiamo la forma del teorema per l’intervallo interno: $P(|X – \mu| < k\sigma) \geq 1 – \frac{1}{k^2}$

Sostituendo $k=2$:

$$P(|X – 170| < 2 \cdot 5) \geq 1 – \frac{1}{2^2}\\ P(160 < X < 180) \geq 1 – \frac{1}{4} \\ P(160 < X < 180) \geq \frac{3}{4} \quad \text{o } 75\%$$

Conclusione: Il Teorema di Čebyšëv ci garantisce che, indipendentemente dalla forma della distribuzione delle altezze, almeno il 75% degli studenti ha un’altezza compresa tra 160 cm e 180 cm.


3. Il Suo Creatore

Il Teorema di Chebyshev prende il nome da Pafnutij L’vovič Čebyšëv (1821–1894), un influente matematico e statistico russo.

Chebyshev è considerato una figura chiave nella storia della matematica russa e ha dato contributi fondamentali in molti campi, tra cui la teoria dei numeri, l’analisi e, soprattutto, la teoria della probabilità.

Egli sviluppò questa disuguaglianza come parte del suo lavoro per fornire una dimostrazione più rigorosa della Legge Debole dei Grandi Numeri (LWLLN).

Mentre Jakob Bernoulli aveva enunciato questa legge nel 1713, la sua dimostrazione era complessa e basata su assunzioni implicite, Chebyshev fornì la prova definitiva, generalizzando la disuguaglianza per essere applicabile a qualsiasi variabile casuale con media e varianza finite.

Questa generalità è ciò che rende il teorema così potente e fondamentale nella statistica moderna.


4. Collegamento con la Distribuzione Normale e la Stima

Il Teorema di Chebyshev acquisisce un significato particolare quando viene confrontato con la distribuzione normale (o gaussiana), il modello di distribuzione più comune in natura e statistica.

Contrasto con la Distribuzione Normale (Regola Empirica)

Il Teorema di Čebyšëv acquisisce un significato particolare quando lo si confronta con la Distribuzione Normale (o gaussiana), il modello di distribuzione più diffuso in natura e statistica. Per la Normale, valgono limiti di probabilità molto più stretti, noti come Regola Empirica (ad esempio, circa il 95% dei dati cade entro $2σ$).

Tuttavia, il Teorema di Čebyšëv è superiore in termini di universalità e robustezza, in quanto offre garanzie valide indipendentemente dalla forma della distribuzione. La tabella seguente illustra il divario tra la garanzia minima offerta da Čebyšëv (valida per qualsiasi distribuzione) e il contenuto tipico della Distribuzione Normale:

Numero di σ (k)Garanzia Minima di Čebyšëv ($≥1−\frac{1}{k^2}$)Contenuto Tipico (Distribuzione Normale)
2≥75%≈95.45%
3≥88.9%≈99.73%
4≥93.75%≈99.99%

La vera forza di Chebyshev non risiede nella precisione (i suoi limiti sono più “larghi” della Normale), ma nella robustezza: il 75% entro $2σ$ è il limite minimo garantito per qualsiasi distribuzione, basato solo sui parametri della media (\mu$) e della deviazione standard (\sigma$). Questa universalità lo rende uno strumento prezioso quando la distribuzione sottostante è sconosciuta o non è normale.

Stima di Media e Varianza

Nella statistica inferenziale, spesso si lavora con un campione e si usa la sua media ($\bar{X}$) e varianza campionaria ($s^2$) per stimare μ e σ della popolazione.

Il Teorema di Chebyshev è fondamentale in questo contesto perché:

  1. Validazione Universale: Anche se non abbiamo la certezza che i nostri dati campionari seguano una distribuzione normale (o qualsiasi altra distribuzione nota), possiamo comunque utilizzare $\bar{X}$ e s per costruire intervalli di confidenza che garantiscano una copertura minima di probabilità (ad esempio, almeno l’89% dei dati reali si trova in $\bar{X}±3s$).
  2. Base per la LGN: La dimostrazione della Legge Debole dei Grandi Numeri (LWLLN) da parte di Čebyšëv dipende direttamente dalla sua disuguaglianza. Egli la utilizzò per limitare la probabilità che la media campionaria si allontanasse dal valore atteso teorico, stabilendo così la relazione fondamentale tra media e varianza per la teoria della probabilità.

SCOPRI IL MONDO DELLE PROBABILITÀ

Comincia un fantastico viaggio alla scoperta della probabilità

Accedi ai corsi di statistica e impara a destreggiarti nei labirinti dei calcoli della statistica probabilistica.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *