In questo articolo vediamo che cosa è in statistica la distribuzione di Poisson.
INDICE
- 1 DEFINIZIONE
- 2 ESEMPI DI APPLICAZIONE DELLA DISTRIBUZIONE DI POISSON
- 3 UNITA’ SPAZIO TEMPORALE
- 4 MEDIA E VARIANZA (LAMBDA)
- 5 FORMULA DELLA DISTRIBUZIONE DI POISSON
- 6 IMPARA LA STATISTICA ED IL CALCOLO DELLE PROBABILITÀ
- 7 ESEMPIO DI DISTRIBUZIONE DI POISSON
- 8 SCOPRI IL MONDO DELLE PROBABILITÀ
- 9 L’ARTICOLO TI è PIACIUTO ?
DEFINIZIONE
La distribuzione di Poisson si utilizza è una distribuzione casuale discreta di media e varianza identiche che si utilizza per calcolare la probabilità che un certo evento si manifesti esattamente x volte in una certa unità spazio-temporale.
La prima caratteristica importante è dunque che la media deve essere uguale alla varianza.
La seconda caratteristica è che il calcolo della probabilità è circoscritto ad una certa unità spazio-temporale.
Ovvero che identifichiamo che in un certo intervallo temporale o spaziale il numero medio di volte in cui si manifesta un certo evento.
Per quanto riguarda il numero x di volte per il quale vogliamo calcolare la probabilità di manifestarsi dell’evento preso in considerazione può essere inferiore o superiore alla media e non troviamo dei limiti superiori.
So che presentata in questo modo questo tipo di probabilità risulta di difficile comprensione.
Quindi specifichiamo proseguendo nel blog tutte le caratteristiche che ve la faranno comprendere al meglio.
ESEMPI DI APPLICAZIONE DELLA DISTRIBUZIONE DI POISSON
Esempi di applicazione della variabile casuale di Poisson possono essere relative a:
- Numero di chiamate in call center
- Quantità di persone che entrano in un negozio
- Ammontare di gol segnati da un giocatore.
Tutti questi eventi devono essere riferiti ad una certa unità temporale (e/o spaziale) e in questa conosciamo il numero medio di volte (che chiameremo lambda) che si manifesta un certo evento.

UNITA’ SPAZIO TEMPORALE
L’unità spazio-temporale (T) è quindi un elemento essenziale per poter applicare la distribuzione di Poisson.
Quando prendiamo a riferimento un certo evento e il numero medio di volte in cui questo si manifesta dobbiamo conoscere con esattezza anche il tempo o eventualmente lo spazio in cui questo si manifesta.
Quando ad esempio diciamo:
In un call center chiamano 6 persone all’ora
Quelle 6 persone entrano in un negozio (unità spazio) nell’arco temporale di un’ora (unità tempo).

MEDIA E VARIANZA (LAMBDA)
Il numero di volte il cui l’evento si verifica nell’unità spazio temporale è la media di questa distribuzione.
Quindi ritornando all’esempio di prima:
In un call center chiamano 6 persone all’ora
In realtà intendiamo dire:
In un call center entrano mediamente 6 persone in un’ora.
Possiamo indicare questo numero medio volte con la lettera greca lambda.
La cosa interessante è che lambda all’interno della distribuzione di Poisson non rappresenta solamente il numero medio, ma anche la varianza.
Io mi immagino che questo avvenga perché è possibile vedere una certa equi distribuzione nel manifestarsi dell’evento.
Per cui se ad esempio immaginiamo di dimezzare l’unità spazio-temporale dimezzeremo anche lambda.

ASSOCIAZIONE TRA LAMBDA E UNITA’ SPAZIO-TEMPORALE
In conclusione il valore della media-varianza lambda e il valore dell’unità spazio-temporale sonotra di loro strettamente connessi.
A tal punto che non avrebbe proprio senso parlare del lambda senza la corrispondente unità spazio-temporale T.
Riprendiamo ancora per un attimo l’esempio-cavia del call center
In un call center chiamano 6 persone all’ora
Se in questo esempio raddoppiamo il tempo in cui l’evento si manifesta mediamente, andremo a raddoppiare anche il numero di persone (lambda).
Quindi potremo dire che in 2 ore entreranno mediamente il doppio delle persone, ovvero 12.
Analogamente in 4 ore entrano 24 persone e così via.
Se scendiamo nei sotto multipli e dividiamo il tempo per 2, divideremo anche il numero di persone medio per 2.
Quindi diremo che in mezz’ora entrano mediamente la metà delle persone ovvero 3.

FORMULA DELLA DISTRIBUZIONE DI POISSON
La formula per calcolare la probabilità che l’evento preso in considerazione si manifesti esattamente x di volte nella distribuzione di Poisson è:
$$ P(x) = e ^{- \lambda} \cdot \frac{\lambda^x}{ x!} $$
Con lambda che rappresenta il numero medio di volte in cui si manifesta l’evento e il numero e, che è il numero di Nepero con e=2,718281…
La variabile casuale x “numero di volte in cui si manifesta l’evento” assume valori interi che vanno da zero fino ad arrivare potenzialmente all’infinito.
Il senso è che i valori della x possono essere sia minori che maggiori di lambda.
Prendendo sempre a riferimento il caso in cui in un call center chiamino 6 persone all’ora non è infatti escluso il fatto che in un’ora possano entrare 4,5, o 2 persone.
Altrettanto è vero che in una giornata particolarmente intensa ne potremmo avere 10 , ma anche 15 o 20.
Qualcuno potrebbe anche pensare che oltre un certo numero non sarebbe certamente possibile superare un certo numero.
Questo è assolutamente vero, ma se provate a calcolare con la formula la probabilità di avere 100 persone vi garantisco che trovereste una probabilità talmente bassa che non avreste neanche il coraggio di prenderla in considerazione.

IMPARA LA STATISTICA ED IL CALCOLO DELLE PROBABILITÀ
scopri tutto quello che c’è da sapere sul calcolo delle probabilità.
Comincia subito il tuo viaggio alla scoperta di questa intrigante materia.
ESEMPIO DI DISTRIBUZIONE DI POISSON
Facciamo un esempio calcistico dell’applicazione della distribuzione Poisson.
Siccome sono un o sfegatato tifoso rossonero e in questi due anni segnati dal Covid-19 c’è stata la rinascita del Milan, non potevo fare che l’esempio sul giocatore-leader Zlatan Ibrahimovic.
Sappiamo che il giocatore del Milan Zlatan Ibrahimovic è in grado di segnare mediamente
20 gol nell’arco di una stagione (24 partite).
Qual è la probabilità che nelle prossime 6 partite giocate segni esattamente 6 gol?

DATI:
Per prima cosa riportiamo i dati iniziali.
$$ \lambda = 20 $$
$$ T = 1 \ \text{stagione} = 24 \ \text{partite} $$
Ovviamente il numero medio di gol indicato come lambda è riferito a una stagione, che a detta dei dati si sviluppa in 24 partite.
Ora dobbiamo notare chela domanda ci chiede di calcolare la probabilità che il rossonero segni esattamente 6 gol nell’arco delle prossime 6 partite giocate.
Per tale motivo adeguiamo il numero medio di gol a sei partite, ovvero un quarto di stagione.
In sei partite il numero medio di gol sarà un quarto di 20, ovvero 5.
Questo sarà il nostro nuovo valore di lambda.
$$ \lambda’ = \frac{1}{4} \cdot 20 = 5 $$
$$ T’ = \frac{1}{4} \ \text{di stagione} = 6 \ \text{partite} $$
CALCOLI
Adesso che abbiamo tutti i dati che ci servono applichiamo la nota formula di Poisson per calcolare la probabilità:
$$ P(x) = e ^{- \lambda} \cdot \frac{\lambda ^x}{ x!} $$
Inseriamo al posto della x il numero 6 e al posto di lambda il nuovo valore 5.
$$ P(6) = e ^{- 5} \cdot \frac{5^6}{ 6!} = 0,1462 = 14,62\%$$
La probabilità che Zlatan segni esattamente sei gol nel prossimo quarto di stagione è pari a 14,62%.
CON EXCEL
Fare questo calcolo con Excel è veramente molto semplice.
Una volta che abbiamo scritto in due celle separate i numeri 5 e 6, andiamo in una terza cella e scriviamo la formula:
$$ = \text{DISTRIB.POISSON} (5;6;FALSO) $$
Dove la scrittura FALSO sta ad indicare che non vogliamo il valore cumulato della probabilità, ovvero il valore della funzione di ripartizione.

FUNZIONE DI DISTRIBUZIONE DI PROBABILITA’
Per ricavare i valori della distribuzione di probabilità applichiamo la formula ormai stranota:
$$ P(\color{blue}{x}) = e ^{- \color{red}{\lambda}} \cdot \frac{\color{red}{\lambda}^\color{blue}{x}}{ \color{blue}{x}!} $$
Con il valore della media-varianza lambda pari a 5
$$\color{red}{\lambda} = 5 $$
E al posto della x inseriamo “tutte” le modalità assunte dalla variabile “numero di gol segnati da Ibrahimovic”.
Ovviamente è chiaro che non possiamo rappresentarle “tutte” dal momento che la distribuzione non presenta un limite superiore.
Magari arriviamo fino al 10.
$$ P(\color{blue}{0}) = e ^{- \color{red}{5}} \cdot \frac{\color{red}{5}^\color{blue}{0}}{ \color{blue}{0}!} $$
$$ P(\color{blue}{1}) = e ^{- \color{red}{5}} \cdot \frac{\color{red}{5}^\color{blue}{1}}{ \color{blue}{1}!} $$
$$ P(\color{blue}{2}) = e ^{- \color{red}{5} }\cdot \frac{\color{red}{5}^\color{blue}{2}}{ \color{blue}{2}!} $$
$$ \dots $$
$$ P(\color{blue}{10}) = e ^{- \color{red}{5}} \cdot \frac{\color{red}{5}^\color{blue}{10}}{ \color{blue}{10}!} $$
$$ \dots $$
GRAFICO
Nella tabella sottostante vi ho riportato i valori assunti dalla probabilità quando la x va da zero a dieci.
In parte possiamo vedere il grafico associato.
Sull’asse delle ascisse troviamo i valori assunti dalla variabile x mentre sull’asse delle ordinate troviamo i valori della probabilità p(x).
Il grafico che vedete è stato costruito con Excel.

SCOPRI IL MONDO DELLE PROBABILITÀ
Comincia un fantastico viaggio alla scoperta della probabilità
Accedi ai corsi di statistica e impara a destreggiarti nei labirinti dei calcoli della statistica probabilistica.
scopri il canale Youtube
L’ARTICOLO TI è PIACIUTO ?
Se questo contenuto ti è piaciuto e vorresti che anche altri utenti possano goderne di questo ed altri ancora sostieni il progetto offrendomi un semplice caffè virtuale
Questo semplice gesto per me significa moltissimo e può essere un forte impulso per lo sviluppo di tutto il progetto di divulgazione matematica
19 risposte
Ciao Andrea, se mediamente passano 20 in un ora, qual’ è la probabilità che ne passino almeno 5 in 10 minuti ?
grazie caro.
Ciao Luisella, vedo che sei una vera appassionata di Poisson;)
La caratteristica del calcolo delle probabilità con Poisson è che si può calcolare la probabilità che un evento si manifesti esattamente x volte se conosciamo il numero medio di volte in cui questo evento si manifesta in una data unità temporale.
Chiamiamo questo numero medio lambda (λ).
La formula per il calcolo della probabilità è:
P(x)=e^(-λ)·(λ^x)/x!
Tale quantità è strettamente legata all’unità temporale cui è associata.
Nel tuo caso sai che in arco temporale di un’ora passano 20 (presumo macchine o persone).
quindi il lambda associato all’ora è pari a 20.
la domanda si riferisce però ad una unità temporale di 5 minuti che rappresentano un dodicesimo (1/12) di un’ora.
Per questo motivo anche il numero di persone medio che passerà in 5 minuti sarà 1/12 del numero di persone che passano in un’ora.
Perciò il nostro nuovo lambda è: 20/12=1,67
adesso non ci resta che calcolare la probabilità che in un’ora passino esattamente 3 persone data da:
P(3)=e^(-1,67)·1,67^3/3!=0,1457.
La probabilità risulta pari al 14,57%
Ciao Andrea, ti ringrazio moltissimo per questa e tutte le tue utilissime lezioni. Volevo solo farti notare che nel riportare il valore del numero di Nepero hai commesso un piccolo errore, sicuramente per colpa di una svista! Ti consiglio di correggere il valore da te inserito (2,8182) con quello corretto (2,7182…) onde evitare che chi applicherà la formula, prendendo da qui il valore della costante, incappi in un lieve errore nel risultato!
Ciao Lorenzo, Grazie
Provvedo subito a correggere 😉
Un manoscritto è inviato per la stampa a una copisteria che ha 3 dattilografi A, B e C. Se è dattiloscritto da A, il numero di errori è distribuito come Poisson di parametro lambda = 2, se lo dattiloscrive B il numero di errori è di Poisson di parametro beta = 3 mentre se lo fa C è di Poisson di parametro gamma = 3:4. Sia X il numero di errori nel dattiloscritto, assumendo che ciascun dattilografo abbia la stessa probabilità di eseguire
il lavoro, determinare Var(X)
Ciao lorenzo immagino che il parametro gamma valga 4
In questo caso è come se dividi una popolazione in tre gruppi di cui conosci le medie di ogni gruppo e anche le varianze dal momento che in Poisson media = varianza
Io sfrutterei un teorema secondo cui la varianza di una variabile quando si conoscono le medie e le varianze dei gruppi è data da
VARIANZA TOTALE = varianza delle medie + media delle varianza
La media delle varianza è data da
M(var) = 2*(1/3)+ 3*(1/3)+ 4*(1/3)= 3
Dall’altro lato possiamo calcolare la varianza delle medie
Var(M) = 2^2*(1/3) + 3^2*(1/3) + 4^2*(1/3) – 3^2= …
Sommando questi due valori ottieni la varianza complessiva della X
Ok, quindi è sbagliato scrivere Var(M)=2*(1/9)+3*(1/9)+4*(1/9) ?
Si perché la varianza è la media dei quadrati meno il quadrato della media
Var = somma (x^2*p) – media ^2
Ok grazie
La società che gestisce le autostrade vuole analizzare la viabilità nelle ore di punta sul percorso più trafficato. Considerato che mediamente transitano 3 vetture al minuto, la probabilità che transitano più di 120 vetture in un’ora è? (La risposta è: 0,6)
Ciao Andrea, ho riscontrato dei problemi nel calcolo di questo problema perchè di base questa tipologia di esercizi la risolvo con la poisson, solo che dovrei fare circa 120 calcoli, ho visto sul mio manuale che si può anche svolgerla approssimandola come una normale, ma non mi viene lo stesso risultato. Sapresti aiutarmi
Ti ringrazio in anticipo, i tuoi video mi hanno salvato <3
Ciao Alessandro
In questo caso puoi applicare il teorema del limite centrale che approssima la Poisson ad una distribuzione normale
Nel caso specifico in un’ora il valore di lambda è 3*60=180
Dunque puoi tranquillamente usare una normale di media e varianza 180
Il valore standardizzato z è dunque
Z= (120-180)/radq(180)
Siccome questo valore è negativo se disponi di sole tavole a valori positivi cerchi il valore opposto
In corrispondenza di tale valore dovresti leggere nelle tavole e trovare la probabilità corrispondente
A me personalmente esce 4,47
In corrispondenza di questi valore la probabilità è circa il 100%
Dunque presumo che nel testo vi sia un errore
ok grazie mille, anche io mi trovavo questo risultato usando la normale, però il testo mi diceva che il risultato fosse 0,6, ora che mi hai dato anche tu conferma sono più tranquillo, gentilissimo e velocissimo a rispondere, sei unico.
Di nulla 😉
Supponiamo che i fogli di un certo tipo di legno compensato abbiano una media di una screpolatura ogni 50 m².
Assumiamo che il numero di screpolature sia distribuito secondo una poissoniana.
Qual è la probabilità che un foglio 4m × 8m
– Non abbia difetti
– Abbia al massimo 1 difetto
Ciao Vittoria
In primo luogo abbiamo che si presenta una screpolatura ogni 50 metri quadri
Dunque possiamo ottenere il numero di screpolature medie su un singolo metro quadrato facendo 1/50=0,02
Ora ci troviamo di fronte ad un compensato di (4×8) metri quadri, dunque 32 metri quadri
Quindi per calcolare il numero medio di screpolature su un foglio di compensato facciamo 0,02*32= 0,64
Questo è il lavoro di lambda (nella Poisson) associato ad un singolo foglio.
A questo punto applichi la formula della poisson per calcolare P(0) e P(1)
Dunque la probabilità che la variabile casuale X non abbia difetti è P(0)
Mentre la probabilità che abbia al massimo un difetto è
P(x<=1) = P(0) +P(1)
Se il 3% della lampadine prodotte da una fabbrica è difettoso, trovare le probabilità che in un campione di 100:
A) ci siano 0 lampadine difettose
B) al massimo 2 lampadine siano difettose
C) almeno 4 lampadine siano difettose
D) tra 1 e 3 lampadine siano difettose
E) determinare la media e la varianza della distribuzione delle lampadine difettose
Ciao Vittoria in questo caso la distribuzione da usare è la distribuzione binomiale
Il parametro è pigreco=0,03 e n=100
A) per calcolare il primo punto calcoli P(0) = (100 C 0) *0,03^0 * (1-0,03)^100 = 0,97^100 = …
B) al massimo due almapadine significa che usi la formula della binomiale e calcoli la somma di P(0) + P(1) + P(2)
C) almeno 4 significa P(x>=4)= 1- P(x<=3) = 1 - (P(0) +P(1) +P(2) + P(3)) D) idem: P(1)+P(2)+P(3) E ) la media = p*n = 0,03*100=3 la varianza è = n*p*(1-p) = 100*0,03*0,97=...
ciao Andrea mi aiuti in questo esercizio?
in un reparto di un grande ospedale vengono ricoverati in media 4 pazienti al giorno. Qual è la probabilità che vengano ricoverati 105 pazienti in un mese ?
So per certo che è una poisson approssimata alla distribuzione normale ma non saprei risolverla
Ciao Valentina.
Se la media di pazienti ricoverati in un giorno è 4, allora possiamo dire che in un mese mediamente ve ne sono 120 (supponendo per semplicità che ogni mese sia di 30 giorni).
Ricordiamo che la media della distribuzione di Poisson è anche varianza.
Se volessimo fare il calcolo preciso con la Poisson dovremo fare:
$$P(x=105)= e^{-105}\cdot\frac{105^{120}}{120!}$$
Se provi però a fare questo calcolo con una tradizionale calcolatrice scientifica questo ti restituisce un errore.
Perche quella potenza al numeratore (105^120) e quel fattoriale presente al denominatore (120!) diventano troppo difficili da calcolare anche per gli esperti e aggiornati calcolatore elettronici.
Quindi ci avvaliamo proprio del teorema del limite centrale facendo approssimare la distribuzione di Poisson a quella normale.
Ci servono pertanto i due parametri che caratterizzano questa distribuzione, ovvero la media e la deviazione standard.
Per la media usiamo il 105 (che è il lambda della Poisson), mentre la deviazione standard possiamo usare la radice quadrata di 105 (la media e la varianza coincidono).
$$\text{distrib. normale}:\quad \mu=105\quad \sigma=\sqrt{105}\simeq10,247$$
Troviamo quindi il valore standardizzato del 120 (che è il valore che ci interessa ai fini della probabilità):
$$z=\frac{x-\mu}{\sigma}=\frac{120-105}{10,247}=0,4879$$
Se non vogliamo usare i calcoli dell’interpolazione lineare possiamo usare 0,49
Adesso presta molta attenzione a questa parte di testo!
Se volgiamo calcolare la probabilità che la z (ovvero il valore standardizzato della x) in un punto, questa vale zero!!!
Infatti si tratta di determinare l’area di un rettangolo infinitesimo, (ovvero con base praticamente nulla).
Quindi zero è la risposta alla domanda!.
$$P(z=0,49)=0$$
La domanda avrebbe più senso se posta nel seguente modo:
Qual è la probabilità che il numero di pazienti in un mese risulti INFERIORE A 120?
Oppure: Qual è la probabilità che in un mese il numero di pazienti SIA SUPERIORE a 105 (o anche ALMENO 120)?
Se usiamo infatti l’approccio dell’approssimazione (teorema del limite centrale) non dovrebbe esservi differenza tra maggiore e maggiore-uguale.
Rispondiamo ad esempio alla prima domanda:
Qual è la probabilità che il numero di pazienti in un mese risulti INFERIORE A 120 (o AL MASSIMO DI 120)?
La domanda equivale a questa: qual è la probabilità che scelto a caso un valore standardizzato z questo risulti inferiore (o inferiore-uguale) a 0,49?
Dobbiamo quindi vedere quale è l’area compresa tra l’asse z e la funzione gaussiana (normale standardizzata) precedente al valore 0,49.
Possiamo quindi prendere le tavole della distruzione con area calcolata precedente dal valore – infinito (o -4 cambia poco).
Sulla prima colonna cerchiamo 0,4, mentre sulla prima riga cerchiamo 0,09: incrociando i valore troviamo la soluzione ricercata che è 0,6879.
$$P(z<0,49)=0,6879$$
Quindi abbiamo una probabilità di circa il 69%.
Ovviamente se la domanda fosse stato MAGGIORE DI (o ALMENO) allora avremmo preso la probabilità complementare, ovvero all'incirca il 31%.
$$P(z>0,49)1-0,6879=0,3121$$