Skip to main content

https://youtu.be/3C-x0W6bJdU

DEFINIZIONE

La distribuzione di Poisson si utilizza è una distribuzione casuale discreta di media e varianza identiche che si utilizza per calcolare la probabilità che un certo evento si manifesti esattamente x volte in una certa unità spazio-temporale.

La prima caratteristica importante è dunque che la media deve essere uguale alla varianza.

La seconda caratteristica è che il calcolo della probabilità è circoscritto ad una certa unità spazio-temporale.

Ovvero che identifichiamo che in un certo intervallo temporale o spaziale il numero medio di volte in cui si manifesta un certo evento.

Per quanto riguarda il  numero x di volte  per il quale vogliamo calcolare la probabilità di manifestarsi dell’evento preso in considerazione può essere inferiore o superiore alla media e non troviamo dei limiti superiori.

So che presentata in questo modo questo tipo di probabilità risulta di difficile comprensione.

Quindi specifichiamo proseguendo nel blog tutte le caratteristiche che ve la faranno comprendere al meglio.

ESEMPI DI APPLICAZIONE

Esempi di applicazione della variabile casuale di Poisson possono essere relative a:

  • Numero di chiamate in call center 
  • Quantità di persone che entrano in un negozio
  • Ammontare di gol segnati da un giocatore.

Tutti questi eventi devono essere riferiti ad una certa unità temporale (e/o spaziale) e in questa conosciamo il numero medio di volte (che chiameremo lambda) che si manifesta un certo evento.

UNITA’ SPAZIO TEMPORALE

L’unità spazio-temporale (T) è quindi un elemento essenziale per poter applicare la distribuzione di Poisson.

Quando prendiamo a riferimento un certo evento e il numero medio di volte in cui questo si manifesta dobbiamo conoscere con esattezza anche il tempo o eventualmente lo spazio in cui questo si manifesta.

Quando ad esempio diciamo:

In un call center chiamano 6 persone all’ora

Quelle 6 persone entrano in un negozio (unità spazio) nell’arco temporale di un’ora (unità tempo).

MEDIA E VARIANZA (LAMBDA)

Il numero di volte il cui l’evento si verifica nell’unità spazio temporale è la media di questa distribuzione.

Quindi ritornando all’esempio di prima:

In un call center chiamano 6 persone all’ora

In realtà intendiamo dire:

In un call center entrano mediamente 6 persone in un’ora.

Possiamo indicare questo numero medio volte con la lettera greca lambda.

La cosa interessante è che lambda all’interno della distribuzione di Poisson non rappresenta solamente il numero medio, ma anche la varianza.

Io mi immagino che questo avvenga perché è possibile vedere una certa equi distribuzione nel manifestarsi dell’evento.

Per cui se ad esempio immaginiamo di dimezzare l’unità spazio-temporale dimezzeremo anche lambda. 

ASSOCIAZIONE TRA LAMBDA E UNITA’ SPAZIO-TEMPORALE

In conclusione il valore della media-varianza lambda e il valore dell’unità spazio-temporale sonotra di loro strettamente connessi.

A tal punto che non avrebbe proprio senso parlare del lambda senza la corrispondente unità spazio-temporale T.

Riprendiamo ancora per un attimo l’esempio-cavia del call center

In un call center chiamano 6 persone all’ora

Se in questo esempio raddoppiamo il tempo in cui l’evento si manifesta mediamente, andremo a raddoppiare anche il numero di persone (lambda).

Quindi potremo dire che in 2 ore entreranno mediamente il doppio delle persone, ovvero 12.

Analogamente in 4 ore entrano 24 persone e così via.

Se scendiamo nei sotto multipli e dividiamo il tempo per 2, divideremo anche il numero di persone medio per 2.

Quindi diremo che in mezz’ora entrano mediamente la metà delle persone ovvero 3.

FORMULA DELLA POISSON

La formula per calcolare la probabilità che l’evento preso in considerazione si manifesti esattamente x di volte nella distribuzione di Poisson è:

Con lambda che rappresenta il numero medio di volte in cui si manifesta l’evento e il numero e, che è il numero di Nepero con e=2,718281…

La variabile casuale x “numero di volte in cui si manifesta l’evento” assume valori interi che vanno da zero fino ad arrivare potenzialmente all’infinito.

Il senso è che i valori della x possono essere sia minori che maggiori di lambda.

Prendendo sempre a riferimento il caso in cui in un call center chiamino 6 persone all’ora non è infatti escluso il fatto che in un’ora possano entrare 4,5, o 2 persone.

Altrettanto è vero che in una giornata particolarmente intensa ne potremmo avere 10 , ma anche 15 o 20.

Qualcuno potrebbe anche pensare che oltre un certo numero non sarebbe certamente possibile superare un certo numero.

Questo è assolutamente vero, ma se provate a calcolare con la formula la probabilità di avere 100 persone vi garantisco che trovereste una probabilità talmente bassa che non avreste neanche il coraggio di prenderla in considerazione.

ESEMPIO

Facciamo un esempio calcistico dell’applicazione della distribuzione Poisson.

Siccome sono un o sfegatato tifoso rossonero e in questi due anni segnati dal Covid-19 c’è stata la rinascita del Milan, non potevo fare che l’esempio sul giocatore-leader Zlatan Ibrahimovic.

Sappiamo che il giocatore del Milan Zlatan Ibrahimovic è in grado di segnare mediamente 

20 gol nell’arco di una stagione (24 partite).

Qual è la probabilità che nelle prossime 6 partite giocate segni esattamente 6 gol?

DATI:

Per prima cosa riportiamo i dati iniziali.

Ovviamente il numero medio di gol indicato come lambda è riferito a una stagione, che a detta dei dati si sviluppa in 24 partite.

Ora dobbiamo notare chela domanda ci chiede di calcolare la probabilità che il rossonero segni esattamente 6 gol nell’arco delle prossime 6 partite giocate.

Per tale motivo adeguiamo il numero medio di gol a sei partite, ovvero un quarto di stagione.

In sei partite il numero medio di gol sarà un quarto di 20, ovvero 5.

Questo sarà il nostro nuovo valore di lambda.

CALCOLI

Adesso che abbiamo tutti i dati che ci servono applichiamo la nota formula di Poisson per calcolare la probabilità:

Inseriamo al posto della x il numero 6 e al posto di lambda il nuovo valore 5.

La probabilità che Zlatan segni esattamente sei gol nel prossimo quarto di stagione è pari a 14,62%.

CON EXCEL

Fare questo calcolo con Excel è veramente molto semplice.

Una volta che abbiamo scritto in due celle separate i numeri 5 e 6, andiamo in una terza cella e scriviamo la formula:

Dove la scrittura FALSO sta ad indicare che non vogliamo il valore cumulato della probabilità, ovvero il valore della funzione di ripartizione.

FUNZIONE DI DISTRIBUZIONE DI PROBABILITA’

Per ricavare i valori della distribuzione di probabilità applichiamo la formula ormai stranota:

Con il valore della media-varianza lambda pari a 5

al posto della x inseriamo “tutte” le modalità assunte dalla variabile “numero di gol segnati da Ibrahimovic”.

Ovviamente è chiaro che non possiamo rappresentarle “tutte” dal momento che la distribuzione non presenta un limite superiore.

Magari arriviamo fino al 10.

GRAFICO

Nella tabella sottostante vi ho riportato i valori assunti dalla probabilità quando la x va da zero a dieci.

In parte possiamo vedere il grafico associato.

Sull’asse delle ascisse troviamo i valori assunti dalla variabile x mentre sull’asse delle ordinate troviamo i valori della probabilità p(x).

Il grafico che vedete è stato costruito con Excel.

SCOPRI DI PIU’

Per scoprire di più sulla variabile casuale di Poisson e le sue applicazioni  ho realizzato un video corso che affronta in modo dettagliato questo argomento.

È il secondo video-corso della saga statistica di chiama “PROBABILITA‘” ed è il primo dei sei corsi che costituiscono la saga della Statistica aziendale.

Nel corso verranno trattati i temi relativi alla probabilità.

Si parte dal concetto di combinazioni e disposizioni e dalla definizione di probabilità.

Dopodiché si passerà alla distinzione tra eventi indipendenti e dipendenti.

Nell’ambito di questi ultimi si presenterà il teorema di Bayes.

La parte successiva è destinata alle variabili casuali discrete e continue.

Per le prime vedremo la binomiale e la Poisson.

Per le seconde invece la v.c. normale.

La parte finale è dedicata al teorema del limite centrale che riassume in un solo grande argomento tutta la probabilità.

Per ogni argomento troverete sia la parte teorica che la parte pratica.

Clicca per scoprire il corso.

CORSO DI STATISTICA COMPLETO

Il corso di statistica completo è composto da tre volumi:

  • Statistica base (descrittiva)
  • Probabilità
  • Inferenza e test di ipotesi

Il tutto è completato con un eserciziario in cui troverete tanti test di domande universitarie:

Contattami per scoprire di più

andreailmatematico@gmail.com

17 Comments

  • luisella magni ha detto:

    Ciao Andrea, se mediamente passano 20 in un ora, qual’ è la probabilità che ne passino almeno 5 in 10 minuti ?
    grazie caro.

    • Andrea ha detto:

      Ciao Luisella, vedo che sei una vera appassionata di Poisson;)
      La caratteristica del calcolo delle probabilità con Poisson è che si può calcolare la probabilità che un evento si manifesti esattamente x volte se conosciamo il numero medio di volte in cui questo evento si manifesta in una data unità temporale.
      Chiamiamo questo numero medio lambda (λ).
      La formula per il calcolo della probabilità è:
      P(x)=e^(-λ)·(λ^x)/x!
      Tale quantità è strettamente legata all’unità temporale cui è associata.
      Nel tuo caso sai che in arco temporale di un’ora passano 20 (presumo macchine o persone).
      quindi il lambda associato all’ora è pari a 20.
      la domanda si riferisce però ad una unità temporale di 5 minuti che rappresentano un dodicesimo (1/12) di un’ora.
      Per questo motivo anche il numero di persone medio che passerà in 5 minuti sarà 1/12 del numero di persone che passano in un’ora.
      Perciò il nostro nuovo lambda è: 20/12=1,67
      adesso non ci resta che calcolare la probabilità che in un’ora passino esattamente 3 persone data da:
      P(3)=e^(-1,67)·1,67^3/3!=0,1457.
      La probabilità risulta pari al 14,57%

  • Lorenzo ha detto:

    Ciao Andrea, ti ringrazio moltissimo per questa e tutte le tue utilissime lezioni. Volevo solo farti notare che nel riportare il valore del numero di Nepero hai commesso un piccolo errore, sicuramente per colpa di una svista! Ti consiglio di correggere il valore da te inserito (2,8182) con quello corretto (2,7182…) onde evitare che chi applicherà la formula, prendendo da qui il valore della costante, incappi in un lieve errore nel risultato!

  • Lorenzo ha detto:

    Un manoscritto è inviato per la stampa a una copisteria che ha 3 dattilografi A, B e C. Se è dattiloscritto da A, il numero di errori è distribuito come Poisson di parametro lambda = 2, se lo dattiloscrive B il numero di errori è di Poisson di parametro beta = 3 mentre se lo fa C è di Poisson di parametro gamma = 3:4. Sia X il numero di errori nel dattiloscritto, assumendo che ciascun dattilografo abbia la stessa probabilità di eseguire
    il lavoro, determinare Var(X)

    • Andrea ha detto:

      Ciao lorenzo immagino che il parametro gamma valga 4
      In questo caso è come se dividi una popolazione in tre gruppi di cui conosci le medie di ogni gruppo e anche le varianze dal momento che in Poisson media = varianza
      Io sfrutterei un teorema secondo cui la varianza di una variabile quando si conoscono le medie e le varianze dei gruppi è data da
      VARIANZA TOTALE = varianza delle medie + media delle varianza
      La media delle varianza è data da
      M(var) = 2*(1/3)+ 3*(1/3)+ 4*(1/3)= 3
      Dall’altro lato possiamo calcolare la varianza delle medie
      Var(M) = 2^2*(1/3) + 3^2*(1/3) + 4^2*(1/3) – 3^2= …
      Sommando questi due valori ottieni la varianza complessiva della X

  • Alessandro ha detto:

    La società che gestisce le autostrade vuole analizzare la viabilità nelle ore di punta sul percorso più trafficato. Considerato che mediamente transitano 3 vetture al minuto, la probabilità che transitano più di 120 vetture in un’ora è? (La risposta è: 0,6)

    Ciao Andrea, ho riscontrato dei problemi nel calcolo di questo problema perchè di base questa tipologia di esercizi la risolvo con la poisson, solo che dovrei fare circa 120 calcoli, ho visto sul mio manuale che si può anche svolgerla approssimandola come una normale, ma non mi viene lo stesso risultato. Sapresti aiutarmi

    Ti ringrazio in anticipo, i tuoi video mi hanno salvato <3

    • Andrea ha detto:

      Ciao Alessandro
      In questo caso puoi applicare il teorema del limite centrale che approssima la Poisson ad una distribuzione normale
      Nel caso specifico in un’ora il valore di lambda è 3*60=180
      Dunque puoi tranquillamente usare una normale di media e varianza 180
      Il valore standardizzato z è dunque
      Z= (120-180)/radq(180)
      Siccome questo valore è negativo se disponi di sole tavole a valori positivi cerchi il valore opposto
      In corrispondenza di tale valore dovresti leggere nelle tavole e trovare la probabilità corrispondente
      A me personalmente esce 4,47
      In corrispondenza di questi valore la probabilità è circa il 100%
      Dunque presumo che nel testo vi sia un errore

      • Alessandro ha detto:

        ok grazie mille, anche io mi trovavo questo risultato usando la normale, però il testo mi diceva che il risultato fosse 0,6, ora che mi hai dato anche tu conferma sono più tranquillo, gentilissimo e velocissimo a rispondere, sei unico.

  • Vittoria Magnarello ha detto:

    Supponiamo che i fogli di un certo tipo di legno compensato abbiano una media di una screpolatura ogni 50 m².
    Assumiamo che il numero di screpolature sia distribuito secondo una poissoniana.
    Qual è la probabilità che un foglio 4m × 8m

    – Non abbia difetti
    – Abbia al massimo 1 difetto

    • Andrea ha detto:

      Ciao Vittoria
      In primo luogo abbiamo che si presenta una screpolatura ogni 50 metri quadri
      Dunque possiamo ottenere il numero di screpolature medie su un singolo metro quadrato facendo 1/50=0,02
      Ora ci troviamo di fronte ad un compensato di (4×8) metri quadri, dunque 32 metri quadri
      Quindi per calcolare il numero medio di screpolature su un foglio di compensato facciamo 0,02*32= 0,64
      Questo è il lavoro di lambda (nella Poisson) associato ad un singolo foglio.
      A questo punto applichi la formula della poisson per calcolare P(0) e P(1)
      Dunque la probabilità che la variabile casuale X non abbia difetti è P(0)
      Mentre la probabilità che abbia al massimo un difetto è
      P(x<=1) = P(0) +P(1)

  • Vittoria Magnarello ha detto:

    Se il 3% della lampadine prodotte da una fabbrica è difettoso, trovare le probabilità che in un campione di 100:
    A) ci siano 0 lampadine difettose
    B) al massimo 2 lampadine siano difettose
    C) almeno 4 lampadine siano difettose
    D) tra 1 e 3 lampadine siano difettose
    E) determinare la media e la varianza della distribuzione delle lampadine difettose

    • Andrea ha detto:

      Ciao Vittoria in questo caso la distribuzione da usare è la distribuzione binomiale
      Il parametro è pigreco=0,03 e n=100
      A) per calcolare il primo punto calcoli P(0) = (100 C 0) *0,03^0 * (1-0,03)^100 = 0,97^100 = …
      B) al massimo due almapadine significa che usi la formula della binomiale e calcoli la somma di P(0) + P(1) + P(2)
      C) almeno 4 significa P(x>=4)= 1- P(x<=3) = 1 - (P(0) +P(1) +P(2) + P(3)) D) idem: P(1)+P(2)+P(3) E ) la media = p*n = 0,03*100=3 la varianza è = n*p*(1-p) = 100*0,03*0,97=...

Leave a Reply