Skip to main content

https://youtu.be/vQTi8TyHVFA

DEFINIZIONE

La distribuzione binomiale serve per calcolare la probabilità di avere x successi in n prove indipendenti.

Per prove indipendenti intendiamo che la probabilità che tale prova abbia successo o meno non venga influenzata dalla prova precedente e non abbia a sua volta influenza sulla prova successiva.

Un esempio tipico di applicazione della distribuzione binomiale è il lancio di una moneta o di un dado.

Infatti, quando ripetiamo più volte una prova di questo tipo, immaginiamo che l’esito della prova successiva non venga influenzata da quella precedente.

Questo fa in modo che passando da una prova all’altra la probabilità che si verifichi l’evento preso in considerazione sia sempre la stessa.

ESEMPIO DEL LANCIO DI UN DADO REGOLARE

Se analizziamo ad esempio il lancio di un dado regolare e prendiamo in considerazione l’evento “esce il numero 4” possiamo attribuire facilmente la probabilità associata pari 1/6.

Questa probabilità rimarrà invariata in ogni prova, indipendentemente dal numero di lanci che effettuiamo.

FORMULA

Supponiamo che in generale dobbiamo fare n prove tra di lo indipendenti.

Vogliamo poi calcolare la probabilità che su queste n prove l’evento preso in considerazione si verifichi esattamente x volte.

Ovviamente x assumerà valore compreso tra 0 e n, quindi in tutto n+1 modalità.

La formula per calcolare n probabilità che su n prove indipendenti si abbiano x successi è la seguente.

 dove:

Ad esempio tornando al lancio del dado se vogliamo calcolare la probabilità che lanciando 5 volte un dado regolare a sei facce otteniamo esattamente 3 volte il numero 4, faremo:

Tale probabilità è pari al 12,86%.

VALORE ATTESO, VARIANZA E DEVIAZIONE STANDARD

Il valore atteso o valore medio E(x) della distribuzione binomiale è pari a:

La varianza si calcola nel seguente modo:

Per calcolare la deviazione standard o scarto quadratico medio facciamo la radice quadrata della varianza, ovvero:

Applicandolo al caso dei dadi avremo che il valore atteso è 

La varianza è pari a:

Infine calcoliamo la deviazione standard o scarto quadratico medio:

Il fatto che la deviazione standard sia uguale al valore atteso è solamente un caso.

COEFFICIENTE BINOMIALE (NEWTON) E IL FATTORIALE

Sono sicuro che molti di voi si staranno chiedendo, nel guardare la formula del calcolo della probabilità binomiale, 

quale sia il significato del valore dentro la parentesi:

Si tratta del coefficiente binomiale e si legge “n combinato x“.

Per calcolarlo usiamo la seguente formula:

Dove il simbolo ! significa fattoriale.

Il significato matematico di n! si capisce dalla seguente formula:

Quindi n! è la produttoria dei numeri naturali a partire dall’1 fino ad arrivare a n.

A parte 0! Che per la maggior parte di voi (compreso me) sembra alquanto difficile da comprendere, infatti:

Gli altri fattoriali sono molto alla portata di mano

E così via.

La caratteristica subito evidente del fattoriale è la rapida crescita.

Tale crescita è molto più forte rispetto a quella dell’esponenziale.

Se infatti osserviamo il 10! Notiamo subito che si tratta di un numero molto elevato.

Riscritto in forma esponenziale esso è pari a:

Ancora più evidente è la situazione a quando si arriva a 20 fattoriale.

Qui stiamo parlando di 2,43 miliardi di miliardi ovvero di 2,43 trilioni.

Cifre davvero pazzesche!

COEFFICIENTE BINOMIALE – ESEMPIO

Facciamo un esempio abbastanza semplice di calcolo di coefficiente binomiale, applicando la formula vista in precedenza:

Nel caso affrontato a proposito dei dadi il calcolo relativo a 5 combinato 3

Sviluppando i fattoriali avremo:

Se poi andiamo a semplificare i fattori simili otteniamo:

CALCOLATRICE

Se usate una calcolatrice ho riportato due esempi per calcolare la combinazione:

Quello che dovrebbe risultare nel quadrante è:

CON EXCEL

Anche utilizzare Excel è molto semplice.

Una volta che abbiamo riportato in due celle separate il 5 e il tre basterà usare la formula 

ESEMPIO PRATICO DI BINOMIALE

Passiamo ad un altro esempio pratico di applicazione della distribuzione binomiale:

La probabilità che il portiere del PSG Donnarumma pari un rigore è del 30%.

Se durante una stagione intera la squadra di Parigi subisce 10 rigori, qual è la probabilità che Donnarumma ne pari esattamente 4?

DATI E CALCOLI

I dati che abbiamo a disposizione sono:

Per calcolare la probabilità che Donnarumma pari esattamente 4 rigori su 10 applichiamo la formula binomiale:

Nel caso particolare avremo:

La probabilità è pari al 20%.

VALORE ATTESO, VARIANZA E DEVIAZIONE STANDARD

Chiaramente possiamo spingerci oltre, calcolando il valore atteso:

Proseguiamo  con la varianza:

Ed infine passiamo alla deviazione standard:

RIASSUNTO

Riassumendo i dati possiamo dire che abbiamo una forte probabilità che Donnarumma pari dai 3-1,45 a 3+1,45.

Per un teorema della statistica tale probabilità si aggira attorno al 70%.

FUNZIONE DI DISTRIBUZIONE DI PROBABILITA’

Se vogliamo rappresentare la funzione di distribuzione di probabilità dobbiamo calcolare le probabilità che su 10 rigori contro il nostro portierone riesca a pararne 0, 1, 2, …, fino a 10.

Ho riassunto i risultati nella tabella sottostante, che ho calcolato con Excel.

Grazie ai risultati ottenuti è possibile rappresentare la funzione di distribuzione della probabilità.

Come si può vedere dal grafico sull’asse delle x ho rappresentato i valori della nostra variabile casuale x numeri di rigori parati.

Sull’asse delle y è rappresentata la probabilità P(x).

Il grafico utilizzato è quello a bastoncini.

Si nota subito che la funzione tocca il suo massimo nel valore medio, ovvero il 3.

SCOPRI DI PIU’

Per scoprire di più sulla variabile casuale binomiale  ho realizzato un video corso che affronta in modo dettagliato questo argomento.

È il secondo video-corso della saga statistica di chiama “PROBABILITA‘” ed è il primo dei sei corsi che costituiscono la saga della Statistica aziendale.

Nel corso verranno trattati i temi relativi alla probabilità.

Si parte dal concetto di combinazioni e disposizioni e dalla definizione di probabilità.

Dopodiché si passerà alla distinzione tra eventi indipendenti e dipendenti.

Nell’ambito di questi ultimi si presenterà il teorema di Bayes.

La parte successiva è destinata alle variabili casuali discrete e continue.

Per le prime vedremo la binomiale e la Poisson.

Per le seconde invece la v.c. normale.

La parte finale è dedicata al teorema del limite centrale che riassume in un solo grande argomento tutta la probabilità.

Per ogni argomento troverete sia la parte teorica che la parte pratica.

Clicca per scoprire il corso.

CORSO DI STATISTICA COMPLETO

Il corso di statistica completo è composto da tre volumi:

  • Statistica base (descrittiva)
  • Probabilità
  • Inferenza e test di ipotesi

Il tutto è completato con un eserciziario in cui troverete tanti test di domande universitarie:

Contattami per scoprire di più

11 Comments

  • Salvatore Panucci ha detto:

    ciao andrea, sto risolvendo questo esercizio, ma a un certo punto mi blocco.
    sapendo che in California il tasso medio di disoccupazione di ogni città è del 9%, se scegliamo a caso 10 cittadini californiani, qual è la probabilità che almeno 3 di essi siano disoccupati? grazie!

    • Andrea ha detto:

      Ciao Salvatore, grazie della domanda.
      in questo caso devi applicare la distribuzione binomiale.
      In particolare i due parametri che ti servono sono:
      n (numero di prove) = 10
      pi greco (probabilità di successo) = 9%
      Siccome vuoi calcolare la probabilità che ALMENO 3 cittadini siamo disoccupati su 10, bisognerebbe calcolare:
      P(X>=3)=P(3)+P(4)+…+P(10)
      Dove x indica il numero di cittadini disoccupati.
      Sfruttando la proprietà complementare potresti anche fare:
      P(x>=3)=1-(P(0)+P(1)+P(2)).
      Nella distribuzione binomiale abbiamoche.
      P(0)=10C0·0,09^0·0,91^10=0,00000…
      P(1)=10C1·0,09^1·0,91^9=0,0000…
      P(2)=10C2·0,09^2·0,91^8=0,000…
      Quindi la probabilità è prossima al 100%
      Se vuoi fare questo calcolo con Excel fai:
      P(x>=3)=1-DISTRIB.BINOMIALE.N(2;10; 0,09; VERO)

      • davide ha detto:

        Salve Signor Andrea,
        Mi piacerebbe chiederle come faccio, in una variabile casuale binomiale, a trovare n(numero di prove ripetute) conoscendo varianza=1.6 e probabilità di successo=0.8 ?

        grazie mille per l’aiuto

        • Andrea ha detto:

          Ciao Davide,
          Ricorda che nella distribuzione binomiale la varianza è pari al prodotto tra il numero delle prove,la probabilità di successo e quella di insuccesso.
          Matematicamente scriviamo
          VAR=n*p*(1-p)
          Se vogliamo ricavare Napoli chiamo la formula inversa
          n=VAR/(p*(1-p))
          Sostituendo i numeri abbiamo che:
          n = 1,6/(0,8*0,2)=10
          Il numero delle prove è pari a 10

  • Tania ha detto:

    Ciao Signor Andrea,

    Non riesco a svolgere tale esercizio. So solo che si dovrebbe risolvere con il teorema dei grandi numeri.
    “Calcola quanti lanci di un dado occorre effettuare affinché la frequenza relativa del numero di volte in cui esce il 6 differisca per non più del 5% dal valore medio teorico, considerando il grado di fiducia del 90.”

    Successivamente ho anche altri esercizi come un esercizio che si dovrebbe svolgere con le catene di Markov, ma ho difficoltà:
    “si lancia un dado per 1200 volte. Stima la probabilità massima che il numero di volte in cui esce 6 differisca per più del 4% del valor teorico medio”

    Grazie mille per il suo aiuto.

    Tania

  • Tania ha detto:

    Inoltre, ho anche altri esercizi come questi:
    1) Una macchina produce viti la cui lunghezza media dovrebbe essere 0.15 cm. Per una verifica della precisione della macchina vengono accuratamente misurate 15 viti e si ottiene una media di 0.144 cm con scarto quadratico medio di 0.02 cm. Determina il valore della t di Student sulla quale verificare l’ipotesi che le differenze riscontrate non siano significative.

    2)Si sa che la percentuale di promossi all’esame di stato è del 98%. Dei 64 candidati di una scuola ne sono stati respinti 2. Calcolare il valore della variabile statistica normalizzata z sulla quale è possibile verificare l’ipotesi che non c’è differenza significativa tra i dati particolari e quelli generali.

    Grazie mille per il suo aiuto.

    Tania

    • Andrea ha detto:

      Ciao Tania.
      Queste domande si riferiscono entrambe a test di ipotesi,
      in particolare al calcolo delle statistiche test.
      Andrebbero quindi poste nella sezione degli articoli di questa sezione appunto.
      Comunque vediamo di rispondere anche qui.
      Per calcolare una statistica test dobbiamo tenere presente che ci troviamo di fronte ad un test di ipotesi.
      In entrambi i casi che hai riportato si tratta di test bidirezionali, che sono stato impostati secondo questa logica:
      H0: media = media pop.
      H1: media≠ media pop.

      H0 denota l’ipotesi nulla, mentre H1 quella alternativa.
      Per calcolare la statistica test , Ovvero il dato standardizzato)
      Sia nel caso di test su una media (primo esempio)
      Sia nel caso di test su una proporzione (secondo esempio)
      Ricorriamo alla seguente formula di standardizzazione
      STAT_TEST = (DATO POP. – DATO CAMP.) / SE
      il DATO POP è la media o la proporzione attribuita alla popolazione
      il DATO CAMP. è la media o la prop. rilevata nel campione
      SE è l’errore standard.
      Ora rispondiamo in modo più preciso ai due questi.

      1) Una macchina produce viti la cui lunghezza media dovrebbe essere 0.15 cm. Per una verifica della precisione della macchina vengono accuratamente misurate 15 viti e si ottiene una media di 0.144 cm con scarto quadratico medio di 0.02 cm. Determina il valore della t di Student sulla quale verificare l’ipotesi che le differenze riscontrate non siano significative.

      La statistica test è:

      T_TEST = (MEDIA POP: – MEDIA CAMP.)/SE
      MEDIA POP: = 0,15
      MEDIA CAMP. = 0,144
      SE = sigma/√n = 0,02/√15 = 0,00516398

      Quindi: T_TEST = (0,15 – 0,144)/0,00516398 = -1,1619
      Il che significa che il tuo dato campionario dista di 1,1619 SE rispetto alla media pop.
      In corrispondenza di questo valore il p-value risulta tra il 25% e il 30%.
      Tale valore indica ua propensione molto forte ad accettare l’ipotesi nulla.

      Passiamo al secondo quesito
      2)Si sa che la percentuale di promossi all’esame di stato è del 98%. Dei 64 candidati di una scuola ne sono stati respinti 2. Calcolare il valore della variabile statistica normalizzata z sulla quale è possibile verificare l’ipotesi che non c’è differenza significativa tra i dati particolari e quelli generali.

      In questo caso il test riguarda una proporzione.
      La statistica test dunque è:

      Z-TEST = (PROP. CAMP – PROP.POP. ) / SE
      PROP. POP. = 0,98
      PROP. CAMP. =1- 2/64 =1 – 0,0125 = 0,9875
      SE = √(PROP. POP*(1-PROP.POP)/n) = √(0,98*(1-0,98)/64) = 0,0175

      Dunque la statistica test è:

      Z-TEST = (PROP. CAMP – PROP.POP. ) / SE
      Z-TEST = (0,9875 – 0,98) / 0,4285

      Utilizzando le tavole siamo in grado di rilevare che il p-value associato a questo test è del 67%.
      Quindi accettiamo senza ombra di dubbio l’ipotesi secondo cui nella popolazione la percentuale dei promossi sia pari al 98%.

  • Tania ha detto:

    Buonasera Signor Andrea,
    mi scuso se Le invio tutti questi esercizi, ma sinceramente ho difficoltà a svolgerli.
    Ho provato a cercare anche su internet, ma non riesco a trovare esercizi simili. Mi può aiutare per favore a risolverli?
    1) catene di markov: “si lancia un dado per 1200 volte. Stima la probabilità massima che il numero di volte in cui esce 6 differisca per più del 4% del valor teorico medio.”
    2) legge dei grandi numeri: “calcola quanti lanci di un dado occorre effettuare affinché la frequenza relativa del numero di volte in cui esce il 6 differisca per non più del 5% dal valore medio teorico, considerando il grado di fiducia del 90%.”
    3) “L’urna A contiene 2 palline bianche, e l’urna B 4 palline rosse. In ciascun passaggio del processo viene estratta una pallina da ciascuna urna, e le due palline estratte vengono scambiate tra loro. Designiamo con Xn il numero di palline rosse nell’urna A dopo n scambi. A lungo andare qual è la probabilità che vi siano 2 palline rosse nell’urna A?”

    4) “Una macchina produce viti la cui lunghezza media dovrebbe essere 0.15 cm. Per una verifica della precisione della macchina vengono accuratamente misurate 15 viti e si ottiene una media di 0.144 cm con scarto quadratico medio di 0.02 cm. Determina il valore della t di Student sulla quale verificare l’ipotesi che le differenze riscontrate non siano significative.”

    5) “Si sa che la percentuale di promossi all’esame di stato è del 98%. Dei 64 candidati di una scuola ne sono stati respinti 2. Calcolare il valore della variabile statistica normalizzata z sulla quale è possibile verificare l’ipotesi che non c’è differenza significativa tra i dati particolari e quelli generali.”

    Grazie mille per il suo aiuto.

    Tania

    • Andrea ha detto:

      Buonasera Tania
      Grazie per il quesito anche se sarebbe meglio scrivere le domande nelle sezioni specifiche, in domande sparate.
      Vediamo comunque cosa possiamo fare.

      DOMANDA NUMERO 1
      1) catene di markov: “si lancia un dado per 1200 volte. Stima la probabilità massima che il numero di volte in cui esce 6 differisca per più del 4% del valor teorico medio.”Questo quesito riguarda le catene di Markov.
      A mio avviso un tale problema dovrebbe essere risolto con la diseguaglianza di Cebicev.
      In particolare questa afferma che:
      La probabilità che una certa quantità differisca rispetto al suo valore medio di una qualità 𝛾 risulta pari alla varianza di quella quantità divisa per 𝛾
      Nel nostro caso la quantità 𝛾 sembra essere pari a 0,04, mentre come varianza andrò a considerate la seguente quantità:
      VAR = p*(1-p)/n
      dove p identifica la probabilità che in un singolo dado esce 6, ovvero 1/6
      mentre n è il numero di lanci.
      Questa dovrebbe essere in senso inferenziale la varianza:
      Dunque avremo che:
      P(|x-media|>0,04) = (1/6*5/6)/(1.200*0,04) = 0,0028935.
      Tale probabilità sembra al di sotto del 0,3%
      Quindi ‘evento è molto improbabile

      DOMANDA 2

      2) legge dei grandi numeri: “calcola quanti lanci di un dado occorre effettuare affinché la frequenza relativa del numero di volte in cui esce il 6 differisca per non più del 5% dal valore medio teorico, considerando il grado di fiducia del 90%.”

      Questo argomento riguarda la stima intervallare di una proporzione.
      Quindi è un po’ fuori luogo in questo articolo.
      Ance se ci sono comunque delle connessioni tra la distribuzione binomiale e quella normale.
      Dunque qui si richiede che l’errore ad un grado di fiducia del 5% non differisca più del 5%.

      Facciamo una premessa.
      Questo errore che chiamiamo 𝜀 è la distanza tra il valore medio della proporzione p e l’estremo dell’intervallo di confidenza al livello del 90%.

      La formula per calcolare questo errore è:
      𝜀 = z * √(p*(1-p)/n)
      dove:
      n = numero di lanci = incognita
      𝜀 = errore = 0,05
      p = prob che esca il 6 = 1/6 = 0,167
      z = z_0,95 = il novantacinquesimo percentuale di z, ovvero quello associato all’intervallo del 90%.
      Dalle tavole il suo valore è 1,645
      Dunque se eleviamo al quadrato ambo i membri otteniamo:
      𝜀² = z²·p·(1-p)/n
      Se ricaviamo il valore di n otteniamo:
      n = z² ·p·(1-p)/𝜀²
      n = 1,645²·0,167·(1-0,167)/0,05²=150,57
      Quindi in conclusione servirebbero almeno tre 151 lanci affinché si verifichi tale condizione

  • Aurora ha detto:

    Buongiorno mi servirebbe conoscere il procedimento di questo problema
    “L’urna A contiene 2 palline bianche, e l’urna B 4 palline rosse. In ciascun passaggio del processo viene estratta una pallina da ciascuna urna, e le due palline estratte vengono scambiate tra loro. Designiamo con Xn il numero di palline rosse nell’urna A dopo n scambi. A lungo andare qual è la probabilità che vi siano 2 palline rosse nell’urna A?”

    • Andrea ha detto:

      Ciao Aurora,
      Questa domanda mi era stata posta tempo fa da un altro utente.
      Riuscirei a strutturare una risposta, tuttavia non in tempi brevi.
      IL suggerimento che ti do è il seguente.
      Dovresti impostare un diagramma ad albero e ragionare (facendo per ogni step un disegno) sulle palline che rimangono in ogni urna.
      Ad esempio nel primo step avrai certamente nell’urna A una pallina rossa e una bianca, mentre nella seconda urna vi saranno 1 bianca e 3 rosse.
      A questo punto gli scenari che si aprono sono 4.
      Ragionerò con dei vettori (urna A, urna B)
      SCENARIO 1 (R,R) con probabilità pari a 1/2* 3/4
      Ti faccio notare che 1/2 è la probabilità di estrarre la pallina rossa dalla prima urna mentre 3/4 è la probabilità di estrarre una pallina rossa dalla seconda.
      SCENARIO 2 (R,B) con probabilità pari a 1/2* 1/4
      SCENARIO 3 (B,R) con probabilità pari a 1/2* 3/4
      SCENARIO 4 (B,B) con probabilità pari a 1/2* 1/4

      Da ognuno di questi 4 scenari si diramano potenzialmente altri 4 scenari.
      Dico potenzialmente perché potrebbero anche essere di meno.
      Ogni volta che finisce uno scenario devi anche andare a scambiare le palline estratte e da li ripetere la procedura.
      Ogni qual volta raggiungi le palline Rossa, Rossa nell’urna A ti devi fermare.

      é un po’ complicato così a parole perché dovresti vedere lo schema per capirlo meglio.
      Per un tipo di esercito del genere mi ci vorrebbe almeno una o due ore per risolverlo

      Spero di essere stato un minimo di aiuto

Leave a Reply