Skip to main content

https://youtu.be/KZH0qCEAwec

DEFINIZIONE

Il teorema di Bayes permette di conoscere la probabilità che si manifesti una causa dato l’effetto finale.

Dopo aver stilato la lista delle possibili cause e determinato la probabilità che si manifesti ogni singola causa si stima la probabilità che questo effetto si manifesti data ogni possibile causa.

In seguito usiamo  il teorema delle probabilità totali per calcolare la probabilità che questo effetto possa manifestarsi.

Infine applichiamo il teorema di Bayes per determinate la probabilità che tale effetto sia dovuto ad una particolare causa.

SCHEMA LOGICO

Quando vogliamo studiare un effetto stiliamo la lista di tutte le possibili cause che possono determinare questo effetto.

Per effetto intendiamo una conseguenza che si manifesta proprio in seguito alle possibili cause.

Esempi molto semplici di relazione causa-effetto possono essere:

Fumo (causa) e prendo il cancro ai polmoni (effetto)

Scrivo tanti articoli (causa) e quindi aumento il traffico sul mio sito internet (effetto).

Ovviamente il fatto di fumare è sicuramente la più incisiva ma non  l’unica possibile causa del tumore ai polmoni.

Tale tumore può essere infatti causata da altri fattori come amianto, Radom e metalli pesanti.

QUAL’E’ LA PROBABILITA’ CHE UN CERTO EFFETTO SIA IMPUTABILE AD UNA DETERMINATA CAUSA?

Il teorema di Bayes ci aiuta a rispondere alla seguente domanda.

Qual è la probabilità che un certo effetto sia imputabile ad una determinata causa?

Attenzione che in questa situazione sappiamo per certo che l’effetto si sia certamente manifestato.

Quelle che vogliamo scoprire è la probabilità che questo dato effetto si sia manifestato proprio in conseguenza ad una causa particolare.

Ovvero riferendoci al caso del cancro, potremmo chiederci:

Se ci troviamo di fronte ad un individuo che ha contratto il cancro ai polmoni, qual è la probabilità che ciò sia stato causato dal fumo di sigaretta?

IL TEOREMA DELLA PROBABILITA’ TOTALE

Il primo step per poter applicare il teorema di Bayes è quello di costruire con il teorema della probabilità totale la probabilità che si manifesti un certo effetto.

Ora procediamo con ordine:

Per prima cosa dobbiamo selezionare il nostro spazio campionario, ovvero identificare l’insieme di tutti i casi possibili in cui il nostro effetto può manifestarsi.

Possiamo chiamare sinteticamente lo spazio campionario con la lettera greca omega Ω.

Lo spazio campionario è suddiviso in sottoinsiemi che rappresentano tutte le possibili cause che possono generare il nostro effetto.

Possiamo chiamare questi sottoinsiemi:

Ovviamente avremo che l’unione dei sotto insiemi darà lo spazio campionario (Ω).

Ovviamente possiamo calcolarci la probabilità che avvenga ogni singola causa Hi.

CAUSE POSSIBILI, INCOMPATIBILI E COMPLEMENTARI

Quando facciamo la suddivisione dello spazio campionario dobbiamo ricordare che le cause devono rispecchiare tre caratteristiche importanti.

Esse sono possibiliincompatibili e complementari.

Per possibili intendiamo che devono avere una probabilità non nulla.

Questa cosa sembrerebbe abbastanza banale e scontata.

Non sarebbe possibile riconoscere la presenza di una causa se questa non viene considerata nella nostra indagine.

Per incompatibili intendiamo che quando si manifesta una causa non può manifestarsi l’altra.

Pensiamo ad esempio al risultato di una partita.

Se si manifesta la vittoria di una squadra, non possono manifestarsi il pareggio e la sconfitta di quella squadra.

Quello che ne deriva è che la probabilità delle intersezioni è pari a zero.

Matematicamente possiamo scrivere:

Questa scrittura si legge l’intersezione tra un evento Hi e un evento Hi è un insieme vuoto.

Di conseguenze la probabilità dell’intersezione tra l’evento Hi e l’evento Hi è pari a zero.

Questo avviene per ogni i e j all’interno dello spazio campionario preso in considerazione.

La terza caratteristica che abbiamo già riportato sopra è la complementarietà degli eventi H.

Il fatto che tutte le cause H siano complementari si traduce che la loro unione deve dare lo spazio campionario.

Ragionando sulle probabilità, la somma delle probabilità delle cause deve essere pari a uno ovvero al 100%.

DETERMINIAMO L’EFFETTO

Dopo aver suddiviso lo spazio campionario delle cause andiamo a rappresentare l’effettostudiato.

Tale effetto deve avere almeno un’intersezione con tutte le cause.

Il che equivale a dire che l’intersezione tra l’effetto e una qualsiasi delle cause deve essere diversa dall’insieme vuoto.

In termini di probabilità diremo che la probabilità che si manifestino contemporaneamente causa ed effetto è diversa da zero.

Questo deve avvenire per ogni i e j dello spazio di riferimento.

CALCOLIAMO LA PROBABILITA’ DELL’EFFETTO CON IL TEOREMA DELLA PROBABILITA’ TOTALE

A questo punto andiamo a calcolare la probabilità che si manifesti l’effetto E applicando il teorema della probabilità totale.

L’effetto E può essere visto come unione delle intersezioni tra l’effetto e le cause H.

Dato il fatto che le cause sono tra di loro incompatibili, la probabilità dell’effetto sarà data dalla seguente relazione:

PROBABILITA’ CONDIZIONATE

Ricordiamo che la probabilità che si manifesti  l’effetto varia a seconda della causa che può manifestarsi.

In questo senso causa ed effetto oltre ad essere compatibili sono tra di loro dipendenti.

Con la simbologia:

Intendiamo la probabilità che si manifesti l’effetto E, quando si è manifestata la causa specifica Hi.

Possiamo chiamarla la probabilità condizionata di E rispetto ad Hi.

La probabilità dell’intersezione tra e Hi può essere vista come il prodotto tra la probabilità che si manifesti la causa i-esima P(Hi) e la probabilità condizionata di E rispetto ad Hi.

PROBABILITA’ DELL’EFFETTO CON LE PROBABILITA’ CONDIZIONATE

Sviluppando quindi il calcolo della probabilità dell’effetto calcolata con il teorema della probabilità totale scriveremo:

Sapendo che:

La scrittura per il calcolo di E diventa:

Questa formula può essere riscritta nella forma più sintetica:

Che si legge come “sommatoria delle probabilità delle cause i-esime moltiplicate per le probabilità condizionato dell’evento E alle cause i-esime con l’indice i che va da 1 a n.

TEOREMA DI BAYES – 

CALCOLIAMO LA PROBABILITA’ DI UNA CAUSA DATO L’EFFETTO

Ora che conosciamo la probabilità dell’effetto possiamo calcolare la probabilità che tale effetto sia determinato da una particolare causa.

Per farlo utilizziamo il teorema di Bayes.

Per calcolare tale probabilità dividiamo la probabilità dell’intersezione tra l’effetto e la causa i-esima per la probabilità dell’effetto:

Scritto in termini completi:

ESEMPIO

Proviamo a fare un esempio calcistico del teorema di Bayes.

Siccome sono milanista ipotizzero che alla finale di Champions League ci vada proprio la squadra di Milano.

Le due possibili sfidanti della finale sono i francesi del  Paris Saint Germain (PSG) e gli inglesi del Manchester United.

Sabato 28 maggio 2022 nella citta di San Pietroburgo si disputerà la famigerata finale di Champions League.

Sappiamo che il Milan si è già qualificato per la finale.

Nell’altra semifinale si affrontano il PSG e il Manchester United.

La probabilità che vinca la squadra francese è pari al 70%.

Sappiamo inoltre dai dati storici che la probabilità che il Milan possa battere gli inglesi è pari al 55%, mentre scende al 40% se l’altra finalista sarà il PSG.

Sapendo che il Milan ha vinto la finale qual è la probabilità che in finale abbia trovato il PSG?

DIAGRAMMA AD ALBERO

Rappresentiamo un diagramma ad albero per rappresentare la situazione.

La prima diramazione rappresenta i due possibili eventi della finale.

Con M ho inteso l’evento “il Milan sfida in finale il Manchester United”.

Tale probabilità stando ai dati si manifesterà con probabilità del 30% ovvero 0,30.

Questa probabilità è la complementare alla probabilità che in finale vada il PSG nota dal testo e pari al 70% cioè 0,70

Con P considero l’evento “il Milan sfida in finale il PSG” con probabilità nota di 0,70.

L’evento V rappresenta la vittoria in finale del Milan, mentre l’evento S rappresenta la sconfitta.

Ora se la finale dovesse essere con il Manchester United la probabilità di vittoria del Milan è del 55% ovvero 0,55.

Questa è la probabilità di vittoria dei rossoneri condizionata allo scontro con i Red Devils.

Ovviamente da questa probabilità possiamo calcolare la probabilità di sconfitta in finale condizionata allo scontro con il Manchester.

In modo analogo possiamo considerare il caso in cui lo scontro giocato in Russia sia tra gli italiani e i francesi.

La probabilità di vittoria del Milan condizionata allo scontro con il PSG è pari al 40% cioè 0,40.

Analogamente la relativa probabilità di sconfitta sarà il 60%

PROBABILITÀ DI VITTORIA DEL MILAN – PROBABILITA’ TOTALE

Adesso vogliamo calcolare la probabilità dell’effetto vittoria V dei rossoneri in finale.

Questa probabilità è data dalla somma dell’intersezione della vittoria con il Manchester e l’intersezione della vittoria contro il PSG.

La probabilità dell’intersezione tra la vittoria e lo scontro con il Manchester può essere calcolata come il prodotto tra la P(M) e la probabilità condizionata P(V|M).

La stessa cosa avviene per l’altra probabilità di intersezione tra vittoria e PSG

A questo punto possiamo scrivere la probabilità di vittoria P(V) come:

Sostituendo i dati in nostro possesso:

Otteniamo che la probabilità del Milan di vincere la coppa dalle grandi orecchie è pari al 44,5%.

PROBABILITÀ DI AVER VINTO CONTRO IL PSG – BAYES

Nota la probabilità P(V) della squadra di Milano di aggiudicarsi la coppa, possiamo calcolare la probabilità che se il Milan risulti vincitore l’altra finalista sia il PSG.

In questo caso l’effetto è noto, ovvero abbiamo la certezza che il Milan abbia vinto la Champions.

Ma non sappiamo chi ha incontrato in finale.

La probabilità che cerchiamo è perciò la probabilità che il Milan abbia incontrato in finale il PSG dato di fatto (condizionato) alla vittoria del Milan, ovvero:

Per calcolare questa probabilità riduciamo i nostri casi favorevoli alla probabilità d vittoria del Milan, calcolata precedentemente con il teorema della probabilità totale.

Come casi possibili inseriamo la probabilità che lo scontro in finale sia avvenuto con i parigini.

Il calcolo si traduce dunque nella seguente formula:

Se volessimo inserire il calcolo completo scriveremmo:

In conclusione esiste circa il 63% di probabilità che se il Milan ha vinto la coppa la sfida finale sia stata giocata con il PSG.

SCOPRI DI PIU’

Per scoprire di più sul teorema di Bayes e le sue applicazioni  ho realizzato un video corso che affronta in modo dettagliato questo argomento.

È il secondo video-corso della saga statistica di chiama “PROBABILITA‘” ed è il primo dei sei corsi che costituiscono la saga della Statistica aziendale.

Nel corso verranno trattati i temi relativi alla probabilità.

Si parte dal concetto di combinazioni e disposizioni e dalla definizione di probabilità.

Dopodiché si passerà alla distinzione tra eventi indipendenti e dipendenti.

Nell’ambito di questi ultimi si presenterà il teorema di Bayes.

La parte successiva è destinata alle variabili casuali discrete e continue.

Per le prime vedremo la binomiale e la Poisson.

Per le seconde invece la v.c. normale.

La parte finale è dedicata al teorema del limite centrale che riassume in un solo grande argomento tutta la probabilità.

Per ogni argomento troverete sia la parte teorica che la parte pratica.

Clicca per scoprire il corso.

CORSO DI STATISTICA COMPLETO

Il corso di statistica completo è composto da tre volumi:

  • Statistica base (descrittiva)
  • Probabilità
  • Inferenza e test di ipotesi

Il tutto è completato con un eserciziario in cui troverete tanti test di domande universitarie:

Contattami per scoprire di più

andreailmatematico@gmail.com

6 Comments

  • enzo miccio ha detto:

    Ciao andrea, ho questo quesito su bayes da risolvere, se la probabilità di trovare bel tempo è del 60% se vado in brasile e del 50% se vado in argentina, sapendo che su 10 voli 8 sono per il brasile e 2 per l’argentina, quale è la probabilità che abbia trovato bel tempo in brasile ?
    grazie in anticipo.

    • Andrea ha detto:

      Ciao Enzo, grazie per il quesito.
      La probabilità che devi cercare è la probabilità che un individuo trovi bel tempo in brasile.
      Tale probabilità è l’intersezione tra il trovare bel tempo e andare in brasile.
      Essendo che su 8 voli 10 portano in Brasile, la probabilità che il nostro viaggiatore vada in brasile (se sceglie casualmente un aereo) è pari all’80%.
      In tal caso ci sarà la probabilità del 60% che trovi bel tempo.
      quindi la probabilità dell’intersezione tra il Brasile e il bel tempo:
      P(Brasile E bel tempo)= P(Brasile)·P(bel tempo|Brasile)=0,80·0,60=0,48
      Ovvero del 48%.

      Nota bene che se la domanda fosse sta:
      Qual’è la probabilità che il viaggiatori si trovi in Brasile sapendo che c’è bel tempo?
      Allora in questo caso avremo usato il teorema di Bayes.
      Infatti sappiamo noto l’effetto finale (bel tempo) e vogliamo calcolare la probabilità che in tal caso sia stato preso l’aereo per il Brasile.
      la probabilità ricercata è perciò:
      P(bel tempo|Brasile)=P(Brasile E bel tempo)/P(bel tempo)

      il Numeratore lo abbiamo calcolato prima.
      Per quanto riguarda il calcolo del denominatore applichiamo il teorema della probabilità totale.
      P(bel tempo)=P(Brasile)·P(bel tempo|Brasile)+P(Argentina)·P(bel tempo|Argentina)
      P(bel tempo)=0,80·0,60+0,20·0,50=0,58
      la probabilità totale di trovare bel tempo è del 58%
      A questo punto non ci resta che calcolare la probabilità cercata:
      P(bel tempo|Brasile)=P(Brasile E bel tempo)/P(bel tempo)=0,48/0,58=0,8276
      Dunque se il turista durante la sua vacanza trova bel tempo c’è l’82,76% che si trovi in Brasile.

  • Luca ha detto:

    Ciao Andrea,
    Bello questo teorema. Ho provato ad applicarlo ad un altro tema purtroppo attuale in questo periodo calcolando in maniera molto approssimato la probabilità che un morto x COVID sia Non vaccinato.
    Per i dati mi sono basato non sui dati statistici pubblicati giornalmente ma solo su i seguenti due dati che i tg riportano frequentemente:
    1) i vaccinati sono il 90% e quindi i non vaccinati sono il 20% della popolazione.
    2) i morti x COVID tra i novax sono 27 volte di quelli tra i vaccinati . Con questi dati ho ottenuto che la probabilità è pari al 75%.
    Se può interessare posso postare i calcoli.
    Grazie

    • Andrea ha detto:

      Ciao Luca.
      Direi che hai centrato in pieno la questione.
      Uno degli ambiti in cui il teorema è maggiormente utilizzato è proprio l’ambito medio.
      La tua scelta di riferirlo a eventi attuali come il COVID è dicerto azzeccatissima.
      Quindi non esitare a postare i calcoli di questo problema.

      • Luca ha detto:

        Bene, premesso quindi che quanto sto per scrivere è solo un esempio di applicazione del teorema di Bayes e non ha la pretesa di descrivere quanto sta accadendo in Italia per via della pandemia e scusandomi in anticipo su eventuali errori logici e di calcolo commessi questi sono i miei calcoli.
        Applichiamo il Teorema di Bayes come esercizio al caso del calcolo della probabilità di trovare dei NoVax tra le persone morte per Covid basandosi solo sui dati sommari che circolano sui media in questi giorni:
        1.Probabilità a priori: i vaccinati sono il 90% della popolazione ( quindi i non vaccinati sono 1-0,9=0,1 cioè il 10% della popolazione)
        2.Probabilità condizionate: il numero delle persone Novax che muoiono per Covid sono 27 volte il numero delle persone vaccinate
        Identifichiamo gli eventi sui quali applicare il teorema:
        •M = persone morte per Covid
        •N = persone NoVax
        •V = persone Vaccinate
        In base ai dati in 1.=> P(N) = 0,1 ; P(V)=0,9
        In base ai dati in 2. => P(M|N) = 27 x P(M|V)
        Per il teorema di Bayes =>P(N|M)= P(M|N) x P(N) / P(M)
        Per il teorema della prob. Totale: P(M) = P(M|V) x P(V) + P(M|N) x P(N)
        Sostituendo 2. nel teor. Di Bayes abbiamo:
        P(N|M) = 27 x P(M|V) x P(N) / ( P(M|V) x P(V) + 27 x P(M|V) x P(N) )
        a questo punto punto posso semplificare e togliere il termine P(M|V) da numeratore e denominatore:
        P(M|N) = 27 x P(N) / ( P(V) + 27 x P(N) ) sostituendo i valori delle probabilità a priori abbiamo:
        P(M|N) = 27 x 0,1 / ( 0,9 + 27 x 0,1 ) = 2,7 / 3,6 = 0,75
        Quindi il risultato ottenuto mostra che la probabilità di trovare persone NoVax fra i morti per covid
        è pari al 75%

Leave a Reply