L’Odds Ratio (OR) è la misura di associazione fondamentale nel Modello di Regressione Logistica.
Tale modello nasce dall’esigenza di utilizzare un’equazione di Regressione Lineare ($\beta_0 + \beta_1 x$) per predire la Probabilità ($P$) di un evento binario, superando il vincolo matematico $\mathbf{0 \le P \le 1}$ grazie all’applicazione della funzione Esponenziale ($e^{\cdot}$).

INDICE
Definizione e Ruolo dell’Odds Ratio (OR)
L’Odds Ratio è un indice statistico che quantifica la forza di associazione tra un predittore ($x$) e il successo ($Y=1$). Esso si basa sull’Odds, il rapporto tra la probabilità che un evento si verifichi e la probabilità che non si verifichi:
$$\mathbf{Odds} = \frac{P(\text{Successo})}{1 – P(\text{Successo})}$$
L’OR unitario (per $\Delta x = 1$) è la traduzione interpretabile del coefficiente $\beta_1$ del modello ed è dato dall’esponenziale:
$$\mathbf{OR} = e^{\beta_1}$$
- Finalità: L’OR indica di quante volte si moltiplica l’Odds di successo per ogni aumento unitario del predittore $x$.
La Teoria della Trasformazione Lineare-Esponenziale
Il modello logistico utilizza l’espediente del Logit per connettere la retta lineare con la probabilità:
A. Il Logit (La Scala Lineare)
Si assume che l’espressione lineare sia equivalente al Logit ($\ln(\text{Odds})$), la cui scala è illimitata ($[-\infty, +\infty]$):
$$\mathbf{\beta_0 + \beta_1 x = \text{Logit} = \ln\left(\frac{P(\text{Sì})}{1 – P(\text{Sì})}\right)}$$
B. Il Ritorno alla Probabilità (La Funzione Esponenziale)
Per ottenere la probabilità $P(x)$ (vincolata tra 0 e 1), si applica l’operazione inversa, la funzione esponenziale, e si riorganizza il rapporto:
$$\mathbf{P(x) = \frac{\exp(\beta_0+\beta_1 x)}{1 + \exp(\beta_0+\beta_1 x)}}$$
Questo passaggio è cruciale: l’esponenziale comprime il risultato della retta in una curva a S, adatta a modellare le probabilità.
Esempio Applicato: Odds Ratio e Previsione delle Vendite
Scenario: Previsione dell’acquisto di un prodotto ($Y=1$) in funzione dell’Età ($x$).
Modello Stimato: $\mathbf{\text{Logit} = -3,5 + 0,08 \cdot \text{Età}}$
A. Odds Ratio Unitario (Impatto di un Singolo Anno)
$$\mathbf{OR}_{\text{Unità}} = e^{0,08} \approx \mathbf{1,083}$$
- Interpretazione: L’Odds di acquisto aumenta dell’8,3% per ogni anno in più di età.
B. Previsione della Probabilità $P(x)$
| Età ($x$) | Logit ($\beta_0+\beta_1 x$) | Odds $e^{\text{Logit}}$ | Probabilità $P(x)$ |
|---|---|---|---|
| 30 | $-1,1$ | $0,333$ | $0,250$ |
| 40 | $-0,3$ | $0,741$ | $0,426$ |
| 43,75 | $\mathbf{0}$ | $\mathbf{1,000}$ | $\mathbf{0,500}$ |
| 50 | $0,5$ | $1,649$ | $0,622$ |
| 60 | $1,3$ | $3,669$ | $0,786$ |
Calcolo dell’Odds Ratio tra 50enni e 30enni
Scenario: Vogliamo calcolare l’OR tra i clienti di 50 anni e quelli di 30 anni, dato il modello: $\mathbf{\text{Logit} = -3,5 + 0,08 \cdot \text{Età}}$ ($\beta_1 = 0,08$).
Per calcolare $\mathbf{OR}_{\mathbf{50 \text{ vs } 30}}$, i due metodi seguenti sono matematicamente equivalenti:
Metodo 1: L’Esponenziale della Variazione Lineare (Differenza di Logit)
Questo metodo sfrutta la proprietà additiva del Logit. La variazione di età è $k = 50 – 30 = 20$ anni.
$$\mathbf{OR}_{50 \text{ vs } 30} = e^{k \cdot \beta_1} = e^{20 \cdot 0,08} = e^{1,6} \approx \mathbf{4,953}$$
Metodo 2: Rapporto tra gli Odds Individuali (Definizione Fondamentale)
Questo metodo sfrutta la definizione fondamentale di Odds Ratio come rapporto tra gli Odds.
Si utilizzano gli Odds già calcolati per l’età di 50 anni e 30 anni:
| Età | Logit | Odds $e^{\text{Logit}}$ |
|---|---|---|
| 50 | $0,5$ | $\mathbf{1,649}$ |
| 30 | $-1,1$ | $\mathbf{0,333}$ |
$$\mathbf{OR}{50 \text{ vs } 30} = \frac{\mathbf{Odds}{50}}{\mathbf{Odds}_{30}} = \frac{1,649}{0,333} \approx \mathbf{4,952}$$
I risultati sono identici, confermando che l’Odds che un cliente acquisti il prodotto a 50 anni è circa 5 volte maggiore rispetto all’Odds di un cliente di 30 anni, grazie all’impatto positivo dell’età nel modello.
IMPARA LA STATISTICA
Comincia un fantastico viaggio alla scoperta di questa affascinante materia partendo da zero.
Si comincia dalla statistica descrittiva, passando per le probabilità si arriva all’inferenza.
Comincia subito il tuo percorso e migliora le tue abilità.