Validità dei test

Intervallo di confidenza

Il concetto di intervallo di confidenza (IC) viene introdotto quando si esegue una misura o si calcola un rapporto fra misure non sull'intera popolazione, ma su un campione estratto da quella stessa popolazione.

Che cosa indica l'IC?
Se volessimo sapere quante visite prenatali fa una donna durante una gravidanza in Italia, potremmo intervistare tutte le donne che hanno o hanno avuto una gravidanza in un determinato periodo e chiedere loro a quante visite prenatali si sono sottoposte. Questo vorrebbe dire intervistare circa 20 milioni di donne, o circa 600.000 donne ogni anno: una operazione difficile, costosa, nella realtà irrealizzabile. In alternativa, possiamo selezionare un campione di tutte le donne italiane, sufficientemente grande e sufficientemente rappresentativo (che tenga cioè conto di regione di residenza, età, scolarità, parità, livello socioeconomico, paese di provenienza, stato civile, etc.) e chiedere solo a loro quante visite prenatali hanno fatto nel corso della loro ultima gravidanza. Il valore medio ottenuto non sarà il valore medio della popolazione di 20 milioni di donne italiane che hanno/hanno avuto una gravidanza, ma la media del campione selezionato. A questo punto, per sapere quanto questo valore sia vicino al valore reale della media della popolazione, utilizziamo l'IC.

Ad esempio, dalle interviste condotte su un campione rappresentativo delle donne ottengo i seguenti dati: media visite prenatali 7 con un intervallo di confidenza al 95% da 4 a 10. Significa che posso essere fiducioso al 95% che l'intervallo fra 4 e 10 contenga la media reale (sconosciuta) delle visite prenatali dell'intera popolazione di donne italiane. Questo risultato può essere indicato visivamente in una scala da 0 a 10 come indicato nell'immagine in fondo alla pagina.

Come si calcola l'IC?
L'IC viene calcolato a partire dall'errore standard (ES) che è la misura della precisione con cui la media del campione stima la media della popolazione. Semplificando possiamo dire che, in generale, l'IC è pari a + o - 2ES. Se ad esempio la stima puntuale della misura è pari a 5 e l'ES è pari a 1.2 allora posso avere una fiducia del 95% che il valore nella popolazione generale sarà compresa fra: 5+-(2*1,2)=da 2,6 a 7,4

Relazione fra IC e numerosità del campione
Dal momento che l'ES dipende dalla numerosità del campione, anche l'IC sarà influenzato dalla grandezza del campione. Più grande è la dimensione del campione studiato, più ristretto è l'IC e, conseguentemente, più precisa è la stima della media. La stessa media può essere il risultato di campioni di diverse dimensioni, ma è più precisa la stima <media numero visite 7 (IC 95%: 6, 8)> della stima <media numero visite 7 (IC 95%: 3, 11)>. Nel primo caso possiamo dire, con una probabilità del 95%, che l'intervallo di valori compresi tra 6 e 8 contiene la media delle visite prenatali nella popolazione di donne italiane: l'intervallo di confidenza è molto stretto, il dato è relativamente preciso e informativo. Nel secondo caso, in cui l'intervallo è compreso fra 3 e 11, il dato è meno preciso e, conseguentemente, meno informativo.

IC, proporzioni e significatività statistica
Se invece di misurare una media in un campione si compara l'associazione fra una esposizione e un esito (ad es., l'associazione fra livello socioeconomiche e rischio di avere un neonato di basso peso alla nascita - LBW), ci si trova di fronte nuovamente a due possibilità: la prima, pressochè teorica, di intervistare tutte le donne che hanno avuto una recente gravidanza, chiedere loro se hanno avuto o meno un bambino di basso peso, valutare il loro livello socioeconomico e mettere i due parametri in relazione oppure, seconda possibilità, selezionare un campione di donne e fare queste valutazioni solo su questo. Anche in questo caso la stima del rischio nel campione selezionato non coinciderà con il rischio reale (e sconosciuto) dell'intera popolazione, quindi si ricorrerà anche in questo caso all'IC, come nell'esempio che segue.
In uno studio condotto in Messico su 628 bambini [1] si registra un rischio di LBW nei nati da madri di basso livello socioeconomico rispetto ai nati da madri di livello socioeconomico più elevato pari a OR: 2.68 (IC 95%: 1.19, 6.03). Questo significa che i figli di madre con basso livello socioeconomico hanno quasi 3 volte più probabilità di nascere di basso peso rispetto ai figli di donne con più elevato livello socioeconomico. Nel campione studiato, la stima puntuale del rischio di essere LBW in caso di basso livello socioeconomico materno è 2.68; è giusto sostenere, con una fiducia del 95%, che il valore di questo rischio, trasferito nella popolazione generale messicana, è compreso fra 1.19 e 6.03.

Bibliografia

1.Torres-Arreola LP, Constantino-Casas P, Flores-Hernandez S, Villa-Barragan JP, Rendon-Macias E. Socioeconomic factors and low birth weight in Mexico. BMC Public Health. 2005 Mar 3;5(1):20 [Medline]

Chiudi la versione stampabile della pagina e ritorna al sito