PROPORZIONI  E  PERCENTUALI,  RISCHI,  ODDS  E  TASSI

 

 

5.7. IL CONFRONTO TRA UNA PROPORZIONE CAMPIONARIA E UNA PROPORZIONE ATTESA CON IL TEST Z; DIMENSIONE MINIMA DEL CAMPIONE, PER L’USO DELLA DISTRIBUZIONE NORMALE.

 

 

Nel capitolo 3 sul chi quadrato, è stato presentato l’uso della distribuzione normale Z

-  sia per il confronto di una proporzione osservata con una proporzione attesa,

-  sia per il confronto tra due proporzioni osservate,

 quando i campioni sono di grandi dimensioni.

Infatti, in tali condizioni, esiste corrispondenza (già illustrata) tra distribuzione  con un gdl e la distribuzione Z:

Per una verifica empirica, è sufficiente controllare sulle tabelle dei valori critici che per a = 0.05

- nella distribuzione normale bilaterale si ha Z = 1,96

- nella distribuzione chi-quadrato con un gdl si ha c2 = 3,84

 

Nell’analisi statistica dei dati, è quindi possibile utilizzare indifferentemente metodi che si rifanno alle due distribuzioni.

Ad esempio, nello studio dell’effetto di 4 farmaci con i dati seguenti

 

 

 

Risposta

Farmaci

A

B

C

D

Guariti

37

45

48

15

Non guariti

72

87

105

58

Campione

109

132

153

73

0,339

0,341

0,314

0,205

 

 

 mediante  la distribuzione normale o test Z è possibile verificare

1 - se la proporzione  di guariti con il farmaco A (dove  = 0,339 o 33,9%) è statisticamente  differente da una proporzione  prefissata;

 

2 – se la proporzione di guariti del farmaco C (con  = 0,314) è statisticamente differente  da quella del farmaco D (con  = 0,205).

 

Per confrontare tra loro l’effetto di tre o più farmaci sulle frequenze di guarigione, è opportuno ricorrere al test  o al test G, già presentati. Quindi si utilizzano i dati della tabella 2 x k seguente:

 

 

Risposta

Farmaci

A

B

C

D

Guariti

37

45

48

15

Non guariti

72

87

105

58

 

 

Ma, come illustrato nel capitolo 3, è possibile servirsi di queste due distribuzioni  ( o G ) anche per risolvere i primi due problemi.

 

Con  i test sono sempre bilaterali, poiché le ipotesi alternative all’ipotesi nulla

H0: pA = pB = pC = pD

 sono sempre multiple, esprimibili con la frase

H1: almeno una p è diversa dalle altre

oppure

H1: almeno due p sono differenti tra loro  o il test G

 

Rifiutata l’ipotesi nulla, con metodi più sofisticati è possibile poi verificare tra quali proporzioni  campionarie esiste una differenza significativa. La prassi di applicare il test generale prima di passare a confronti a coppie, è un principio di cautela illustrato nei paragrafi dedicati ai confronti multipli. Non tutti gli autori concordano su questa cautela, ritenendo che i test siano equivalenti. In realtà la prassi di applicare un test generale, prima di utilizzare i confronti singoli, dipende dalla probabilità a complessiva, che deve essere calcolata tenendo presenti le singole probabilità a di tutti i confronti effettuati. Con il metodo generale, la stima è data molto semplicemente dal valore di a prescelto.

 

Se in un esperimento con  casi, un numero  di essi è risultato positivo,

- per confrontare se è statisticamente significativa

- la differenza tra la proporzione (con ) e una proporzione  di una popolazione,

- è possibile utilizzare sia  (1) la frequenza assoluta, sia  (2)  la frequenza relativa:

 

1 – con la frequenza assoluta  

2 – con la frequenza relativa  

 

La parte – 0,5 (spesso scritta )

-  riportata al numeratore nella formula con la frequenza assoluta,

-  è chiamata correzione per la continuità o correzione di Yates

(Frank Yates, inglese 1902–1994. Laureato in matematica, assistente di Ronald Fisher nel 1931 quando lavora nell’istituto di ricerche agrarie Rothamsted Agricultural Research Institute. Diventatone direttore, nel 1954 dirige l’installazione del primo computer inglese, l’Elliot 401, scrivendo programmi per l’analisi della varianza).

 

La correzione di Yates è motivata dal fatto che  è un conteggio, quindi un numero intero che viene collocato su una scala continua, come è il valore .

Ad esempio, se nella tabella precedente prendiamo

-  che i guariti con il farmaco A sono  = 37 e il valore atteso era  = 40,3

-  occorre considerare che il valore 37 non è da intendere come un valore continuo (37,00) ma un valore di una unità, collocato sul 37;

-  quindi l’unità 37 su una scala continua occupa lo spazio unitario da 36,5 a 37,5.

Ne deriva che la distanza  

 in realtà è

 = 2,8

I suoi effetti sono ovvii: il valore di Z risulta minore.

Con l’uso di una frequenza relativa, la correzione di Yates diventa 


 

Per utilizzare la distribuzione Z in test sulle proporzioni, si richiede che le dimensioni  del campione siano abbastanza grandi. Questo valore  non è costante, ma dipende da quello della proporzione .

Quando  è compreso tra 0,3 e 0,7 è ritenuto adeguato un campione di dimensioni .

Negli altri casi, è ritenuto adeguato solamente

 un campione di dimensioni

 dove al denominatore

-  è da intendere il valore minore tra  e .

Devono essere esclusi i valori estremi, minori di 0,02  oppure maggiori di 0,98.

Ovviamente, come è possibile vedere in altre parti del testo, non esiste uniformità tra le diverse scuole di statistica anche su questo piccolo problema su quando un campione può essere definito abbastanza grande: alcune richiedono un campione  ancore maggiore, altre si accontentano di un valore minore.

 

ESEMPIO 1. Calcolare le dimensioni minime  del campione per poter utilizzare la distribuzione normale Z, quando (a)  = 0,5 e  (b)  = 0,92.

Risposte.

A) Quando  = 0,5 si ha che anche  = 0,5;

Con il calcolo

 si stima che il campione minimo sarebbe .

 

B) Quando  = 0,92 si ha che anche  = 0,08;

Ne deriva

 che il campione minimo sarebbe .

 

Quando ci confronta il valore sperimentale  con un valore atteso o teorico , questo test per un campione può essere sia bilaterale o a due code, sia unilaterale o a una coda.

Nel caso di un test bilaterale, le ipotesi sono formalmente scritte come

H0:         contro        H1:

 dove l’ipotesi nulla significa che

- la proporzione  della popolazione, dalla quale è stato estratto il campione di proporzione , è uguale a quella  della popolazione di confronto;

- oppure, espressa con altre parole, il campione con proporzione  è stato estratto dalla popolazione con proporzione .

 

Nel caso di un test unilaterale, l’ipotesi alternativa è scritta come

H1:         oppure         H1:

La loro ipotesi nulla,

-  in alcuni testi, è scritta come nel caso bilaterale H0:

- in altri e formalmente più corretta, considera anche il segno opposto.

Pertanto le ipotesi unilaterali possono essere scritte come

H0:         contro        H1:

oppure

H0:         contro        H1:

 

ESEMPIO 2.  Un farmaco contro l’asma determina una netta riduzione dei sintomi nel 28% dei pazienti, già dopo una settimana di somministrazione. Per valutare gli effetti di un nuovo principio attivo, su 150 pazienti ai quali è stato somministrato nelle stesse condizioni, il numero di individui con la stessa riduzione dei sintomi è stato 57. Il nuovo principio attivo è statisticamente migliore?

 

Risposta. La proporzione di individui che hanno risposto positivamente alla somministrazione del farmaco nel campione con  = 150 è stato

.

 

Il test è unilaterale, poiché si tratta di decidere se la proporzione reale  del nuovo farmaco, della quale p = 0,38 è solamente la risposta di un campione, è statisticamente maggiore di  = 0,280.

In termini più formali si scrive

H0:         contro        H1:

 Usando la formula con

-  la frequenza relativa


 

 

 si stima Z = 2,44.

 Usando la formula con

- la frequenza assoluta

 

 

 si stima lo stesso valore Z = 2,44 (a meno delle approssimazioni nei calcoli)

In una distribuzione normale unilaterale, a Z = 2,44 corrisponde una probabilità P = 0,007.

Questo risultato significa che,

-  se H0 fosse vera, cioè se la proporzione vera p di guarigione del farmaco nuovo fosse 0,28 come per il farmaco vecchio,

-  esiste una probabilità P = 0,007 che il farmaco nuovo dia in risultato come quello ottenuto o ancora migliore.

Una probabilità P = 0,007 ( o del 7 per mille) è oggettivamente bassa. Di conseguenza, si decide di rifiutare l’ipotesi nulla e quindi implicitamente di accettare l’ipotesi alternativa.

La dizione estesa di tale conclusione è: con probabilità P = 0,007 di errare (perché può essere che H0 sia vera e che il risultato sia stato ottenuto effettivamente solo per caso) rifiuto l’ipotesi nulla e accetto l’ipotesi alternativa.

Oppure, più sinteticamente: con probabilità P = 0,007 il farmaco nuovo è statisticamente migliore.

 

 

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Università di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007