PROPORZIONI E PERCENTUALI, RISCHI, ODDS E TASSI
5.7. IL CONFRONTO TRA UNA PROPORZIONE CAMPIONARIA E UNA PROPORZIONE ATTESA CON IL TEST Z; DIMENSIONE MINIMA DEL CAMPIONE, PER L’USO DELLA DISTRIBUZIONE NORMALE.
Nel capitolo 3 sul chi quadrato, è stato presentato l’uso della distribuzione normale Z - sia per il confronto di una proporzione osservata con una proporzione attesa, - sia per il confronto tra due proporzioni osservate, quando i campioni sono di grandi dimensioni. Infatti,
in tali condizioni, esiste corrispondenza (già illustrata) tra distribuzione
Per una verifica empirica, è sufficiente controllare sulle tabelle dei valori critici che per a = 0.05 - nella distribuzione normale bilaterale si ha Z = 1,96 - nella distribuzione chi-quadrato con un gdl si ha c2 = 3,84
Nell’analisi statistica dei dati, è quindi possibile utilizzare indifferentemente metodi che si rifanno alle due distribuzioni. Ad esempio, nello studio dell’effetto di 4 farmaci con i dati seguenti
mediante la distribuzione normale o test Z è possibile verificare 1
- se la proporzione
2
– se la proporzione di guariti del farmaco C (con
Per
confrontare
tra loro l’effetto di tre o più farmaci sulle frequenze di
guarigione, è opportuno ricorrere al test
Ma,
come illustrato nel capitolo 3, è possibile servirsi di queste due
distribuzioni (
Con
H0: pA = pB = pC = pD sono sempre multiple, esprimibili con la frase H1: almeno una p è diversa dalle altre oppure H1: almeno due p
sono differenti tra loro
Rifiutata
l’ipotesi nulla, con metodi più sofisticati è possibile poi verificare tra
quali proporzioni
Se
in un esperimento con
- per confrontare se è statisticamente significativa -
la differenza
tra la proporzione
- è possibile utilizzare sia (1) la frequenza assoluta, sia (2) la frequenza relativa:
1 – con la frequenza assoluta
2 – con la frequenza
relativa
La
parte –
0,5 (spesso scritta –
- riportata al numeratore nella formula con la frequenza assoluta, - è chiamata correzione per la continuità o correzione di Yates (Frank Yates, inglese 1902–1994. Laureato in matematica, assistente di Ronald Fisher nel 1931 quando lavora nell’istituto di ricerche agrarie Rothamsted Agricultural Research Institute. Diventatone direttore, nel 1954 dirige l’installazione del primo computer inglese, l’Elliot 401, scrivendo programmi per l’analisi della varianza).
La
correzione
di Yates è motivata dal fatto che
Ad esempio, se nella tabella precedente prendiamo - che i guariti con il farmaco A
sono
- occorre considerare che il valore 37 non è da intendere come un valore continuo (37,00) ma un valore di una unità, collocato sul 37; - quindi l’unità 37 su una scala continua occupa lo spazio unitario da 36,5 a 37,5. Ne deriva che la distanza
in realtà è
I suoi effetti sono ovvii: il valore di Z risulta minore. Con l’uso di una frequenza relativa,
la correzione
di Yates diventa
Per
utilizzare la distribuzione Z in test sulle
proporzioni, si richiede che le dimensioni
Quando
Negli altri casi, è ritenuto adeguato solamente un campione di dimensioni
dove al denominatore -
è da intendere il valore minore tra
Devono essere esclusi i valori estremi, minori di 0,02 oppure maggiori di 0,98. Ovviamente,
come è possibile vedere in altre parti del testo, non esiste uniformità tra
le diverse scuole di statistica anche su questo piccolo problema su quando un
campione può essere definito abbastanza grande: alcune richiedono
un campione
ESEMPIO
1. Calcolare le dimensioni minime
Risposte. A)
Quando
Con il calcolo
si
stima che il campione minimo sarebbe
B)
Quando
Ne deriva
che il campione minimo sarebbe
Quando
ci confronta il valore sperimentale
Nel caso di un test bilaterale, le ipotesi sono formalmente scritte come H0:
dove l’ipotesi nulla significa che -
la proporzione
-
oppure, espressa con altre parole, il campione con proporzione
Nel caso di un test unilaterale, l’ipotesi alternativa è scritta come H1:
La loro ipotesi nulla, - in alcuni testi, è scritta
come nel caso bilaterale H0:
- in altri e formalmente più corretta, considera anche il segno opposto. Pertanto le ipotesi unilaterali possono essere scritte come H0:
oppure H0:
ESEMPIO 2. Un farmaco contro l’asma determina una netta riduzione dei sintomi nel 28% dei pazienti, già dopo una settimana di somministrazione. Per valutare gli effetti di un nuovo principio attivo, su 150 pazienti ai quali è stato somministrato nelle stesse condizioni, il numero di individui con la stessa riduzione dei sintomi è stato 57. Il nuovo principio attivo è statisticamente migliore?
Risposta.
La proporzione di individui che hanno risposto positivamente alla
somministrazione del farmaco nel campione con
Il
test è unilaterale, poiché si tratta di decidere se la proporzione reale
In termini più formali si scrive H0:
Usando la formula con - la frequenza relativa
si stima Z = 2,44. Usando la formula con - la frequenza assoluta
si stima lo stesso valore Z = 2,44 (a meno delle approssimazioni nei calcoli) In una distribuzione normale unilaterale, a Z = 2,44 corrisponde una probabilità P = 0,007. Questo risultato significa che, - se H0 fosse vera, cioè se la proporzione vera p di guarigione del farmaco nuovo fosse 0,28 come per il farmaco vecchio, - esiste una probabilità P = 0,007 che il farmaco nuovo dia in risultato come quello ottenuto o ancora migliore. Una probabilità P = 0,007 ( o del 7 per mille) è oggettivamente bassa. Di conseguenza, si decide di rifiutare l’ipotesi nulla e quindi implicitamente di accettare l’ipotesi alternativa. La dizione estesa di tale conclusione è: con probabilità P = 0,007 di errare (perché può essere che H0 sia vera e che il risultato sia stato ottenuto effettivamente solo per caso) rifiuto l’ipotesi nulla e accetto l’ipotesi alternativa. Oppure, più sinteticamente: con probabilità P = 0,007 il farmaco nuovo è statisticamente migliore.
|
|||||||||||||||||||||||||||||||||||||||||||||||||
Manuale di Statistica per la Ricerca e la Professione © Lamberto Soliani - Dipartimento di Scienze Ambientali, Università di Parma (apr 05 ed) ebook version by SixSigmaIn Team - © 2007 |