PROPORZIONI E PERCENTUALI, RISCHI, ODDS E TASSI
5.18. DIMENSIONI DEI CAMPIONI E POTENZA, PER TEST SULLA DIFFERENZA E SULL’ODDS RATIO DELLE PROPORZIONI DI DUE CAMPIONI INDIPENDENTI.
Recentemente Hardeo Sahai e Anwer Khurshid, nell’articolo del 1996 Formulae and tables for the determination of sample sizes and power in clinical trials for the testing differences in proportions for the two-sample design: a review (pubblicato su Statistics in Medicine Vol. 15, pp.: 1-21), hanno presentato - un compendio di formule esatte e di formule asintotiche, - per test
sulla significatività della differenza tra due proporzioni ( -
finalizzate a stimare sia le dimensioni ( - con campioni
bilanciati (
Tali formule
servono per rendere significativa la differenza minima
Per ottenere la potenza massima in test di confronto tra i parametri di due o più campioni, è sempre richiesto che l'esperimento sia bilanciato. Ma non sempre
è possibile. Può avvenire che uno dei due campioni ( Spesso non è neppure desiderabile avere campioni con la stesso numero di dati. Nella scelta delle dimensioni possono assumere importanza anche altri fattori, spesso ritenuti addirittura prioritari. Ad esempio, come verrà sviluppato nel capitolo sul test t di Student per due campioni indipendenti, non sempre l'attribuzione di un individuo a un gruppo è una scelta neutra, sotto l'aspetto etico od economico. Si pensi al confronto tra farmaco e placebo, quando ad alcuni ammalati viene somministrato il placebo; si consideri la sperimentazione di un farmaco nuovo, ritenuto più efficace, quando per valutare il miglioramento effettivo ad alcuni pazienti deve essere somministrato quello vecchio. Per l'aspetto economico, una raccolta di dati condotta nella propria azienda o nella zona di residenza spesso è meno costosa di una condotta fuori sede; una analisi chimica o biologica effettuata con la vecchia metodologia può avere costi differenti da quella nuova. Calcolato il
numero
l'altro
campione deve avere dimensioni
relazione
affinché il
test mantenga la stessa potenza (
In molti ricerche di epidemiologia, le differenze tra due proporzioni sono fornite su una scala moltiplicativa. Come ampiamente illustrato nei paragrafi precedenti, - negli
studi di coorti il rischio relativo è fornito come
- e negli studi per confrontare caso - controllo si ricorre
all'odds ratio
In questo ultimo
caso, quando i tassi sono piccoli, il valore
Quindi, ma solo in queste circostanze, le formule per stimare le dimensioni del campione con l’odds ratio e con il rischio relativo sono uguali.
Nelle formule successive, - le
dimensioni dei due campioni con proporzioni
- dove
- e
se
L’elenco di Hardeo Sahai e Anwer Khurshid riporta 13 formule per calcolare la dimensione
minima
La formula per calcolare la potenza
Per primo è riportato il metodo esatto di Fisher per tabelle 2 x 2, in letteratura indicato anche come metodo di Fisher-Irwin, nella forma - sia condizionale (exact conditional method), - che non condizionale (exact unconditional method). Il metodo condizionale è quello classico proposto da Fisher, illustrato nel capitolo sul chi- quadrato. E' fondato sulla costanza dei totali marginali e per i calcoli utilizza la distribuzione ipergeometrica. In metodo non condizionale è fondato sulla osservazione che mantenere costanti tutti i totali marginali, in particolare il numero di successi, non è un’ipotesi sempre credibile come sostengono - S. Suissa e J. J. Shuster nel 1985 con l'articolo Exact unconditional sample sizes for the 2 x 2 binomial trial (pubblicato su Journal of the Royal Statistical Society, Series A., Vol. 148, pp.: 317-327), - J. T. Casagrande, M. C Pike e P. G. Smith con l'articolo del 1978 An improved approximate formula for comparing two binomial distributions (pubblicato su Biometrics Vol. 34, pp.: 483-486). Con l’ipotesi condizionale, la soluzione per stimare la probabilità è basata sulla distribuzione binomiale.
Sia la formula fondata sulla distribuzione ipergeometrica sia quella che utilizza la binomiale sono concettualmente semplici. Ma per il calcolo delle dimensioni del campione esse richiedono procedimenti estremamente lunghi, poiché la stima di due probabilità congiunte è estesa dalla risposta campionaria a tutte quelle più estreme nella stessa direzione. Inoltre, nel caso di test bilaterale, quando non si accetta che la distribuzione delle probabilità sia simmetrica e quindi non è ritenuto valido il procedimento di raddoppiare la probabilità già stimata, il calcolo deve essere esteso anche a tutte le possibili risposte ugualmente estreme che sono collocate nella direzione opposta. Ne consegue che non esiste una formula semplice e rapida, - né per il
calcolo di
- né di
La dimensione
minima
a1 - sia per i casi di due campioni bilanciati, a2 – sia per quelli di due campioni con un numero differente di dati. Le formule per
stimare la potenza
b1 – di due campioni bilanciati e b2 – di due campioni con dimensioni differenti.
Per facilitare
eventuali calcoli, nella tabella successiva sono riportati i valori di Z per
le probabilità
ALCUNI VALORI DI ZPER
E PER
ELENCO DEI METODI
1 – Il metodo dell’arcoseno (the arcsine methods). E’ fondato sull’approssimazione
alla distribuzione normale ( Il problema della
trasformazione angolare di una proporzione
- W. O. Kermack e A. G. Mckendrick del 1940 The design and interpretion of experiment based on a four–fold table: the statistical assessment of the effects of treatment (pubblicato su Proceeding of the Royal Society of Edinburgh, Vol. 60, pp.: 362-375).
Un’altra pubblicazione che tratta l’argomento in modo relativamente completo è quella di - E. Paulson e W. A. Wallis del 1947 Planning and analyzing experiments for comparing two percentages (un capitolo del volume (ed.) di C. Eisenhart, M. W. Hastay, W. A. Wallis intitolato Selected Techniques of Statistical Analysis, McGraw-Hill, New York, Chapter 7, pp.: 247-265). Il primo a dimostrare che la
trasformazione di una proporzione
- C. Eisenhart nel 1947 con il capitolo Inverse sine transformation of proportion (sul medesimo volume appena citato di (ed.) C. Eisenhart, M. W. Hastay, W. A. Wallis dal titolo Selected Techniques of Statistical Analysis , McGraw-Hill, New York, Chapter 16, pp.: 395-416).
Tuttavia, da alcuni autori e in vari testi recenti, la trasformazione angolare è ritenuta non necessaria, - quando le due proporzioni sono comprese tra 0,30 e 0,70. La motivazione è che oggettivamente le loro varianze differiscono ugualmente di poco.
Per stimare le dimensioni dei campioni, le due formule sono:
a1 - Numero (
- se il test è bilaterale
- se il test è unilaterale
dove - con
- mentre con
a2 - Numero
(
Invertendo la formula per il calcolo di
Per passare dal
valore di Z alla potenza
b1 – Potenza (
b2 – Potenza (
2 – Il metodo dell’arcoseno con la correzione per la continuità (the arcsine with continuity correction). Quando il campione è piccolo, secondo vari autori il test di significatività richiede la correzione per la continuità, che ne abbassa la significatività. Se da una parte diminuisce la potenza del test, dall’altra lo rende più prudenziale. Di conseguenza, se si vuole mantenere la stessa potenza del test, occorre aumentare le dimensioni del campione. I metodi che
utilizzano la correzione per la continuità richiedono un procedimento
iterativo, poiché la quantità
La sua formula
fornisce una stima di
a1 - Numero di
dati (
a2 - Numero (
Invertendo la formula per calcolare
b1 – Potenza (
b2 – Potenza (
3 – Il metodo non iterativo dell’arcoseno con la correzione per la continuità (a non-iterative version of the continuity corrected arcsine). La formula
precedente con la correzione per la continuità prevede che nella stima di
- dopo aver
introdotto un primo valore di
- questo nuova
stima
- tale
nuovo risultato
Solitamente, al
secondo o al terzo tentativo la stima ottenuta è molto vicina al valore
introdotto al denominatore: è il risultato
Allo scopo di evitare tale iterazione, A. E. Dobson e V. J. Gebski nel 1986 con l’articolo Sample sizes for comparing two independent proportions using the continuity corrected arcsine transformations, (pubblicato su The Statistician Vol. 35, pp.: 51-53) forniscono una eccellente approssimazione della formula precedente, sia nella versione per due campioni bilanciati sia per quella di due campioni con un numero differente di osservazioni:
a1
- Numero (
dove -
-
-
a2 - Numero (
dove -
-
-
4 – Il metodo di Poisson (the Poisson method). La distribuzione poissoniana, che può essere derivata dalla distribuzione binomiale (vedi capitolo II sulle distribuzioni teoriche) assumendo che -
è concettualmente la base chi-quadrato. Secondo quanto affermato da M. Gail nel 1974, con l’articolo Power computations for designing comparative Poisson trials (su Biometrics Vol. 30, pp.: 231-237), questo metodo è raccomandato - quando non è applicabile l’approssimazione alla distribuzione normale, perché le proporzioni sono vicine ai valori limite (0 oppure 1). Il metodo fondato sulla distribuzione di Poisson dovrebbe essere utilizzato quando - le due
proporzioni
- ma con
oppure, simmetricamente, quando - le due proporzioni
- ma sempre
con
a1 – Numero (
dove -
a2 - Numero (
Invertendo la formula per calcolare
b1 – Potenza (
b2 – Potenza (
5 – Il metodo normale asintotico (Asymptotic normal method). E’ il metodo più appropriato quando si utilizzano due proporzioni senza la trasformazione in arcoseno, poiché si assume che siano distribuite in modo asintoticamente normale. La formula tiene in considerazione che - le due proporzioni
come discusso - nell’articolo di M. Halperin, E. Rogot, J. Gurian e F. Ederer nel 1968 Sample size for medical trials with special reference to long term therapy (pubblicato su Journal of Chronic Diseases Vol. 21, pp.: 13-24) - nel testo di P. Armitage e G. Berry del 1987 Statistical Methods in Medical Research (2nd ed. Blackwell Scientific Publications, Oxford), - nel volume di J. L. Fleiss del 1981 Statistical Methods for Rates and Proportions (2nd ed. Wiley, New York). Da questo approccio, deriva la formula più diffusa nei testi divulgativi, tra cui il volume di B. Rosner del 1994 Fundamentals of Biostatistics (4th ed. Duxbury Press, Belmont, California).
a1 - Numero (
dove -
-
a2 - Numero (
dove -
Invertendo la formula per il calcolo di
b1 – Potenza (
b2 – Potenza (
6 – Il metodo della normale con la correzione per la continuità (Normal with continuity correction). La formula
precedente è equivalente a quella basata sul
a1 - Numero (
a2 - Numero ( Nel 1980 J. L. Fleiss, A. Tytun e S. H. K. Ury con l’articolo A simple approximantion for calculing sample sizes for comparing two independent proportions (su Biometrics Vol. 36, pp.: 343-346) propongono anche la sua estensione a due campioni non bilanciati:
dove -
7 – Il metodo della normale modificato con la correzione per la continuità (Modified normal with continuity correction). Un miglioramento della formula precedente, per ottenere una stima ancora più vicina a quella fornita dal metodo esatto di Fisher, è stata proposta successivamente da J. T. Casagrande, M. C. Pike e P. G. Smith nel 1978 con l’articolo An improved approximate formula for comparing two binomial distributions (su Biometrics Vol. 34, pp.: 483-486) ed è stata ripresa dal testo a grande diffusione Biostatistical Analysis di J. H. Zar già nell’edizione del 1984 (2nd edn. Prentice-Hall, Inc., Englewood Cliffs, New Jersey):
a1 - Numero (
a2 - Numero ( La formula per due campioni bilanciati è stata estesa al caso di due campioni non bilanciati - nel 1981 da C. Diegert e K. V. Diegert con l’articolo Note on inversion of Casagrande-Pike-Smith approximate sample size formula for Fisher-Irwin test on 2 x 2 tables (su Biometrics Vol. 37, p.:595) e - nel 1982 da J. L. Fleiss, A. Tytun e S. H. K. Ury con l’articolo Response to “The choice of relative group sizes for comparisons of independent proportions” (su Biometrics Vol. 38, pp.: 1093-1094):
dove -
8 – La formula abbreviata del metodo normale con la correzione per la continuità (Shortcut formula of modified normal with continuity correction). Sempre nell’articolo di J. L. Fleiss, A. Tytun e S. H. K. Ury del 1980 A simple approximation for calculating sample sizes for comparing two independent proportions (su Biometrics Vol. 36, pp.: 343-346) è dimostrato che un notevole grado di accuratezza può essere ottenuta anche con la formula molto semplice e rapida:
a1 - Numero (
dove -
a2 - Numero ( Nello stesso articolo appena citato di J. L. Fleiss, A. Tytun e S. H. K. Ury del 1980 è presentata anche la formula per due campioni non bilanciati:
dove -
Invertendo la formula per il calcolo di
b1 – Potenza (
b2 – Potenza (
9 – Il metodo del chi–quadrato con la correzione per la continuità (Chi-square with continuity correction). Un’altra formula approssimata
e che permette un calcolo rapido è quella riportata da H. K. Ury e J.
L. Fleiss nel 1980 nell’articolo On approximate sample sizes for
comparing two independent proportions with use of Yates’ corrections
(su Biometrics Vol. 36, pp.: 347-251) per l’uso del
a1 - Numero (
dove -
-
a2 - Numero
(
dove -
10 – Il metodo normale con l’ipotesi di omogeneità (Simple normal assuming homogeneity). Questa formula
per stimare la dimensione
a1 - Numero (
a2 - Numero
(
dove -
Invertendo la formula per calcolare
b1 – Potenza (
b2 – Potenza (
11 – Il metodo normale con ipotesi di eterogeneità (Simple normal assuming heterogeneity): Quando, con il modello parametrico fondato sulla normale, si assume che le varianze siano differenti, la formula precedente è trasformata in quella successiva. E’ riportata anche nel testo classico di G. W. Snedecor e W. G. Cochran del 1989 Statistical Methods (8th edn. Iowa State University Press, Ames, Iowa) e nel volume di D. Machin e M. J. Campbell del 1987 Statistical Tables for the Design of Clinical Trials (Blackwell Scientific Publications, Oxford).
a1 - Numero (
a2 - Numero
(
Invertendo la formula per calcolare
b1 – Potenza (
b2 – Potenza (
A conclusione di questo elenco di formule, è conveniente ricordare che Hardeo Sahai e Anwer Khurshid, sempre nell’articolo del 1996 citato all’inizio, scrivono che i test tradizionali e ricorrenti nelle riviste di statistica applicata per confrontare due proporzioni sono il metodo esatto di Fisher e il chi quadrato con la correzione per la continuità di Yates. Ma, contrapposta a questa utilizzazione massiva, nella letteratura specialistica esiste una rilevante controversia sulla loro correttezza. Molti ricercatori hanno dimostrato che - il chi
quadrato tradizionale di Pearson, quello senza la correzione per la
continuità, fornisce una difesa più che adeguata contro l’errore
di Tipo I (errore
- mentre il test esatto di Fisher e il chi quadrato con la correzione di Yates sono sistematicamente troppo conservativi. Ne deriva che questi due metodi sono troppo poco potenti (in inglese scritto anche poco liberal), presentando un errore sistematico che li rende troppo conservativi: Essi… have an extremely conservative bias. This implies that the Fisher’s exact test and the Pearson’s chi-square with continuity correction are less powerful, and so have less chance of detecting a given difference in proportions than the chi-square test without the continuity correction (pag. 17). La letteratura a favore di questa affermazione è numerosa. Tra gli articoli degli autori più importanti e che già nel titolo evidenziano l’approccio critico, è possibile ricordare - di W. G. Conover del 1974 Some reasons for not using the Yates’ continuity correction on 2 x 2 contigency tables (with comments and rejoinder) (pubblicato su Journal of the American Statistical Association Vol. 69, pp.: 374 – 384); - di J. Berkson del 1978 In dispraise of the exact test: do the marginal totals of the 2 x 2 table contain relevant information respecting the table proportions (su Journal od Statistical Planning and Inference Vol. 2 pp.: 27 – 42); - di R. B. D’Agostino, W. Chase e A. Belanger del 1988 The appropriateness of some common procedures for testing the equality of binomial parameters (in The American Statistician Vol. 42, pp.: 198 – 202).
Un altro aspetto del test esatto di Fisher che ha suscitato varie obiezioni è assumere l'ipotesi che tutti i totali marginali si mantengano sempre fissi. E’ un concetto che è rifiuatato da chi ritiene che - in un esperimento il numero totale di successi non può essere prefissato, - ma che esso sia una variabile random. Quindi il test chi-quadrato senza la correzione per la continuità sarebbe più appropriato del test esatto di Fisher, anche dal punto di vista logico. Tuttavia mantenere costanti i totali è un’ipotesi operativamente utile per derivare un test esatto non parametrico, che non sia fondato su distribuzioni asintotiche. Inoltre è dimostrato che la correzione di Yates porta a ricavare gli stessi valori del test esatto. E’ quanto afferma lo stesso Frank Yates (1902- 1994, già assistente di Fisher nel 1931 nell’Istituto di ricerche agrarie Rothamsted di Londra) -
esattamente cinquant’anni dopo la sua proposta originaria del 1934 Contingency
tables involving small numbers and the
- con l’articolo del 1984 Tests of significance for 2 x 2 contingency tables (with discussion), pubblicato sulla stessa rivista Journal of the Royal Statistical Society (Series A, Vol. 147, pp.: 426 – 463).
Il dibattito a favore o contro queste due formule continua. La sua conclusione porta anche alla risposta su quale sia la formula migliore La scelta del test più appropriato non è un esercizio meramente accademico. Ha una grande importanza pratica, poiché le dimensioni del campione sono differenti se è impiegato - il
- la trasformazione in arcoseno oppure la distribuzione normale asintotica, ricordando sempre che deve essere utilizzato il test per il quale è stata pianificata la raccolta dei dati.
|
||||||||||||||||||||||
Manuale di Statistica per la Ricerca e la Professione © Lamberto Soliani - Dipartimento di Scienze Ambientali, Università di Parma (apr 05 ed) ebook version by SixSigmaIn Team - © 2007 |