PROPORZIONI  E  PERCENTUALI,  RISCHI,  ODDS  E  TASSI

 

  

 

 5.18.  DIMENSIONI DEI CAMPIONI E POTENZA, PER TEST SULLA DIFFERENZA E SULL’ODDS RATIO DELLE PROPORZIONI DI DUE CAMPIONI INDIPENDENTI.

 

 

Recentemente Hardeo Sahai e Anwer Khurshid, nell’articolo del 1996 Formulae and tables for the determination of sample sizes and power in clinical trials for the testing differences in proportions for the two-sample design: a review (pubblicato su Statistics in Medicine Vol. 15, pp.: 1-21), hanno presentato

-  un compendio di formule esatte e di formule asintotiche,

-  per test sulla significatività della differenza tra due proporzioni (),

-  finalizzate a stimare sia le dimensioni () del campione minimo sia la potenza () del test,

- con campioni bilanciati ( e con campioni che hanno un numero differente di osservazioni ().

 

Tali formule servono per rendere significativa la differenza minima  prescelta tra le due proporzioni. Presentano pure formule per verificare la significatività di misure di associazione oppure di odds ratio, che hanno una impostazione analoga ai test sulla differenza in quanto utilizzano sempre una tabella 2 x 2, ma con finalità differenti.

 

Per ottenere la potenza massima in test di confronto tra i parametri di due o più campioni, è sempre richiesto che l'esperimento sia bilanciato.

Ma non sempre è possibile. Può avvenire che uno dei due campioni () sia già stato raccolto e che le sue dimensioni () siano obiettivamente troppo piccole oppure eccessivamente grandi, per le finalità della ricerca. Ne deriva che il secondo campione ) dovrà avere dimensioni () tali da compensare questo difetto, in particolare se il primo è troppo piccolo.

Spesso non è neppure desiderabile avere campioni con la stesso numero di dati. Nella scelta delle dimensioni possono assumere importanza anche altri fattori, spesso ritenuti addirittura prioritari. Ad esempio, come verrà sviluppato nel capitolo sul test t di Student per due campioni indipendenti, non sempre l'attribuzione di un individuo a un gruppo è una scelta neutra, sotto l'aspetto etico od economico. Si pensi al confronto tra farmaco e placebo, quando ad alcuni ammalati viene somministrato il placebo; si consideri la sperimentazione di un farmaco nuovo, ritenuto più efficace, quando per valutare il miglioramento effettivo ad alcuni pazienti deve essere somministrato quello vecchio. Per l'aspetto economico, una raccolta di dati condotta nella propria azienda o nella zona di residenza spesso è meno costosa di una condotta fuori sede; una analisi chimica o biologica effettuata con la vecchia metodologia può avere costi differenti da quella nuova.

Calcolato il numero , cioè il numero minimo necessario per due campioni bilanciati, se già si dispone di un primo campione di dimensioni  

 l'altro campione deve avere dimensioni  determinate dalla

 relazione

 

 affinché il test mantenga la stessa potenza () di quello bilanciato (.

 

In molti ricerche di epidemiologia, le differenze tra due proporzioni sono fornite su una scala moltiplicativa. Come ampiamente illustrato nei paragrafi precedenti,

-  negli studi di coorti il rischio relativo è fornito come

-  e negli studi per confrontare caso - controllo

 si ricorre all'odds ratio  

 

In questo ultimo caso, quando i tassi sono piccoli, il valore  dell'odds ratio approssima molto bene il valore del rischio relativo  .

Quindi, ma solo in queste circostanze, le formule per stimare le dimensioni del campione con l’odds ratio e con il rischio relativo sono uguali.


 

Nelle formule successive,

-  le dimensioni dei due campioni con proporzioni  e  sono indicate rispettivamente con  e

- dove   e 

-  e se  ,  i due campioni sono bilanciati:  .

 

L’elenco di Hardeo Sahai e Anwer Khurshid riporta 13 formule per calcolare la dimensione minima , anche se quelle effettivamente operative sono 11.

La formula per calcolare la potenza  è riportata solo in 7 casi.

 

Per primo è riportato il metodo esatto di Fisher per tabelle 2 x 2, in letteratura indicato anche come metodo di Fisher-Irwin, nella forma

-  sia condizionale (exact conditional method),

-  che non condizionale (exact unconditional method).

Il metodo condizionale è quello classico proposto da Fisher, illustrato nel capitolo sul chi- quadrato. E' fondato sulla costanza dei totali marginali e per i calcoli utilizza la distribuzione ipergeometrica.

In metodo non condizionale è fondato sulla osservazione che mantenere costanti tutti i totali marginali, in particolare il numero di successi, non è un’ipotesi sempre credibile come sostengono

-   S. Suissa e J. J. Shuster nel 1985 con l'articolo  Exact unconditional sample sizes for the 2 x 2 binomial trial (pubblicato su Journal of the Royal Statistical Society, Series A., Vol. 148, pp.: 317-327),

-   J. T. Casagrande, M. C Pike e P. G. Smith con l'articolo del 1978 An improved approximate formula for comparing two binomial distributions (pubblicato su Biometrics Vol. 34, pp.: 483-486).

Con l’ipotesi condizionale, la soluzione per stimare la probabilità è basata sulla distribuzione binomiale.

 

Sia la formula fondata sulla distribuzione ipergeometrica sia quella che utilizza la binomiale sono concettualmente semplici. Ma per il calcolo delle dimensioni del campione esse richiedono procedimenti estremamente lunghi, poiché la stima di due probabilità congiunte è estesa dalla risposta campionaria a tutte quelle più estreme nella stessa direzione. Inoltre, nel caso di test bilaterale, quando non si accetta che la distribuzione delle probabilità sia simmetrica e quindi non è ritenuto valido il procedimento di raddoppiare la probabilità già stimata, il calcolo deve essere  esteso anche a tutte le possibili risposte ugualmente estreme che sono collocate nella direzione opposta.

Ne consegue che non esiste una formula semplice e rapida,

-  né per il calcolo di  in casi di esperimenti bilanciati,

-  né di  quando sia stato prestabilito il rapporto  con le dimensioni  dell’altro campione.

 

 La dimensione minima  è riportata

 a1 - sia per i casi di due campioni bilanciati,

 a2 – sia per quelli di due campioni con un numero differente di dati.

Le formule per stimare la potenza  sono 7 e anch’esse riguardano i casi

b1 –   di due campioni bilanciati e

b2 –   di due campioni con dimensioni differenti.

 

Per facilitare eventuali calcoli, nella tabella successiva sono riportati i valori di Z per le probabilità  e  che più frequentemente vengono utilizzati nella ricerca applicata:

 

ALCUNI VALORI DI Z

PER  BILATERALE (two-tailed = ) OPPURE UNILATERALE (one-tailed = )

E PER  UNILATERALE (sempre)

 

0.10

0.05

0.025

0.01

0.005

0.001

 e

0.20

0.10

0.05

0.02

0.01

0.002

Z

1,6448

1,9600

2,2414

2,5758

2,8070

3,2905

 

 

ELENCO DEI METODI

 

 1 – Il metodo dell’arcoseno (the arcsine methods).

E’ fondato sull’approssimazione alla distribuzione normale () di due proporzioni  e , dopo la loro trasformazione in arcoseno. Come più ampiamente illustrato nei paragrafi sulle trasformazioni, ai quali si rimanda per approfondimenti, essa serve per omogeneizzare la varianza delle due proporzioni.

Il problema della trasformazione angolare di una proporzione compare per la prima volta nel dibattito scientifico alla fine degli anni ’30. Secondo alcune pubblicazioni sulle metodologie statistiche, il primo articolo che lo discute in modo abbastanza esauriente è quello di

-  W. O. Kermack  e A. G. Mckendrick del 1940 The design and interpretion of experiment based on a four–fold table: the statistical assessment of the effects of treatment (pubblicato su Proceeding of the Royal Society of Edinburgh, Vol. 60, pp.: 362-375).


 

Un’altra pubblicazione che tratta l’argomento in modo relativamente completo è quella di

-  E. Paulson e W. A. Wallis del 1947 Planning and analyzing experiments for comparing two percentages (un capitolo del volume (ed.) di C. Eisenhart, M. W. Hastay, W. A. Wallis intitolato Selected Techniques of Statistical Analysis, McGraw-Hill, New York, Chapter 7, pp.: 247-265).

Il primo a dimostrare che la trasformazione di una proporzione  nel suo arcoseno ha l’effetto di ampliare i valori agli estremi e comprimere quelli centrarli, determinando una statistica con varianza approssimativamente unitaria, è

- C. Eisenhart nel 1947 con il capitolo Inverse sine transformation of proportion (sul medesimo volume appena citato di (ed.) C. Eisenhart, M. W. Hastay, W. A. Wallis dal titolo Selected Techniques of Statistical Analysis , McGraw-Hill, New York, Chapter 16, pp.: 395-416).

 

Tuttavia, da alcuni autori e in vari testi recenti, la trasformazione angolare è ritenuta non necessaria, - quando le due proporzioni sono comprese tra 0,30 e 0,70.

La motivazione è che oggettivamente le loro varianze differiscono ugualmente di poco.

 

Per stimare le dimensioni dei campioni,  le due formule sono:

 

 a1Numero () di dati in due campioni bilanciati:

 

-  se il test è bilaterale

 

-  se il test è unilaterale

 

 dove

- con    e   in questa e in tutte le formule successive si intende rispettivamente la probabilità di un errore di Tipo I per un test bilaterale () e un test unilaterale (),

- mentre con  si intende la probabilità di un errore di Tipo II, che è sempre unilaterale.


 

 a2 -  Numero  ( con )  di dati in due campioni con dimensioni differenti:

 

 

Invertendo la formula per il calcolo di  si ricava quella di .

Per passare dal valore di Z alla potenza , è sufficiente ricorrere alla tabella della normale (sempre e solo unilaterale), detta funzione di distribuzione cumulativa della distribuzione normale standard (the cumulative distribution function of the standard normal distribution).

 

b1Potenza () del test in due campioni bilanciati:

 

 

 b2Potenza  () del test in due campioni con dimensioni differenti:

 

 

 

2 – Il metodo dell’arcoseno con la correzione per la continuità (the arcsine with continuity correction).

Quando il campione è piccolo, secondo vari autori il test di significatività richiede la correzione per la continuità, che ne abbassa la significatività. Se da una parte diminuisce la potenza del test, dall’altra lo rende più prudenziale. Di conseguenza, se si vuole mantenere la stessa potenza del test, occorre aumentare le dimensioni del campione.

I metodi che utilizzano la correzione per la continuità richiedono un procedimento iterativo, poiché la quantità  che deve essere stimata compare anche al denominatore. Insieme con quello della trasformazione angolare, questo problema è discusso da D. E. Walter in un articolo del 1979 In defense of the arcsine approximation (pubblicato su The Statistician Vol. 28,  pp.: 219-222).

La sua formula fornisce una stima di  molto vicina a quella ottenuta con il metodo esatto di Fisher.


 

 a1Numero di dati () in due campioni bilanciati:

 

 

 a2Numero ( con ) di dati in due campioni con dimensioni differenti:

 

 

 

Invertendo la formula per calcolare , si ricava quella per .

 

b1Potenza () del test in due campioni bilanciati:

 

 

 b2Potenza  () del test in due campioni con dimensioni differenti:

 

 

 

3 – Il metodo non iterativo dell’arcoseno con la correzione per la continuità (a non-iterative version of the continuity corrected arcsine).

La formula precedente con la correzione per la continuità prevede che nella stima di  le proporzioni  e  siano diminuite di una quantità . Per giungere al risultato, l’inserimento di  al denominatore richiede una procedura iterativa:

-  dopo aver introdotto un primo valore di  opzionale al denominatore, con la formula si calcola un secondo valore ;

- questo nuova stima  sostituisce il precedente valore  al denominatore, ricavando una seconda stima ;

-  tale nuovo risultato  sostituisce  il valore  al denominatore.

Solitamente, al secondo o al terzo tentativo la stima ottenuta è molto vicina al valore introdotto al denominatore: è il risultato  del test.

Allo scopo di evitare tale iterazione, A. E. Dobson e V. J. Gebski nel 1986 con l’articolo Sample sizes for comparing two independent proportions using the continuity corrected arcsine transformations, (pubblicato su The Statistician Vol. 35, pp.: 51-53) forniscono una eccellente approssimazione della formula precedente, sia nella versione per due campioni bilanciati sia per quella di due campioni con un numero differente di osservazioni:

 

 a1Numero () di dati in due campioni bilanciati:

 

 dove

    con    e  

 

 a2Numero ( con ) di dati in due campioni con dimensioni differenti:

 

 dove

    con    e  


 

 

4 – Il metodo di Poisson (the Poisson method).

La distribuzione poissoniana, che può essere derivata dalla distribuzione binomiale (vedi capitolo II sulle distribuzioni teoriche) assumendo che

-    e  

 è concettualmente la base chi-quadrato.

Secondo quanto affermato da M. Gail nel 1974, con l’articolo Power computations for designing comparative Poisson trials (su Biometrics Vol. 30, pp.: 231-237), questo metodo è raccomandato

-  quando non è applicabile l’approssimazione alla distribuzione normale, perché le proporzioni sono vicine ai valori limite (0 oppure 1).

Il metodo fondato sulla distribuzione di Poisson dovrebbe essere utilizzato quando

- le due proporzioni  e  molto piccole (inferiori a 0.05),

- ma con  abbastanza grande, in modo che   e   siano entrambe ;

 oppure, simmetricamente, quando

-  le due proporzioni   e  molto grandi (maggiori di 0.95)

-  ma sempre con  abbastanza grande in modo che, con formula complementare alla precedente,  i valori di   e   siano entrambi .

 

 a1Numero () di dati in due campioni bilanciati

 

 dove

- differenza minima tra due proporzioni che si vuole dimostrare significativa.

 

 a2 -  Numero ( con ) di dati in due campioni con dimensioni differenti:

 

 

Invertendo la formula per calcolare , si ricava per stimare .


 

b1Potenza () del test in due campioni bilanciati:

 

 

 b2Potenza  () del test in due campioni con dimensioni differenti:

 

 

 

5 – Il metodo normale asintotico (Asymptotic normal method).

E’ il metodo più appropriato quando si utilizzano due proporzioni senza la trasformazione in arcoseno, poiché si assume che siano distribuite in modo asintoticamente normale. La formula tiene in considerazione che

-  le due proporzioni  e  hanno varianze differenti ( ),

 come discusso

-  nell’articolo di M. Halperin, E. Rogot, J. Gurian e F. Ederer nel 1968 Sample size for medical trials with special reference to long term therapy (pubblicato su Journal of Chronic Diseases Vol. 21, pp.: 13-24)

-  nel testo di P. Armitage e G. Berry del 1987 Statistical Methods in Medical Research (2nd ed. Blackwell Scientific Publications, Oxford),

-  nel volume di J. L. Fleiss  del 1981 Statistical Methods for Rates and Proportions (2nd ed. Wiley, New York).

Da questo approccio, deriva la formula più diffusa nei testi divulgativi, tra cui il volume di B. Rosner del 1994 Fundamentals of Biostatistics (4th ed. Duxbury Press, Belmont, California).

 

 a1Numero () di dati in due campioni bilanciati:

 

  dove

  e 

  e 

 

 a2Numero ( con ) di dati in due campioni con dimensioni differenti:

 

 dove

  e 

 

Invertendo la formula per il calcolo di , si ricava quella di .

 

b1Potenza () del test in due campioni bilanciati:

 

 

 b2Potenza  () del test in due campioni con dimensioni differenti:

 

 

 

6 – Il metodo della normale con la correzione per la continuità (Normal with continuity correction).

La formula precedente è equivalente a quella basata sul  di Pearson, senza la correzione per la continuità. Quando è inserita tale correzione, detta anche correzione di Yates, nel 1959 M. Kramer e S. W. Greenhouse con la pubblicazione Determination of sample sizes and selection of cases (nel volume di J. O. Cole e R. W. Gerard (eds.) Psychopharmacology: Problems in Evaluations, National Academy of Science, National Research Council, Washington, D. C. pp.: 356-371) hanno proposto di stimare il numero di dati con:

 

 a1Numero () di dati in due campioni bilanciati:

 

 

 a2Numero ( con ) di dati in due campioni con dimensioni differenti:

Nel 1980 J. L. Fleiss, A. Tytun e S. H. K. Ury con l’articolo A simple approximantion for calculing sample sizes for comparing two independent proportions (su Biometrics Vol. 36, pp.: 343-346) propongono anche la sua estensione a due campioni non bilanciati:

 

dove

-  è ottenuta con la formula per due campioni non bilanciati del metodo fondato sulla distribuzione asintoticamente normale (precedente formula 5a2).

 

 

7 – Il metodo della normale modificato con la correzione per la continuità (Modified normal with continuity correction).

Un miglioramento della formula precedente, per ottenere una stima ancora più vicina a quella fornita dal metodo esatto di Fisher, è stata proposta successivamente da J. T. Casagrande, M. C. Pike e P. G. Smith nel 1978 con l’articolo An improved approximate formula for comparing two binomial distributions (su Biometrics Vol. 34, pp.: 483-486) ed è stata ripresa dal testo a grande diffusione Biostatistical Analysis di J. H. Zar già nell’edizione del 1984 (2nd edn. Prentice-Hall, Inc., Englewood Cliffs, New Jersey):

 

 a1Numero () di dati in due campioni bilanciati:

 

 

 a2Numero ( con ) di dati in due campioni con dimensioni differenti.

La formula per due campioni bilanciati è stata estesa al caso di due campioni non bilanciati

-  nel 1981 da C. Diegert e K. V. Diegert con l’articolo Note on inversion  of Casagrande-Pike-Smith approximate sample size formula for Fisher-Irwin test on 2 x 2 tables (su Biometrics Vol. 37, p.:595) e

-  nel 1982 da J. L. Fleiss, A. Tytun e S. H. K. Ury con l’articolo Response to “The choice of relative group sizes for comparisons of independent proportions” (su Biometrics Vol. 38, pp.: 1093-1094):

 

 dove

-  è ottenuta con la formula per due campioni non bilanciati del metodo fondato sulla distribuzione asintoticamente normale (precedente formula 5a2).

 

 

8 – La formula abbreviata del metodo normale con la correzione per la continuità (Shortcut formula of modified normal with continuity correction).

Sempre nell’articolo di J. L. Fleiss, A. Tytun e S. H. K. Ury del 1980 A simple approximation for calculating sample sizes for comparing two independent proportions (su Biometrics Vol. 36, pp.: 343-346) è dimostrato che un notevole grado di accuratezza può essere ottenuta anche con la formula molto semplice e rapida:

 

 a1Numero () di dati in due campioni bilanciati:

 

 dove

  corrisponde al valore  ottenuta con la formula del metodo asintotico normale per due campioni bilanciati (precedente formula 5a1).

 

 a2Numero ( con ) di dati in due campioni con dimensioni differenti.

Nello stesso articolo appena citato di J. L. Fleiss, A. Tytun e S. H. K. Ury del 1980 è presentata anche la formula per due campioni non bilanciati:


 

 dove

  corrisponde al valore  ottenuta con la formula del metodo asintotico normale per due campioni non bilanciati (precedente formula 5a2).

 

Invertendo la formula per il calcolo di , si ricava quella di .

 

b1Potenza () del test in due campioni bilanciati:

 

 

 

 b2Potenza  () del test in due campioni con dimensioni differenti:

 

 

 

9 – Il metodo del chi–quadrato con la correzione per la continuità (Chi-square with continuity correction).

Un’altra formula approssimata e che permette un calcolo rapido è quella riportata da H. K. Ury e J. L. Fleiss nel 1980 nell’articolo On approximate sample sizes for comparing two independent proportions  with use of Yates’ corrections (su Biometrics Vol. 36, pp.: 347-251) per l’uso del  con la correzione di Yates:

 

 a1Numero () di dati in due campioni bilanciati:

 

 dove

  e 

 è ottenuto con il metodo asintotico normale della formula 5a1.

 

 a2Numero  ( con )  di dati in due campioni con dimensioni differenti:

 

 dove

 è ottenuto con il metodo asintotico normale della formula 5a2.

 

 

10 – Il metodo normale con l’ipotesi di omogeneità (Simple normal assuming homogeneity).

Questa formula per stimare la dimensione  è un adattamento alle proporzioni della formula classica riportata da W. G. Cochran e G. M. Cox  nel loro testo del 1957 Experimental Design (2nd eds. Wiley, New York), per la stima della dimensione di due campioni in una ANOVA a un criterio, quando si assume che le varianze siano uguali.

 

 a1Numero () di dati in due campioni bilanciati:

 

 

 a2Numero  ( con )  di dati in due campioni con dimensioni differenti:

 

 dove

  e 


 

Invertendo la formula per calcolare , si ricava quella per stimare .

 

b1Potenza () del test in due campioni bilanciati:

 

 

 b2Potenza  () del test in due campioni con dimensioni differenti:

 

 

 

11 – Il metodo normale con ipotesi di eterogeneità (Simple normal assuming heterogeneity):

Quando, con il modello parametrico fondato sulla normale, si assume che le varianze siano differenti, la formula precedente è trasformata in quella successiva. E’ riportata anche nel testo classico di G. W. Snedecor e W. G. Cochran  del 1989 Statistical Methods (8th edn. Iowa State University Press, Ames, Iowa) e nel volume di D. Machin e M. J. Campbell del 1987 Statistical Tables for the Design of Clinical Trials (Blackwell Scientific Publications, Oxford).

 

 a1Numero () di dati in due campioni bilanciati:

 

 

 a2Numero  ( con )  di dati in due campioni con dimensioni differenti:

 


 

Invertendo la formula per calcolare , si ricava quella per stimare .

 

b1Potenza () del test in due campioni bilanciati:

 

 

 b2Potenza  () del test in due campioni con dimensioni differenti:

 

 

A conclusione di questo elenco di formule, è conveniente ricordare che Hardeo Sahai e Anwer Khurshid, sempre nell’articolo del 1996 citato all’inizio, scrivono che i test tradizionali e ricorrenti nelle riviste di statistica applicata per confrontare due proporzioni sono il metodo esatto di Fisher e il chi quadrato con la correzione per la continuità di Yates. Ma, contrapposta a questa utilizzazione massiva, nella letteratura specialistica esiste una rilevante controversia sulla loro correttezza.

Molti ricercatori hanno dimostrato che

-  il chi quadrato tradizionale di Pearson, quello senza la correzione per la continuità, fornisce una difesa più che adeguata contro l’errore di Tipo I (errore ),

-  mentre il test esatto di Fisher e il chi quadrato con la correzione di Yates sono sistematicamente troppo conservativi.

Ne deriva che questi due metodi sono troppo poco potenti (in inglese scritto anche poco liberal), presentando un errore sistematico che li rende troppo conservativi: Essi… have an extremely conservative bias. This implies that the Fisher’s exact test and the Pearson’s chi-square with continuity correction are less powerful, and so have less chance of detecting a given difference in proportions than the chi-square test without the continuity correction (pag. 17).

La letteratura a favore di questa affermazione è numerosa. Tra gli articoli degli autori più importanti e che già nel titolo evidenziano l’approccio critico, è possibile ricordare

-  di  W. G. Conover del 1974 Some reasons for not using the Yates’ continuity correction on 2 x 2 contigency tables (with comments and rejoinder) (pubblicato su Journal of the American Statistical Association Vol. 69, pp.: 374 – 384);

-  di J. Berkson del 1978 In dispraise of the exact test: do the marginal totals of the 2 x 2 table contain relevant information respecting the table proportions (su Journal od Statistical Planning and Inference Vol. 2 pp.: 27 – 42);

-  di R. B. D’Agostino, W. Chase e A. Belanger del 1988 The appropriateness of some common procedures for testing the equality of binomial parameters (in The American Statistician  Vol. 42,  pp.: 198 – 202).

 

Un altro aspetto del test esatto di Fisher che ha suscitato varie obiezioni è assumere l'ipotesi che tutti i totali marginali si mantengano sempre fissi. E’ un concetto che è rifiuatato da chi ritiene che

-  in un esperimento il numero totale di successi non può essere prefissato,

-  ma che esso sia una variabile random.

Quindi il test chi-quadrato senza la correzione per la continuità sarebbe più appropriato del test esatto di Fisher, anche dal punto di vista logico. Tuttavia mantenere costanti i totali è un’ipotesi operativamente utile per derivare un test esatto non parametrico, che non sia fondato su distribuzioni asintotiche.

Inoltre è dimostrato che la correzione di Yates porta a ricavare gli stessi valori del test esatto.

E’ quanto afferma lo stesso Frank Yates (1902- 1994, già assistente di Fisher nel 1931 nell’Istituto di ricerche agrarie Rothamsted di Londra)

-  esattamente cinquant’anni dopo la sua proposta originaria del 1934 Contingency tables involving small numbers and the  test (su Journal of the Royal Statistical Society (Suppl. 1, pp.: 217 – 235),

-  con l’articolo del 1984  Tests of significance for 2 x 2 contingency tables (with discussion), pubblicato sulla stessa rivista Journal of the Royal Statistical Society (Series A, Vol. 147, pp.: 426 – 463).

 

Il dibattito a favore o contro queste due formule continua.

La sua conclusione porta anche alla risposta su quale sia la formula migliore

La scelta del test più appropriato non è un esercizio meramente accademico. Ha una grande importanza pratica, poiché le dimensioni del campione sono differenti se è impiegato

-  il  con oppure senza la correzione per la continuità,

-  la trasformazione in arcoseno oppure la distribuzione normale asintotica,

 ricordando sempre che deve essere utilizzato il test per il quale è stata pianificata la raccolta dei dati.

 

 

 

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Università di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007