PROPORZIONI  E  PERCENTUALI,  RISCHI,  ODDS  E  TASSI

 

 

 

5.12. TEST SULLA DIFFERENZA TRA DUE PROPORZIONI, CON IL METODO DI FELDMAN E KLUGER, PER ABBREVIARE IL METODO ESATTO DI FISHER.

 

 

Nel caso del confronto tra due proporzioni sperimentali (p1 e p2), per un test bilaterale oppure unilaterale un metodo consiste nel confronto tra le frequenze assolute presentate in una tabella di contingenza 2 x 2, già illustrate nel capitolo III.

Nel caso di campioni molto piccoli, si può utilizzare il metodo esatto di Fisher (Fisher exact test), derivato dalla distribuzione ipergeometrica.

Nel caso di campioni intermedi, formati complessivamente da alcune decine di osservazioni (tra 30 e 100), si possono usare sia il test G sia il test c2, eventualmente con le relative correzioni per la continuità.

Nel caso di campioni grandi, sono ritenuti validi il test G, il test c2 e l’approssimazione alla distribuzione normale.

 

Nel caso di campioni piccoli, il metodo esatto di Fisher pone il problema pratico di effettuare calcoli con i fattoriali per valori superiori a 20-30 unità; non ha soluzioni semplici e rapide, neppure ricorrendo alla trasformazione logaritmica. A questo scopo, sono state proposte varie formule abbreviate, tra le quali la formula abbreviata proposta da S. E. Feldman  e E. Kluger nel 1963 (nell’articolo Short cut calculation of the Fisher-Yates “exact test” pubblicato su Psychometrika vol. 28, pp.: 289 - 291).

Riprendendo la stessa simbologia utilizzata nel capitolo precedente e gli stessi dati per meglio evidenziare il confronto diretto dei risultati

 

 

Risposta   X

Risposta   x

Totale

Campione   Y

Campione   y

Totale

 

 

 con il metodo esatto di Fisher la probabilità di ogni singola risposta è data da

 

 

Applicata all’esempio della tabella sottostante

 

DATI OSSERVATI

Animali

Sopravvissuti

Animali

Morti

Totale

Pesticida  A

7

1

8

Pesticida  B

3

6

9

Totale

10

7

17


 

 si ricava che

-  la probabilità di avere per caso la risposta osservata nell’esperimento, nella quale il valore più piccolo osservato nelle quattro caselle , ,, è 1,

 

 

-  e la risposta successiva  più estrema nella stessa direzione è

 

RISPOSTA PIU’ ESTREMA

Animali

Sopravvissuti

Animali

Morti

Totale

Pesticida  A

8

0

8

Pesticida  B

2

7

9

Totale

10

7

17

 

 

 con probabilità  uguale a

 

Secondo il metodo di Feldman e Kluger, questa ultima probabilità può essere ottenuta dalla precedente, in modo più rapido di quanto sia possibile con i calcoli fondati sulla distribuzione ipergeometica, che sono effettivamente lunghi da effettuare manualmente

Indicando con

 il valore minore della prima tabella (uguale a 1 nell’esempio)

 il valore corrispondente nella diagonale (uguale a 3 nell’esempio)

  e   i due valori nell’altra diagonale sempre della prima tabella (uguali a 7 e a 6)

 questa seconda probabilità () è ottenuta dalla precedente () ,

 attraverso la relazione

dove

 =

 =

 

 

ESEMPIO.   Con gli stessi dati dell’ultima tabella, la seconda probabilità ( = 0,00185) è ricavata in modo più rapido dalla precedente (= 0,03455),

 attraverso la relazione

 

Nel caso di un test bilaterale, la distribuzione delle probabilità quasi mai è simmetrica, soprattutto quando i campioni sono molto piccoli. Come calcolare la probabilità complessiva, con il metodo esatto di Fisher considerando ambedue le code della distribuzione, vede gli statistici divisi. Esistono due scuole di pensiero:

-  alcuni ritengono corretto moltiplicare per due la probabilità calcolata in precedenza, cioè stimata per la coda alla quale appartiene il valore minore della tabella;

-  altri ritengono che questo non sia un procedimento corretto, in quanto la distribuzione spesso non è simmetrica e la probabilità, quando calcolata da un estremo fino al valore centrale, potrebbe essere maggiore di 0,5 e quindi superare 1, se moltiplicata per due. Per una probabilità, è un risultato assurdo.

 

Per facilitare il calcolo delle probabilità anche in un test bilaterale, Feldman e Kluger hanno proposto una procedura che permette di calcolare la probabilità di ognuna delle possibili risposte, a partire da un estremo.

Prima della diffusione dei computer, le proposte per una stima semplificata delle probabilità esatte in tabelle 2 x 2  e in tabelle più ampie, di dimensioni M x N, sono state numerose. Tra quelle che hanno avuto maggiore successo è da ricordare il metodo dei coefficienti binomiali.

In letteratura è stato discusso da vari autori, dei quali un breve elenco comprende:

-  Leslie P. H. per il suo articolo del 1955 (A simple methods of calculating the exact probability in 2x2 contingency tables with small marginal totals pubblicato su Biometrika Vol. 42, pp.: 522 – 523);

- Leyton M. K.  per il suo articolo del 1968 (con Rapid calculation of exact probabilities for 2 x 3 contingency tables, pubblicato da Biometrics vol. 24, pp.: 714 – 717);

-   Ghent A. W. per il suo articolo del 1972 (con A method for exact testing of 2 x 2, 2 x 3, 3 x 3, and other contingency tables, employing binomial coefficients pubblicato su Amer. Midland Natur. Vol. 88, pp.: 15 – 27);

-   Carr W. E. per il suo articolo del 1980 (con Fisher’s exact test extended to more than two samples of equal size, pubblicato da Technometrics  vol. 22, pp.. 269- 270).

Attualmente, questo problema è superato dalla possibilità di calcolo dei computer.

 

 

 

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Università di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007