METODI NON PARAMETRICI PER DUE CAMPIONI INDIPENDENTI
9.1. Test per 2 campioni indipendenti
La non-normalità di una distribuzione ha conseguenze rilevanti sulle probabilità calcolate, quando si utilizza un test parametrico; di conseguenza, è una condizione di non-validità. Ma quando si dispone di campioni piccoli, come è frequente in vari settori della ricerca biologica e ambientale, è difficile e spesso impossibile valutare con attendibilità la forma della distribuzione. Ne deriva che spesso la scelta non è fondata su elementi rigorosi, ma viene lasciata alla intuizione o addirittura alle preferenze personali. Le opinioni sulla convenienza della scelta tra test parametrici e non parametrici divergono. Alcuni ritengono che sia più utile utilizzare sempre i metodi parametrici, quando non sia possibile dimostrare che i dati sono tratti da una popolazione distribuita normalmente. Altri preferiscono i test non parametrici, in quanto forniscono - generalmente risultati meno potenti; ma a volte di poco e in alcune condizioni addirittura più potenti (come sarà dimostrato anche in questo capitolo con alcuni esempi tratti da testi classici); - ma sempre più attendibili, quindi meno confutabili, perché non richiedono condizioni di validità altrettanto rigorose, soprattutto per quanto riguarda la forma della distribuzione. Il dibattito sulla scelta del test più adeguato per un certo campione di dati non ha portato a risposte oggettive ed universali; ma solo indicazioni di massima. Di conseguenza, è utile ricordare ancora che, secondo vari autori di testi di statistica applicata, in tutti i casi d’incertezza è bene utilizzarli entrambi, poiché il confronto ragionato tra un test parametrico e il corrispondente non parametrico permette di ottenere informazioni molto più utili sulle probabilità stimate.
Alcuni test non parametrici per 2 campioni indipendenti sono già stati presentati nell'esposizione dei metodi di confronto tra 2 distribuzioni osservate: - il e il test G in tabelle di contingenza 2 x 2, per grandi campioni - il test Z per la differenza tra due proporzioni, in grandi campioni; - il metodo delle probabilità esatte di Fisher, per piccoli campioni; - il in tabelle 2 x n.
Tra i test per 2 campioni indipendenti utilizzati per inferenze sulla tendenza centrale, in quasi tutti i testi e la maggior parte dei programmi informatici sono riportati: - il test della mediana e la stima dell’intervallo di confidenza, - il test di Wilcoxon-Mann-Whitney della somma dei ranghi, - il test U di Mann-Whitney dell’ordine robusto dei ranghi insieme con il test S di Kendall, - il test di permutazione o di casualizzazione. Per i primi due sono state proposti metodi per stimare l’intervallo di confidenza della differenza tra le mediane dei due gruppi a confronto. I tre test d’inferenza appena elencati (mediana, Mann-Whitney, casualizzazione) possono essere ritenuti equivalenti ai test per 2 campioni dipendenti già presentati: - il test della mediana al test dei segni, - il test T di Wilcoxon-Mann-Whitney, il test U di Mann-Whitney e il test S di Kendall (tra loro equivalenti) al test T di Wilcoxon, - il test di permutazione o casualizzazione al corrispondente test per 2 campioni dipendenti. Come discusso nel capitolo precedente, la scelta dipende soprattutto dal tipo di scala utilizzata e dalle caratteristiche delle distribuzioni.
Tra i test sulla tendenza centrale può essere compreso il test di Gart, utile per verificare se l’ordine di somministrazione di due principi attivi ha un effetto significativo. Con due campioni indipendenti sono possibili anche confronti tra altri parametri della distribuzione oltre alla tendenza centrale, come la variabilità e la forma, per i quali in questo capitolo sono proposti alcuni test specifici: - il test delle successioni per due campioni, per verificare se due distribuzioni indipendenti abbiano almeno un parametro significativamente differente; - il test di Siegel-Tukey, il test di Freund-Ansari-Bradle, il test di Conover e il test dei ranghi equivalenti di Moses, per differenze nella dispersione o variabilità.
| |
Manuale di Statistica per la Ricerca e la Professione © Lamberto Soliani - Dipartimento di Scienze Ambientali, Università di Parma (apr 05 ed) ebook version by SixSigmaIn Team - © 2007 |