TEST NON PARAMETRICI PER PIU' CAMPIONI
15.1. I TEST NON PARAMETRICI PIU’ UTILIZZATI, PER K CAMPIONI.
Tutti i test non parametrici hanno in comune una sola caratteristica: non richiedono la normalità della distribuzione. Presentano quindi un vantaggio indubbio rispetto a quelli parametrici, sia quando la non-normalità è evidente, sia quando la normalità della distribuzione dei dati è solo probabile. In esperimenti nuovi e con pochi dati, non è possibile dimostrare che la condizione di normalità è rispettata, data la bassa potenza dei test relativi. Il test per l’omogeneità della varianza (Hartley, Cochran, Bartlett, Levene) può non risultare significativo, in particolare con campioni piccoli; ma non essere in grado di rifiutare l’ipotesi nulla sulla normalità ed omoschedasticità non significa che essa sia vera. Il test F ed il test t bidirezionale sono metodi statisticamente robusti, rispetto a questa condizione: la non-normalità, pure quando causata da forte asimmetria, determina errori ridotti, nel calcolo della significatività. Alcuni autori stimano che una forte asimmetria può fissare la variazione delle probabilità P tra 0.04 e 0.07 quando quella nominale a è 0.05, mentre essa varia tra 0.005 e 0.02 quando a nominale è 0.01. E’ un’approssimazione che permette di accettare i risultati, di non essere ipercritici sulla loro validità, poiché anche i test non parametrici non sempre conducono a stime più precise.
Le trasformazioni dei dati (presentate e discusse nella parte finale del capitolo precedente) possono rappresentare una soluzione. Ma se, dopo la loro applicazione, le caratteristiche della distribuzione non migliorano in modo sensibile, avvicinandosi sufficientemente a quelle richieste dai test parametrici, i metodi non parametrici sono indubbiamente da preferire.
Le situazioni più frequenti, in cui è consigliato scegliere un test non parametrico, si realizzano quando: 1 - i campioni mantengono una distribuzione estremamente asimmetrica; 2 - il test è a una coda e l’alternativa sarebbe il test t unilaterale (che è più sensibile all’asimmetria); 3 - i campioni a confronto hanno un numero di dati molto differente (poiché soprattutto in statistica parametrica influisce sulla potenza del test); 4 - le distribuzioni non sono omoschedastiche (condizione d’invalidità severa, per i test parametrici); 5 - sono presenti valori fortemente anomali (outliers) (perdita di valore della media e quindi delle misure da essa derivate, come la varianza); 6 - è stata utilizzata una scala ordinale oppure qualitativa (e quindi è doveroso utilizzare l’informazione realmente fornita dai dati).
Per campioni sufficientemente grandi, i test parametrici possono essere utilizzati anche con dati rappresentati da conteggi di variabili binarie: abitualmente, hanno una distribuzione non normale in piccoli campioni, ma la approssimano abbastanza bene con campioni sufficientemente grandi, come già ripetutamente dimostrato per la distribuzione binomiale, la poissoniana, la ipergeometrica e con il test c2 in tabelle 2 x 2.
Anche i test non parametrici per più campioni, proposti in tempi e situazioni diverse da autori differenti per affrontare problemi specifici, possono essere didatticamente classificati sulla base dell’organizzazione dell’esperimento. Nei testi di statistica applicata, è molto frequente la suddivisione in - test per k campioni indipendenti, - test per k campioni dipendenti, analoghi rispettivamente all'analisi della varianza ad un criterio e all’analisi a due criteri di classificazione.
I test non parametrici per k campioni indipendenti maggiormente utilizzati nella ricerca e più frequentemente riportati nei programmi informatici sono: - il e il test G in tabelle M x N (già presentati in modo dettagliato nel capitolo specifico), - l’estensione del test della mediana e il test di Nemenyi, per la tendenza centrale - il test di Kruskal-Wallis, detto anche analisi non parametrica della varianza per un criterio di classificazione, che può essere visto come l’estensione del test di Wilcoxon–Mann-Whitney, fondato sui ranghi; - i test per l’omogeneità della varianza.
I test non parametrici per k campioni dipendenti più diffusi sono: - il test Q di Cochran e il test di Bowker (o estensione del test di McNemar) - il test di Friedman, denominato pure analisi della varianza per ranghi a due criteri di classificazione.
| |
Manuale di Statistica per la Ricerca e la Professione © Lamberto Soliani - Dipartimento di Scienze Ambientali, Università di Parma (apr 05 ed) ebook version by SixSigmaIn Team - © 2007 |