TEST NON PARAMETRICI

PER PIU' CAMPIONI

 

 

15.1.   I TEST NON PARAMETRICI PIU’ UTILIZZATI, PER K CAMPIONI.

 

 

Tutti i test non parametrici hanno in comune una sola caratteristica: non richiedono la normalità della distribuzione. Presentano quindi un vantaggio indubbio rispetto a quelli parametrici, sia quando la non-normalità è evidente, sia quando la normalità della distribuzione dei dati è solo probabile. In esperimenti nuovi e con pochi dati, non è possibile dimostrare che la condizione di normalità è rispettata, data la bassa potenza dei test relativi. Il test per l’omogeneità della varianza (Hartley, Cochran, Bartlett, Levene) può non risultare significativo, in particolare con campioni piccoli; ma non essere in grado di rifiutare l’ipotesi nulla sulla normalità ed omoschedasticità non significa che essa sia vera.

Il test F ed il test t bidirezionale sono metodi statisticamente robusti, rispetto a questa condizione: la non-normalità, pure quando causata da forte asimmetria, determina errori ridotti, nel calcolo della significatività. Alcuni autori stimano che una forte asimmetria può fissare la variazione delle probabilità P tra 0.04 e 0.07 quando quella nominale a è 0.05, mentre essa varia tra 0.005 e 0.02 quando a nominale è 0.01. E’ un’approssimazione che permette di accettare i risultati, di non essere ipercritici sulla loro validità, poiché anche i test non parametrici non sempre conducono a stime più precise.

 

Le trasformazioni dei dati (presentate e discusse nella parte finale del capitolo precedente) possono rappresentare una soluzione. Ma se, dopo la loro applicazione, le caratteristiche della distribuzione non migliorano in modo sensibile, avvicinandosi sufficientemente a quelle richieste dai test parametrici, i metodi non parametrici sono indubbiamente da preferire.

 

Le situazioni più frequenti, in cui è consigliato scegliere un test non parametrico, si realizzano quando:

1 - i campioni mantengono una distribuzione estremamente asimmetrica;

2 - il test è a  una coda e l’alternativa sarebbe il test t unilaterale (che è più sensibile all’asimmetria);

3 - i campioni a confronto hanno un numero di dati molto differente (poiché soprattutto in statistica parametrica influisce sulla potenza del test);

4 - le distribuzioni non sono omoschedastiche (condizione d’invalidità severa, per i test parametrici);

5 - sono presenti valori fortemente anomali (outliers) (perdita di valore della media e quindi delle misure da essa derivate, come la varianza);

6 - è stata utilizzata una scala ordinale oppure qualitativa (e quindi è doveroso utilizzare l’informazione realmente fornita dai dati).

 

Per campioni sufficientemente grandi, i test parametrici possono essere utilizzati anche con dati rappresentati da conteggi di variabili binarie: abitualmente, hanno una distribuzione non normale in piccoli campioni, ma la approssimano abbastanza bene con campioni sufficientemente grandi, come già ripetutamente dimostrato per la distribuzione binomiale, la poissoniana, la ipergeometrica e con il test c2 in tabelle 2 x 2.

 

Anche i test non parametrici per più campioni, proposti in tempi e situazioni diverse da autori differenti per affrontare problemi specifici, possono essere didatticamente classificati sulla base dell’organizzazione dell’esperimento. Nei testi di statistica applicata, è molto frequente la suddivisione in

-          test per k campioni indipendenti,

-          test per k campioni dipendenti,

 analoghi rispettivamente all'analisi della varianza ad un criterio e all’analisi a due criteri di classificazione.

 

I test non parametrici per k campioni indipendenti maggiormente utilizzati nella ricerca e più frequentemente riportati nei programmi informatici sono:

- il  e il test G in tabelle M x N  (già presentati in modo dettagliato nel capitolo specifico),

- l’estensione del test della mediana e il test di Nemenyi, per la tendenza centrale

- il test di Kruskal-Wallis, detto anche analisi non parametrica della varianza per un criterio di classificazione, che può essere visto come l’estensione del test di Wilcoxon–Mann-Whitney, fondato sui ranghi;

- i test per l’omogeneità della varianza.

 

I test non parametrici per k campioni dipendenti  più diffusi sono:

- il test Q di Cochran e il test di Bowker (o estensione del test di McNemar)

- il test di Friedman, denominato pure analisi della varianza per ranghi a due criteri di classificazione.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Università di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007