analisi della varianza (ANOVA  I)

a un CRITERIO di classificazione

E CONFRONTI TRA PIU’ MEDIE

 

 

 

10.8.  Confronto tra medie CON ANOVA, DA dati aggregati di k campioni

 

 

Nella ricerca applicata, ricorre con frequenza il caso in cui il ricercatore deve confrontare i suoi risultati con quelli ottenuti da altri o in precedenza. Per tale comparazione, solo raramente dispone dei dati originali, da elaborare come illustrato nei paragrafi precedenti: analisi della varianza e confronti multipli. Spesso egli ha solo dei dati aggregati: media, varianza (o deviazione standard) e numero di dati (o gradi di libertà) per ogni situazione analizzata.

I testi di statistica applicata di norma riportano le formule per analisi e confronti, quando si disponga delle serie di dati originali; quasi mai come riutilizzare i dati già aggregati. I passaggi logici e i calcoli per ricostruire un’analisi congiunta sono semplici, ricavabili con facilità dalle formula precedenti. Ma per rispondere anche a questa domanda di alcuni utenti della statistica applicata, viene illustrato un caso semplice in tutti i suoi passaggi.

 

Si supponga di avere a disposizione le tre serie di dati aggregati, riportati nella tabella: oltre alla media, è necessario avere la varianza (o la deviazione standard) e il numero di dati (o i gradi di libertà):


 

 

Campioni

A

B

C

Media                       

25,42

36,30

34,96

Varianza                    

46,24

65,61

70,56

Deviazione standard  

6,8

8,1

8,4

Numero di dati          

10

8

11

Gradi di libertà

9

7

10

 

 

Dopo aver valutato se le varianze dei k gruppi sono statisticamente uguali, poiché in caso di rifiuto dell’ipotesi nulla non sono possibili le inferenze successive,

 

1 - si stima la media generale ()

 

 

 che risulta uguale 32,04;

 

2 – dal confronto con le medie dei gruppi, si ricava la devianza tra trattamenti

 

 

 

 che risulta uguale a  677,21  con gdl k-1 = 2

 

 

 3- mentre la devianza entro trattamenti è ricavata dalle varianze di ogni gruppo moltiplicate per i rispettivi gradi di libertà

 

 

 e risulta uguale a 1581,03 con gdl = 26

 

Da questi calcoli è possibile ricavare la tabella dell’ANOVA a un criterio, nella quale il test F porta ad una stima della probabilità vicino a 0.02 (il valore critico di F2,26 è 5,53 alla probabilità a = 0.02).

Di conseguenza, è possibile rifiutare l’ipotesi nulla.

 

 

FONTE

SQ

DF

F

P

TRA

677,21

2

338,61

5,56

@ 0.02

ENTRO

1581,03

26

60,81

---

---

TOTALE

2258,24

28

---

---

---

 

 

Il rifiuto dell’ipotesi nulla e la conoscenza sia del valore della devianza tra sia della devianza entro offrono poi la possibilità di effettuare i confronti multipli, sia a priori che a posteriori.

 

 

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Università di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007