VERIFICA DELLE IPOTESITEST PER UN CAMPIONE SULLA TENDENZA CENTRALE CON VARIANZA NOTAE TEST SULLA VARIANZA CON INTERVALLI DI CONFIDENZA
Quando si dispone di - due campioni indipendenti, - entrambi distribuiti in modo normale, e per ognuno di essi si calcola la varianza e , spesso si pone il problema di testare se esse sono uguali o differenti. Si vuole verificare l’ipotesi H0: contro H1: A differenza di quanto avviene quando si confrontano due medie, - dove i test utilizzano la differenza - il rapporto tra le due varianze e
chiamato variance ratio test. E’ universalmente indicato con la lettera F, in onore di Sir Ronald Aylmer Fisher (1890 –1962). - per due medie la differenza tende a zero e varia simmetricamente intorno a esso, - per due varianze il rapporto tende da 1 e varia da 1 a 0 oppure da 1 a +¥. Come per la distribuzione normale e la distribuzione c2, per le applicazioni che ne derivano è importante conoscere la forma della distribuzione di tale rapporto . Nella figura successiva, - la curva inferiore (con e ), fortemente asimmetrica, è un caso con pochi gradi di libertà; in modo più specifico, è la distribuzione di frequenza del rapporto F tra la varianza del campione 1 con = 11 dati e la varianza del campione 2 con = 5 dati; - la curva superiore (con e ), molto più simmetrica, è un caso con un numero abbastanza alto di gradi di libertà; è la variazione di F quando la varianza del campione 1 ha = 31 dati e la varianza del campione 2 ha = 61 dati.
DISTRIBUZIONE DI FREQUENZA DEL RAPPORTO
In realtà, per verificare se le due varianze sono uguali, in termini più tecnici per verificare l’ipotesi bilaterale H0: contro H1: il rapporto non è prefissato ma si utilizza
Valori critici della distribuzione F di Fisher-Snedecor con a = 0.05 I gradi di libertà del numeratore (o varianza maggiore) sono riportati in orizzontale (prima riga) I gradi di libertà del denominatore (o varianza minore) sono riportati in verticale (prima colonna)
NUMERATORE
Valori critici della distribuzione F di Fisher-Snedecor con a = 0.025 I gradi di libertà del numeratore (o varianza maggiore) sono riportati in orizzontale (prima riga) I gradi di libertà del denominatore (o varianza minore) sono riportati in verticale (prima colonna)
NUMERATORE
Valori critici della distribuzione F di Fisher-Snedecor con a = 0.01 I gradi di libertà del numeratore (o varianza maggiore) sono riportati in orizzontale (prima riga) I gradi di libertà del denominatore (o varianza minore) sono riportati in verticale (prima colonna)
NUMERATORE
Valori critici della distribuzione F di Fisher-Snedecor a = 0.005I gradi di libertà del numeratore (o varianza maggiore) sono riportati in orizzontale (prima riga) I gradi di libertà del denominatore (o varianza minore) sono riportati in verticale (prima colonna)
NUMERATORE
- la varianza maggiore () è posta al numeratore, - la varianza minore () è posta al denominatore, in modo tale che il risultato è sempre . Si rifiuta l’ipotesi nulla alla probabilità a, quando - il valore F calcolato è superiore al valore critico, riportato dalla tabella alla probabilità a/2, - per i gradi di libertà corrispondenti alla varianza posta al numeratore e a quella al denominatore. In termini più specifici, nel caso di un test bilaterale, - se la probabilità prescelta è a = 0.05 il valore critico di è quello della tabella a = 0.025, - se la probabilità prescelta è a = 0.01 il valore critico di è quello della tabella a = 0.005
Nel caso di un’ipotesi unilaterale, quale H0: contro H1: dove - a priori si è stabilito, ad esempio, che si vuole verificare se la varianza del campione 2 sia effettivamente maggiore di quella del campione 1, si utilizza il rapporto
e si confronta il valore F ottenuto con quello critico, riportato nella tabella di probabilità a, con - df = al numeratore - df = al denominatore. - è maggiore, si rifiuta l’ipotesi nulla H0: e si accetta H1: ; - è minore, si accetta l’ipotesi nulla H0: I valori riportati nelle tabelle sono sempre maggiori di 1. Quindi, se risulta , automaticamente l’ipotesi nulla è accettata. Tuttavia, se era ragionevolmente atteso che il risultato sperimentale fosse , sarebbe utile: - verificare se l’esperimento è stato condotto in modo corretto, - scoprire quale sia il motivo di una risposta opposta a quella attesa. Se l'ipotesi espressa a priori è nella direzione opposta rispetto quella formulata in precedenza, l'unica differenza consiste nello scambio tra numeratore e denominatore.
ESEMPIO 1 (TEST BILATERALE). Per accertare se i prodotti di due aziende hanno una variabilità statisticamente differente, su 9 campioni della prima azienda si è ottenuto = 2,39 e su 13 campioni della seconda azienda = 5,67. Verificare se effettivamente le due varianze sono differenti, alla probabilità = 0.05
Risposta. Per verificare alla probabilità complessiva = 0.05 l’ipotesi bilaterale H0: contro H1: il test F è fondato sul rapporto tra la varianza maggiore e quella minore. Con i dati dell’esempio
si ottiene F = 2,37 con df = 12 al numeratore e df = 8 al denominatore. Nella tabella dei valori critici per = 0.025 e con df = 12 al numeratore e df = 8 al denominatore, è riportato il valore 3,51. Il valore calcolato (2,37) è sensibilmente inferiore: si accetta l’ipotesi nulla H0, in quanto non si hanno elementi sufficienti per rifiutarla, nonostante il fatto che una varianza sia più del doppio dell’altra.
ESEMPIO 2 (TEST UNILATERALE). La costanza dei parametri è uno degli indici fondamentali di buona qualità di un prodotto industriale. In una azienda farmaceutica, per valutare il miglioramento nell'emissione di uno spray, è stata misurata la varianza di 20 bombolette del vecchio tipo ottenendo . Con 60 bombolette di nuova produzione, il risultato è stato = 0,56. Il miglioramento è statisticamente significativo?
Risposta. E' un test unilaterale, nel quale si vuole dimostrare che la seconda produzione ha una varianza reale minore. In termini più formali, si vuole verificare l'ipotesi H0: contro H1:
Con i dati dell’esempio, si applica il test = 2,25 ottenendo = 2,25 con gradi di libertà (come indicano i due numeri tra parentesi) 19 al numeratore e 59 al denominatore. Non disponendo di tabelle dettagliate, che devono essere cercate su testi specifici o sono fornite dai programmi informatici, in quelle precedenti prendiamo come valore molto prossimo al reale quello con 20 gradi di libertà al numeratore e 60 al denominatore. In realtà si dovrebbe fare una interpolazione tra i dati disponibili. Poiché il test è unilaterale, la probabilità fornita dalla tabella è quella complessiva. Nella tabella dei valori critici, per i gradi di libertà 20 e 60 - alla probabilità a = 0,025 corrisponde il valore = 1,94 - alla probabilità a = 0,01 corrisponde il valore = 2,20 - alla probabilità a = 0,005 corrisponde il valore = 2,39 Il valore calcolato deve essere confrontato con quello della probabilità minore che risulta significativa. Con i dati dell'esempio, il valore calcolato (2,25) è maggiore di quello critico (2,20), corrispondente alla probabilità a = 0,01. Pertanto con probabilità P < 0,01 di commettere un errore di I tipo, si rifiuta l'ipotesi nulla H0 e implicitamente si accetta l'ipotesi alternativa H1. La conclusione tecnica è che la nuova produzione ha una variabilità di emissione della quantità di spray che è significativamente più costante della produzione precedente. Per verificare la significatività della differenza tra una varianza campionaria (), estratta da una popolazione distribuita in modo normale, e una varianza attesa ()
si è utilizzata la distribuzione con gradi di libertà . Per verificare la significatività della differenza tra due varianze campionarie, calcolate su due campioni indipendenti estratti da due popolazioni distribuite in modo normale,
si è utilizzata la distribuzione - con gradi di libertà con gradi di libertà , sia per la varianza maggiore () sia per quella minore (). Pertanto, alla stessa probabilità a, esiste la relazione
che - il con gdl = quando viene diviso per i suoi gdl - è uguale al valore di con gdl = al numeratore e al denominatore Ad esempio, nelle rispettive tabelle dei valori critici, alla probabilità complessiva a = 0.05, - il valore di alla probabilità a = 0.025 bilaterale con gdl = 24 è uguale a 39,364 - il valore di probabilità a = 0.05 unilaterale con gdl 24 e ¥ è uguale a 1,64 Da questi dati si può facilmente ricavare che
i due valori ( e ) coincidono. Anche questa uguaglianza - tra il valore di alla probabilità a = 0.025 bilaterale - e il valore di probabilità a = 0.05 unilaterale è una dimostrazione che i valori di F riportati nelle tabelle sono per una probabilità unilaterale. VALORI DI PER a > 0.5 La distribuzione dei valori è asimmetrica e abitualmente di essi è presa la parte nella coda destra, corrispondenti a probabilità a piccole, comunque sempre P < 0.5, che hanno valori sempre maggiori di 1 . In alcune situazioni, può avvenire che sia richiesto il valore di nell’altra coda della distribuzione, vale a dire per probabilità a > 0.5 . Poiché non sono riportati in tabelle specifiche, se non in pubblicazioni altamente specializzate, può essere utile ricavarli dai valori critici abituali, riportati nelle tabelle di uso comune. A tale scopo, scambiando i gdl tra numeratore e denominatore, è utile calcolare il reciproco, vale la relazione
dove - a = probabilità nella coda destra, ad esempio P = 0.05 - 1- a = probabilità corrispondente nella coda sinistra, ad esempio P = 0,95 - n1 e n2 = gradi di libertà del numeratore e del denominatore, che devono essere scambiati.
ESEMPIO 3. Stimare il valore di F per la probabilità P = 0.95 con gdl 9 al numeratore e 4 al denominatore. Risposta. Dalla tabella dei valori critici, per la probabilità P = 0.05 con gdl 4 al numeratore e 9 al denominatore il valore di F è 3,63. Da
(con simboli non ridotti a pedice per meglio leggere i dati) si ricava che per la probabilità P = 0.95 con gdl 9 al numeratore e 4 al denominatore il valore di F è 0,275.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Manuale di Statistica per la Ricerca e la Professione © Lamberto Soliani - Dipartimento di Scienze Ambientali, Università di Parma (apr 05 ed) ebook version by SixSigmaIn Team - © 2007 |