VERIFICA DELLE IPOTESI

TEST PER UN CAMPIONE SULLA TENDENZA CENTRALE CON VARIANZA NOTA

E TEST SULLA VARIANZA

CON INTERVALLI DI CONFIDENZA

 

 

4.16.  INTERVALLO DI CONFIDENZA DELLA DEVIAZIONE STANDARD E STIMA DELLA DIMENSIONE DEL CAMPIONE

 

 

Nel paragrafo precedente, è stata presentata la serie di passaggi logici che dimostrano come i valori estremi  dell'intervallo di confidenza della deviazione standard () della popolazione possano essere calcolati anche mediante

 la diseguaglianza

 

 in modo del tutto analogo al metodo presentato per la varianza

 

ESEMPIO 1.  Su 20 campioni di un farmaco, è stata misurata la quantità di principio attivo: la deviazione standard è risultata  = 10,7. Quale è il limite di confidenza della deviazione standard vera  per la quantità di principio attivo presente nel farmaco, alla probabilità del 95%?

 

Risposta. Per utilizzare la formula appena riportata, con = 10,7   e    = 19 servono anche i valori critici del  per = 0,05 in totale, considerando le due code della distribuzione:

-  per  a = 0.975  il valore è  = 8,907

-  per  a = 0.025  il valore è   = 32,852.

Con essi, 

- il limite inferiore (lower limit)

 risulta L1 = 8,13

- il limite superiore (upper limit)

 risulta L2 = 15,63.

 

In molte aziende, queste misure dell’intervallo di confidenza della deviazione standard  rientrano nella routine, per il controllo di qualità della produzione. Di conseguenza, il calcolo è stato semplificato con l’uso di tabelle, come la successiva. Soprattutto nel passato, quando i calcoli erano svolti manualmente e quindi richiedevano tempo, la preferenza era data a questi metodi grafici. Nel manuale della Marina Americana già citato, rispetto ai calcoli illustrati nel paragrafo precedente, per evitare inutili complicazioni era raccomandato:

The following method is preferable in practice.


 

COEFFICIENTI PER DETERMINARE I LIMITI DELL’INTERVALLO DI CONFIDENZA

DELLA DEVIAZIONE STANDARD s

 

 

 

 

DF

 

 

 

DF

1

0,510

15,947

0,446

31,910

0,356

159,576

1

2

0,578

4,415

0,521

6,285

0,434

14,124

2

3

0,620

2,920

0,566

3,729

0,483

6,468

3

4

0,649

2,372

0,599

2,874

0,519

4,396

4

5

0,672

2,089

0,624

2,453

0,546

3,485

5

6

0,690

1,915

0,644

2,202

0,569

2,980

6

7

0,705

1,797

0,661

2,035

0,588

2,660

7

8

0,718

1,711

0,675

1,916

0,604

2,439

8

9

0,729

1,645

0,688

1,826

0,618

2,278

9

10

0,739

1,593

0,699

1,755

0,630

2,154

10

11

0,748

1,551

0,708

1,698

0,641

2,056

11

12

0,755

1,515

0,717

1,651

0,651

1,976

12

13

0,762

1,485

0,725

1,611

0,660

1,910

13

14

0,769

1,460

0,732

1,577

0,669

1,854

14

15

0,775

1,437

0,739

1,548

0,676

1,806

15

16

0,780

1,418

0,745

1,522

0,683

1,764

16

17

0,785

1,400

0,750

1,499

0,690

1,727

17

18

0,790

1,384

0,756

1,479

0,696

1,695

18

19

0,794

1,370

0,760

1,461

0,702

1,666

19

20

0,798

1,358

0,765

1,444

0,707

1,640

20

21

0,802

1,346

0,769

1,429

0,712

1,617

21

22

0,805

1,335

0,773

1,415

0,717

1,595

22

23

0,809

1,326

0,777

1,403

0,722

1,576

23

24

0,812

1,316

0,781

1,391

0,726

1,558

24

25

0,815

1,308

0,784

1,380

0,730

1,542

25

26

0,818

1,300

0,788

1,370

0,734

1,526

26

27

0,820

1,293

0,791

1,361

0,737

1,512

27

28

0,823

1,286

0,794

1,352

0,741

1,499

28

29

0,825

1,280

0,796

1,344

0,744

1,487

29

30

0,828

1,274

0,799

1,337

0,748

1,475

30

40

0,847

1,228

0,821

1,280

0,774

1,390

40

50

0,861

1,199

0,837

1,243

0,793

1,337

50

60

0,871

1,179

0,849

1,217

0,808

1,299

60

70

0,879

1,163

0,858

1,198

0,820

1,272

70

80

0,886

1,151

0,866

1,183

0,829

1,250

80

90

0,892

1,141

0,873

1,171

0,838

1,233

90

100

0,897

1,133

0,879

1,161

0,845

1,219

100

 

 

Per la probabilità a prestabilita e per i gradi di libertà (DF) del campione,

-  il limite inferiore è L1 =

il limite superiore è L2 =

dove   e   sono tratti dalla tabella precedente.

Essi possono essere ricavati facilmente

 da

         e        

 

Ad esempio, con gradi di libertà (DF) =  = 19, i valori critici del  per  = 0,05 in totale, considerando le due code della distribuzione, sono

-  per  a = 0.975  il valore  = 8,907

-  per  a = 0.025  il valore  = 32,852

Nella tabella sono riportati i coefficienti  = 0,760  e   = 1,461. E’ semplice osservare che possono essere ottenuti da

         e        

con arrotondamento.

 

Per campioni grandi (DF >100), sempre secondo quanto riportato nello stesso manuale, i valori   e   sono ricavati dalle formule seguenti:

 - per  da

- per  da

- per  da

 

ESEMPIO 2   (CON GLI STESSI DATI DELL’ESEMPIO 1). Su 20 campioni di un farmaco, è stata misurata la quantità di principio attivo: la deviazione standard è risultata  = 10,7.

Quale è il limite di confidenza della deviazione standard vera  per la quantità di principio attivo presente nel farmaco, alla probabilità del 95%?

 

Risposta. Per  = 19  e  = 0,05 nella tabella sono riportati i coefficienti  = 0,760  e   = 1,461.

Di conseguenza, con  = 10,7

-  il limite inferiore è L1 =  = = 8,13

-  il limite superiore è L2 =  =  = 15,63

 

Il calcolo dell’intervallo di confidenza della deviazione standard non comporta alcun vantaggio, né teorico né pratico, rispetto al calcolo equivalente effettuato con la varianza.

L’uso della deviazione standard diventa utile,

- quando attraverso i metodi grafici si voglia determinare la dimensione  del campione necessario,

- per stimare  con un scarto massimo determinato in percentuale () e un livello di confidenza .

 

ESEMPIO 3 (USO DEL GRAFICO PER STIMARE ). Per stimare la variabilità di un prodotto industriale, quante misure campionarie occorre raccogliere se

-  si vuole ottenere una deviazione standard  che nell’intervallo con più o meno il 30%

-  abbia una probabilità P del 95% di contenere il valore vero ?

 

Risposta. Sull’asse delle ascisse,

-  si individua il valore  = 30 e si sale verticalmente,

-  fino a incontrare la retta del coefficiente di confidenza 0,95 in un punto

-  che trasferito orizzontalmente sull’asse delle ordinate corrisponde ai gradi di libertà 20-21.

Servono almeno 21-22 misure, per calcolare un valore  in modo che, con una probabilità di errare minore del 5%, il valore vero  sia compreso nell’intervallo ± il 30%.


 

 

Il grafico precedente è una modifica, fatta dagli autori del testo della marina militare americana, del metodo proposto da Greenwood J. A. e M. M. Sandmire nel 1950 nell’articolo Sample Size Required for Estimating tre Standard Deviation as a Percent of Its True Value (su Journal of the American Statistical Association Vol. 45, p. 258), allo scopo di renderne l’uso ancora più semplice e rapido.

 

ESEMPIO 4 (USO DEL GRAFICO PER STIMARE  E CONFRONTO DEL RISULTATO CON L'ESEMPIO 3). Per stimare la variabilità di un prodotto industriale, quante misure campionarie occorre raccogliere se

-  si vuole ottenere una deviazione standard  che nell’intervallo con più o meno il 10%

-  abbia una probabilità P del 95% di contenere il valore vero ?

 

Risposta. Sull’asse delle ascisse,

-  si individua il valore  = 10 e si sale verticalmente,

-  fino a incontrare la retta del coefficiente di confidenza 0,95 in un punto

-  che, trasferito orizzontalmente sull’asse delle ordinate, corrisponde a gradi di libertà 190.

Servono almeno 190 misure

Nella lettura del numero di gradi di libertà sull’asse delle ordinate, occorre porre attenzione al fatto che la scala è di tipo logaritmico e quindi per valori maggiori dei gradi di libertà l’errore nell’approssimazione diventa molto più grande, in frequenze assolute

 

Il numero  di dati necessari aumenta notevolmente, quando si sceglie di commettere un errore minore. Questo errore può essere quantificato definendo l’ampiezza dell’intervallo di confidenza della deviazione standard, in percentuale rispetto al valore della deviazione standard.

Più esattamente,

-  tra il valore  e il numero  dei DF

-  si mantengono le relazioni quadratiche, già illustrate per la differenza  e  nel calcolo di una media con la precisione richiesta.

A dimostrazione di questa relazione, nel confronto tra i risultati degli ultimi due esempi (3 e 4) è semplice osservare che

- nell’esempio 4 l’errore massimo che si vuole commettere  = 10 corrisponde a 1/3 di quello accettato nell’esempio 3

- e che il numero minimo  di dati richiesto è moltiplicato per 9 (da 21-22 a circa 190).

 

 

 

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Università di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007