CAP III - ANALISI DELLE FREQUENZE

 

 

3.12.   ESERCIZI SVOLTI PER DATI IN TABELLE DI CONTINGENZA

 

 

ESERCIZIO 1.   Per lo studio di frequenze alleliche del marcatore genetico ossidasi in popolazioni naturali di faggio di 4 differenti località dell’Appennino (Abetone, Pisanino, Pradarena, Pradaccio), sono state rilevate le frequenze di 3 alleli.

Le frequenze osservate sono quelle riportate nella tabella sottostante.

 

FREQUENZE  OSSERVATE

 

 

Allele 1

Allele 2

Allele 3

Totale

Abetone

7

244

49

300

Pisanino

8

156

24

188

Pradarena

22

231

31

284

Pradaccio

143

185

116

444

Totale

180

816

220

1216

 

Esiste una differenza significativa nella distribuzione delle 3 frequenze alleliche? Si può sostenere che esiste associazione tra località e frequenze alleliche, per cui i 3 alleli non hanno la stessa distribuzione percentuale nelle 4 località?

 

Risposta.  Dai totali marginali delle frequenze osservate, si calcolano le frequenze che dovremmo attenderci se fosse vero che non esiste differenza tra le percentuali dei 3 alleli nelle 4 località (distribuzione attesa, nella condizione che Hsia vera).

 

FREQUENZE ATTESE SECONDO L’IPOTESI NULLA

 

 

Allele 1

Allele 2

Allele 3

Totale

Abetone

44,4

201,3

54,3

300

Pisanino

27,8

126,2

34,0

188

Pradarena

42,0

190,6

51,4

284

Pradaccio

65,8

297,9

80,3

444

Totale

180

816

220

1216

 

Con la formula generale (Oss. - Att)2/ Att. si calcola il valore del c2, che avrà 6 gradi di libertà.

 

 

Si ottiene un chi quadrato con 6 gradi  di libertà uguale a 240,571.

Il valore risulta molto alto; la probabilità a che sia casuale è molto piccola, inferiore a 0,0001.

Si conclude che esiste una differenza altamente significativa, fra le distribuzioni percentuali dei 3 alleli nelle 4 località.

Per una lettura più dettagliata del test, sarebbe utile  valutare quanto ogni casella contribuisce al valore complessivo del chi quadrato. Il confronto tra la distribuzione osservata e quella attesa evidenzia che, rispetto alla media delle 4 zone, all’Abetone e al Pisanino si ha un eccesso dell’allele 2 e una carenza dell’allele 1 e dell’allele 3, mentre al Pradaccio e a Pradarena si ha un eccesso degli alleli 1 e 3 e una carenza dell’allele 2.

 

ESERCIZIO 2. Si sono sottoposti dei cloni di Daphnia magna a quattro diversi trattamenti o regimi alimentari. Dopo 39 giorni si è fatto un bilancio complessivo di quanti sono stati i morti (e i sopravvissuti) in ogni campione. 

Si intende verificare se il tasso di mortalità è uguale per i 4 diversi trattamenti.

Le differenze riscontrate sono dovute al caso, oppure sono imputabili al diverso trattamento alimentare?

 

FREQUENZE OSSERVATE

 

 

Cloni  morti

Cloni  sopravvissuti

Totale  cloni

Trattamento I

6

23

29

Trattamento II

2

26

28

Trattamento III

8

22

30

Trattamento IV

3

20

23

Totale

19

91

110

 

 

Risposta.  Si calcolano le frequenze attese


FREQUENZE ATTESE SECONDO L’IPOTESI NULLA

 

 

Cloni  morti

Cloni  sopravvissuti

Totale  cloni

Trattamento I

5,0

24,0

29

Trattamento II

4,8

23,2

28

Trattamento III

5,2

24,8

30

Trattamento IV

4,0

19,0

23

Totale

19

91

110

 

e successivamente, attraverso la formula generale, il valore del chi quadrato con 3 gradi di libertà

 

 

Si ottiene un valore  uguale a 4,023 che, per 3 gradi di libertà, è associato ad una probabilità superiore al 25%. La probabilità che sia vera l’ipotesi nulla è molto elevata, superiore al 25%.

Non è possibile rifiutare l’ipotesi nulla: non è dimostrato che i 4 trattamenti determinino una mortalità significativamente differente.

 

ESERCIZIO 3.   Nella tabella seguente, sono riportati i risultati di un esperimento sulla schiusa di uova di Heterocypris incongruens, mantenute a diverse condizioni di temperatura.

 

FREQUENZE OSSERVATE

Temperatura

Uova        schiuse

Uova              non-schiuse

Totale

16°c

131

32

163

24°c

100

64

164

28°c

90

91

181

Totale

320

188

508

 

 

Trarre le conclusioni.

 

Risposta.   Si calcolano le frequenze attese


FREQUENZE ATTESE SECONDO L’IPOTESI NULLA

 

Temperatura

Uova        schiuse

Uova             non-schiuse

Totale

16°c

102,7

60,3

163

24°c

103,3

60,7

164

28°c

114,0

67,0

181

Totale

320

188

508

 

 

e attraverso la formula generale si può computare il valore complessivo del chi quadrato,

 

 

con il contributo fornito da ogni casella

 

 

(OSS. - ATT.)2 / ATT   PER OGNI CASELLA

 

Temperatura

Uova        schiuse

Uova             non-schiuse

Totale

16° C

7,798

13,282

---

24° C

0,105

0,179

---

28° C

5,053

8,587

---

Totale

---

---

35,004

 

 

Il valore del  (uguale a 35,004) è molto elevato; per 2 gradi di libertà, è associato ad una probabilità a estremamente bassa, inferiore a 0.001. Si può affermare che le percentuali di uova schiuse alle 3 diverse temperature sono significativamente differenti.

I contributi maggiori sono forniti dalle due temperature estreme. Alla temperatura più bassa (16° C) il numero di uova che non si sono schiuse è molto maggiore, mentre alla temperatura più alta (28° C) è molto minore delle frequenze attese, se fosse stata vera l’ipotesi nulla che la temperatura non influisce. Alla temperatura intermedia (24° C), la percentuale di uova schiuse è molto vicina alla media dei 3 esperimenti.

 

 

ESERCIZIO 4.   Si sono mantenute per 24 ore in due soluzioni acquose, contenenti uguale concentrazione di rame, due gruppi formati da 48 individui ciascuno, di 2 specie di protozoi: Euplotes patella e Paramecium caudatum.

Alla fine dell’esperimento, si è contato il numero di individui morti  in ognuno dei due campioni. I risultati sono riportati nella  tabella sottostante.

Verificare se la percentuale di decessi è diversa per le 2 specie, sottoposte alle medesime condizioni d’inquinamento.

 

FREQUENZE OSSERVATE

 

 

Morti

Sopravvissuti

Totale

Euplotes p.

11

37

48

Paramecium c.

15

33

48

Totale

26

70

96

 

 

Risposta.  E’ una tabella di contingenza 2 x 2 .

Calcolando il chi-quadro, che avrà 1 g.d.l., con la formula rapida

 

 

si ottiene un valore uguale a 0, 843.

 

Una obiezione al risultato può essere che il numero totale di osservazioni non può essere considerato grande. In queste condizioni, a scopo cautelativo e quindi per una maggiore attendibilità delle conclusioni, è conveniente ricorrere al calcolo del chi quadrato con la correzione di YATES per la continuità

 

 

 che (con un valore uguale a 0,4747) si dimostra più conservativa.

 

Con questi dati, è possibile utilizzare anche il metodo del log likelihood ratio o G2:

 

G2 =  2×{[ 11×ln(11) + 37×ln(37) + 15×ln(15) + 33×ln(33) + 96×ln(96)] -

- [ 48×ln(48) + 48×ln(48) + 26×ln(26) + 70×ln(70)]} =

 

G2 = 2×{[(11x2,398)+(37x3,611)+(15x2,708)+(33x3,497)+(96x4,564)]-

- [(48x3,871)+(48x3,871)+(26x3,258)+(70x4,248)]}=

 

G2 = 2×(754,104 - 753,742) = 2 x 0,362 = 0,724

 

Il valore del 2 è piccolo anche con questo metodo. E’ simile a quelli prima calcolati; è nettamente inferiore al valore critico di 3,83 corrispondente alla probabilità a =  0.05.

Le variazioni riscontrate rientrano quindi fra quelle imputabili solo al caso.

Non è possibile dimostrare che le due specie hanno reagito in modo differente alla stessa concentrazione di rame.

 


VALORI CRITICI DELLA DISTRIBUZIONE c2  (con gdl da 1 a 30)

 

Gradi

di

Area della coda superiore

libertà

.995

.99

.975

.95

.90

.75

.25

.10

.05

.025

.01

.005

1

 

 

0.001

0.004

0.016

0.102

1.323

2.706

3.841

5.024

6.635

7.879

2

0.010

0.020

0.051

0.103

0.211

0.575

2.773

4.605

5.991

7.378

9.210

10.597

3

0.072

0.115

0.216

0.352

0.584

1.213

4.108

6.251

7.815

9.348

11.345

12.838

4

0.207

0.297

0.484

0.711

1.064

1.923

5.385

7.779

9.488

11.143

13.277

14.860

5

0.412

0.554

0.831

1.145

1.610

2.675

6.626

9.236

11.071

12.833

15.086

16.750

6

0.676

0.872

1.237

1.635

2.204

3.455

7.841

10.645

12.592

14.449

16.812

18.548

7

0.989

1.239

1.690

2.167

2.833

4.255

9.037

12.017

14.067

16.013

18.475

20.278

8

1.344

1.646

2.180

2.733

3.490

5.071

10.219

13.362

15.507

17.535

20.090

21.955

9

1.735

2.088

2.700

3.325

4.168

5.899

11.389

14.684

16.919

19.023

21.666

23.589

10

2.156

2.558

3.247

3.940

4.865

6.737

12.549

15.987

18.307

20.483

23.209

25.188

11

2.603

3.053

3.816

4.575

5.578

7.584

13.701

17.275

19.675

21.920

24.725

26.757

12

3.074

3.571

4.404

5.226

6.304

8.438

14.845

18.549

21.026

23.337

26.217

28.299

13

3.565

4.107

5.009

5.892

7.042

9.299

15.984

19.812

22.362

24.736

27.688

29.819

14

4.075

4.660

5.629

6.571

7.790

10.165

17.117

21.064

23.685

26.119

29.141

31.319

15

4.601

5.229

6.262

7.261

8.547

11.037

18.245

22.307

24.996

27.488

30.578

32.801

16

5.142

5.812

6.908

7.962

9.312

11.912

19.369

23.542

26.296

28.845

32.000

34.267

17

5.697

6.408

7.564

8.672

10.085

12.792

20.489

24.769

27.587

30.191

33.409

35.718

18

6.265

7.015

8.231

9.390

10.865

13.675

21.605

25.989

28.869

31.526

34.805

37.156

19

6.844

7.633

8.907

10.117

11.651

14.562

22.718

27.204

30.144

32.852

36.191

38.582

20

7.434

8.260

9.591

10.851

12.443

15.452

23.828

28.412

31.410

34.170

37.566

39.997

21

8.034

8.897

10.283

11.591

13.240

16.344

24.935

29.615

32.671

35.479

38.932

41.401

22

8.643

9.542

10.982

12.338

14.042

17.240

26.039

30.813

33.924

36.781

40.289

42.796

23

9.260

10.196

11.689

13.091

14.848

18.137

27.141

32.007

35.172

38.076

41.638

44.181

24

9.886

10.856

12.401

13.848

15.659

19.037

28.241

33.196

36.415

39.364

42.980

45.559

25

10.520

11.524

13.120

14.611

16.473

19.939

29.339

34.382

37.652

40.646

44.314

46.928

26

11.160

12.198

13.844

15.379

17.292

20.843

30.435

35.563

38.885

41.923

45.642

48.290

27

11.808

12.879

14.573

16.151

18.114

21.749

31.528

36.741

40.113

43.194

46.963

49.645

28

12.461

13.565

15.308

16.928

18.939

22.657

32.620

37.916

41.337

44.461

48.278

50.993

29

13.121

14.257

16.047

17.708

19.768

23.567

33.711

39.087

42.557

45.722

49.5B8

52.336

30

13.787

14.954

16.791

18.493

20.599

24.478

34.800

40.256

43.773

46.979

50.892

53.672

                                                                                                                                                                                (segue)


VALORI CRITICI DELLA DISTRIBUZIONE c2  (con gdl da 31 a 60)

 

Gradi

di

Area della coda superiore

libertà

.995

.99

.975

.95

.90

.75

.25

.10

.05

.025

.01

.005

31

14.458

15.655

17.539

19.281

21.434

25.390

35.887

41.422

44.985

48.232

52.191

55.003

32

15.134

16.362

18.291

20.072

22.271

26.304

36.973

42.585

46.194

49.480

53.486

56.328

33

15.815

17.074

19.047

20.867

23.110

27.219

38.058

43.745

47.400

50.725

54.776

57.648

34

16.501

17.789

19.806

21.664

23.952

28.136

39.141

44.903

48.602

51.966

56.061

58.964

35

17.192

18.509

20.569

22.465

24.797

29.054

40.223

46.059

49.802

53.203

57.342

60.275

36

17.887

19.233

21.336

23.269

25.643

29.973

41.304

47.212

50.998

54.437

58.619

61.581

37

18.586

19.960

22.106

24.075

26.492

30.893

42.383

48.363

52.192

55.668

59.892

62.881

38

19.289

20.691

22.878

24.884

27.343

31.815

43.462

49.513

53.384

56.896

61.162

64.181

39

19.996

21.426

23.654

25.695

28.196

32.737

44.539

50.660

54.572

58.120

62.428

65.476

40

20.707

22.164

24.433

26.509

29.051

33.660

45.616

51.805

55.758

59.342

63.691

66.766

41

21.421

22.906

25.215

27.326

29.907

34.585

46.692

52.949

56.942

60.561

64.950

68.053

42

22.138

23.650

25.999

28.144

30.765

35.510

47.766

54.090

58.124

61.777

66.206

69.336

43

22.859

24.398

26.785

28.965

31.625

36.436

48.840

55.230

59.304

62.990

67.459

70.616

44

23.584

25.148

27.575

29.787

32.487

37.363

49.913

56.369

60.481

64.201

68.710

71.893

45

24.311

25.901

28.366

30.612

33.350

38.291

50.985

57.505

61.656

65.410

69.957

73.166

46

25.041

26.657

29.160

31.439

34.215

39.220

52.056

58.641

62.830

66.617

71.201

74.437

47

25.775

27.416

29.956

32.268

35.081

40.149

53.127

59.774

64.001

67.821

72.443

75.704

48

26.511

28.177

30.755

33.098

35.949

41.079

54.196

60.907

65.171

69.023

73.683

76.969

49

27.249

28.941

31.555

33.930

36.818

42.010

55.265

62.038

66.339

70.222

74.919

78.231

50

27.991

29.707

32.357

34.764

37.689

42.942

56.334

63.167

67.505

71.420

76.154

79.490

51

28.735

30.475

33.162

35.600

38.560

43.874

57.401

64.295

68.669

72.616

77.386

80.747

52

29.481

31.246

33.968

36.437

39.433

44.808

58.468

65.422

69.832

73.810

78.616

82.001

53

30.230

32.018

34.776

37.276

40.308

45.741

59.534

66.548

70.993

75.002

79.843

83.253

54

30.981

32.793

35.586

38.116

41.183

46.676

60.600

67.673

72.153

76.192

81.069

84.502

55

31.735

33.570

36.398

38.958

42.060

47.610

61.665

68.796

73.311

77.380

82.292

85.749

56

32.4á0

34.350

37.212

39.801

42.937

48.546

62.729

69.919

74.468

78.567

83.513

86.994

57

33.248

35.131

38.027

40.646

43.816

49.482

63.793

71.040

75.624

79.752

84.733

88.236

58

34.008

35.913

38.844

41.492

44.696

50.419

64.857

72.160

76.778

80.936

85.950

89.477

59

34.770

36.698

39.662

42.339

45.577

51.356

65.919

73.279

77.931

82.117

87.166

90.715

60

35.534

37.485

40.482

43.188

46.459

52.294

66.981

74.397

79.082

83.298

88.379

91.952

70

43.275

45.441

48.757

51.739

55.329

61.698

77.576

85.527

90.531

95.023

100.43

104.22

80

51.172

53.540

57.153

60.391

64.277

71.144

88.130

96.578

101.88

106.63

112.33

116.32

90

59.196

61.754

65.466

69.126

73.291

80.624

98.649

107.57

113.15

118.14

124.12

128.30

100

67.327

70.064

74.221

77.929

82.358

90.133

109.14

118.50

124.34

129.56

135.81

140.17

 

 

 

 

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Università di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007