Föreläsning 22

Allmänt om chi^2 -fördelningen

När man räknar med chi^2 -fördelningen så lägger man ofta hälften av felmarginalen på var sida om intervallen.
Dvs P(a < overline(underline(x)) < b) = 99% => P(overline(underline(x)) < a) = 0.5%, P(overline(underline(x)) > b) = 0.5%.
Detta beror inte på fördelningen, utan det är en smidig grej att göra. Eftersom det enda kravet är att sannolikheten att overline(underline(x)) ligger mellan a och b är 95% så kan vi flytta runt a och b hur vi vill, dvs deras värden spelar ingen roll så länge sannolikheten är samma.

Ex.

Vid ett reningsverk mäter man dagligen syrekoncentration i vatten, som antas vara normalfördelat med sigma=2mg/l .
Efter 30 dagar fick man overline(underline(x)) = 2.52mg/l

Bestäm ett 99% konfidensintervall för den genomsnittliga syrekoncentrationen mu .

Kan man med rimlig säkerhet påstå att genomsnittliga syrekoncentrationen är 3.0 mg/l ?

overline(underline(x))_i= syrekoncentrationen i vatten dag i där i=1,..30 => n = 30
overline(underline(x))_i in N(mu, 2)

mu in (overline(overline(underline(x))) +- lambda_(0.005) sigma/sqrt(n)) larr (99%)
mu^(**) = overline(overline(underline(x))) in N(mu, 2/sqrt(30))

mu in (2.52 +- 2.5758*2/sqrt(30)) iff mu in (2.52 +- 0.9405)
Obs! När vi ska avrunda 2.52 + 0.9405 och 2.52 - 0.9405 så avrundar vi uppåt och neråt, respektive.

Kan man red rimlig säkerhet…? Nej.

Bilda uppåt och nedåt-begränsade konfidensintervall för mu , 99%.

mu in (a, oo) , 99%, a=mu-lambda_(0.01) 2/sqrt(30)
mu in (-oo, b) , 99%, b=mu+lambda_(0.01) 2/sqrt(30)

=> a = floor(2.52-2.3263*2/sqrt(30)) = floor(1.6705) = 1.67, b = ceil(2.52+2.3263*2/sqrt(30)) = ceil(3.3694) = 3.37

:. mu > 1.67 med 99%, mu < 3.37 med 99%, dvs P(1.67 < mu < 3.37) = 99%

12.18

Brazilansk furu levereras till Sverige. Längderna varierar som oberoende och normalfördelade s.v.
Man har följande data: 5.8,5.9,5.1,3.5,4.2,4.9,5.3,5.3,4.7,3.9,4.5,4.1,4.0,4.7,4.8

a) Bestäm ett 95% konfidensintervall för mu

overline(underline(x))_i= planklängd i meter
overline(underline(x))_i in N(mu, sigma); i=1,…,16; n = 16
Stickprovet ger overline(x) = 4.6812, s^2 = 0.46962 => s = 0.68529

mu in (overline(x) +- t_(0.025)(f) s/sqrt(n)); f = n-1
f är alltid n-1 .

t_(0.025)(15) obrace(=)^("tabell") 2.13

mu in (4.6812 +- 2.13*0.68529/sqrt(16)), 95%
iff mu in (4.6812 +- 0.36517), 95%
iff mu in (4.31, 5.01), 95%

Bestäm 95% konfidensintervall för sigma

1/sigma^2 sum_1^n (overline(underline(x))_i - overline(overline(underline(x))))^2, S^2 = (sigma^2)^(**) = 1/(n-1) sum_1^n (overline(underline(x))_i - overline(overline(underline(x))))^2
=> ((n-1) S^2)/sigma^2 in chi^2(n-1)

P(a < ((n-1) S^2)/sigma^2 < b) = 0.95
a = chi^2_(0.975)(15) = 6.26
b = chi^2_(0.025)(15) = 27.49

:. P( floor((15*S^2)/27.49) <= sigma^2 <= ceil((15*S^2)/6.26) ) = 0.95
iff sigma^2 in (0.506, 1.061) 95%.

12.5

overline(underline(x))= antal intervall som missar. overline(underline(x)) in "Bin"(15, 0.1)

b) Vilket är det mest sannolika värde på antal intervall som missar?

Tabelluppgift!
P(overline(underline(x)) = 0) = 0.206
P(overline(underline(x)) = 1) = 0.549-0.206 ~~ 0.343
P(overline(underline(x)) = 2) = 0.816-0.549 ~~ 0.27

Här ser vi att typvärdet blev 1 (34% chans att inträffa).