Föreläsning 17

Projekt. Samla in data och gör en sammanfattande statistik på den.

Ex. stickprov

En firma tillverkar mätapparaturer med kretskort inuti. Beräkna sannolikheten att en apparatur innehåller ett defekt kretskort givet en viss mätning.
p in (0,1)

Punktskattning

Relativ frekvens: p_(0.35) = x/n

overline(underline(x)) in Hyp(N,n,p), overline(underline(x)) antal defekta.

H_0: p<=0.5% Utgångshypotes H_1: p>0.5% Mothypotes

Ex.

overline(underline(x)) tidsåtgång
Antal overline(underline(x))_i in N(mu, sigma) , overline(underline(x)) in N(mu, sigma/sqrt(n)
Vi vill ha hög sannolikhet (95%) att mu ligger mellan a och b .

H_0: mu=mu_0 Utgångshypotes
H_1: mu!=mu_0 Mothypotes

Punktskattning

Ett stickprov ( x_1,x_2,… ) från någon fördelning F utgörs av observationer av oberoende stokastiska variabler ( X_1,X_2,… )

Fördelningen F beror av en (eller flera) okänd parameter theta som vi är intresserade av.

Ex

Man tillverkar kvadratiska plattor.
overline(underline(x))_i= sidan på en platta
overline(underline(x))_i är fördelat på något sätt. mu, sigma

mu : väntevärde för en sida.
Hur uppskattar man mu^2 = area?

Vårt stickprov kommer att bli x_1,x_2,…,x_n

Vi gör upp tre hypoteser:
(mu^2)1^* = overline(overline(underline(x)))^2 larr Medelvärdet i kvadrat (mu^2)_2^* = 1/n sum (overline(underline(x))_i)^2 larr Medelvärdet av alla mätdata i kvadrat (mu^2)_3^* = (overline(underline(x))_1*overline(underline(x))_2 + overline(underline(x))_3*overline(underline(x))_4 + … + overline(underline(x))(n-1)*overline(underline(x))_n)/(n/2) larr Något som du aldrig hade kommit på hemma

Vi vill hitta rätt hypotes. E(mu^2)_i = mu^2 .

E(mu^2)
V(overline(overline(underline(x))))=sigma^2/n = E(overline(overline(underline(x)))^2) - E(overline(overline(underline(x))))^2
sigma^2/n = E(overline(overline(underline(x)))^2)-mu^2 iff E(overline(overline(underline(x)))^2) = mu^2+sigma/n

Dvs vår hypotes 1 kommer att alltid att ha ett fel sigma/n .

i=3 => E(overline(underline(x))1*overline(underline(x))_2 + overline(underline(x))_3*overline(underline(x))_4 + … + overline(underline(x))(n-1)*overline(underline(x))_n)/(n/2) = 2/n(E(overline(underline(x))_1)*E(overline(underline(x))_2)+…) vilket ger den bästa uppskattningen. Dvs den jobbiga formeln som du aldrig hade kommit på hemma var bäst.