Itt két különböző eloszlásról van szó. Először is van az egyes időmérések eredményeit (`x`) generáló eloszlás, ez ismeretlen jellegű, de tudjuk, hogy átlaga `mu` és szórása `sigma`. És amit keresünk, az a mérések átlagának (`bar x`) eloszlása, ennek várható értékét és szórását a `bar mu` és `bar sigma` szimbólumokkal fogom jelölni.
i)
A centrális határeloszlás-tétel szerint ilyen nagy (40) mintaszámnál már gyakorlatilag normálisnak tekinthető az átlag eloszlása, függetlenül attól, hogy az egyes mérések eloszlása milyen volt. Az átlag várható értéke `bar mu ~~ mu = 17.5` perc, szórása `bar sigma ~~ sigma/sqrt(N)=``2.6/sqrt(40)~~``0.4111` perc.
ii)
A konfidenciaintervallum azt jelenti, hogy meg kell adnunk azt a várható érték körüli szimmetrikus intervallumot, amibe az átlag 95%-os valószínűséggel beleesik, vagyis a `\text{P}(A le bar x le B)=95%` kifejezésben keressük `A` és `B` értékét.
Első közelítésben eszünkbe juthat, hogy a 95%-os konfidenciaintervallum nagyjából a kétszeres szóráshoz tartozik. Tehát:
`\text{P}(bar mu - 2 bar sigma le bar x le bar mu + 2 bar sigma)~~95%`
Behelyettesítve az első pontban kiszámolt értékeket:
`\text{P}(16.6778 le bar x le 18.3222)~~95%`
Nézzük meg, hogyan lehetne ugyanezt teljesen egzaktul kiszámítani, avagy mit lehetne tenni tetszőleges, nem nevezetes konfidenciaszint esetén. Ha `bar x` standard normális eloszlású lenne, akkor könnyű dolgunk lenne, mert akkor az `A` és `B` értékeket az eloszlás táblázatából kiolvashatnánk (angol nyelvű szakirodalomban erre z-score néven szoktak hivatkozni). Gyorsan kerestem a neten egy táblázatot (itt találtam:
https://www.conversion-uplift.co.uk/glossary-of-conversion-marketing/z-score/ ), ebben egyoldalas eloszlás van, tehát a lila területnek `0.95/2=0.475`-nek kell lennie. A táblázatban megkeressük az ehhez legközelebbi értéket (bejelöltem a mellékletben pirossal), és leolvassuk, hogy ez `z=1.96`-hoz tartozik (vagyis nem jártunk olyan messze az első közelítéssel, ahol 2-vel számoltunk). Ez azt jelenti, hogy egy standard normális eloszlású valószínűségi változó értéke 95%-os valószínűséggel esik -1.96 és 1.96 közé. A mi `bar x` változónk normális ugyan, de még nem standard, viszont könnyen azzá tehető: `(bar x - bar mu)/(bar sigma)` már standard. Tehát:
`\text{P}(-1.96 le (bar x - bar mu)/(bar sigma) le 1.96)=95%`
Szorozzunk be a szórással:
`\text{P}(-1.96 bar sigma le bar x - bar mu le 1.96 bar sigma)=95%`
Adjuk hozzá az átlagot:
`\text{P}(bar mu-1.96 bar sigma le bar x le bar mu+1.96 bar sigma)=95%`
Végül helyettesítsük be az értékeket:
`\text{P}(16.6942 le bar x le 18.3058)=95%`