Statistická indukce
Statistická indukce (4/20) · 5:57

Příklad: další cvičení na empirické pravidlo a z-skóre ck12.org

Navazuje na Popisná statistika.
... Trocha procvičení není nikdy na škodu. Tohle je tedy problém číslo 5 z kapitoly normálního rozdělení. Flexbooku AP statistiky na webových stránkách ck12.org. Říkají, že výsledky ze zkoušky AP Statistics 2007 nebyly normálně rozděleny se střední hodnotou 2.8 a směrodatnou odchylkou 1.34. Citují zde materiály College Board. Toto jsem nezkopíroval a nevložil... Jaké je přibližné z-skóre? Připomeňme si, že z-skóre je pouze kolik standardních odchylek jste vzdáleni od střední hodnoty. Jaké je přibližné z-skóre, které odpovídá skóre 5 ze zkoušky? Takže musíme jen přijít na to – to je hezký přímočarý problém – budeme muset přijít na to, o kolik směrodatných odchylek je pětka vzdálena od střední hodnoty? Dobře, takže pouze spočtete 5 minus 2.8, správně? Střední hodnota je 2.8. Teď tedy zcela jasně. Střední hodnota je 2.8. To je zadáno. Ani jsme to nemuseli počítat, že? Tedy střední hodnota je 2.8, takže 5 mínus 2.8 se rovná 2.2. Takže se nacházíme 2.2 nad střední hodnotou, a pokud to chceme vyjádřit ve směrodatných odchylkách, tak to jen vydělíme naší směrodatnou odchylkou. Vydělíme 1.34. Vydělíme 1.34. Na tohle si vezmu kalkulačku. Takže máme 2.2 děleno 1.34, to se rovná 1.64. Toto se rovná 1.64, a to je možnost c. Takže tohle bylo doopravdy velmi přímočaré. Jen jsme se museli podívat, jak daleko jsme od střední hodnoty, jestliže obdržíme skóre 5, což věřím, že získáte, když se zúčastníte zkoušky AP statistics po shlédnutí těchto videí, a poté vydělíme směrodatnou odchylkou, abychom řekli, kolik směrodatných odchylek od střední hodnoty je skóre 5. To je 1.64. Myslím, že jediná záludná věc tady, by mohla být, že by jste mohli být v pokušení vybrat možnost e, která říká, že z-skóre nemůže být počítáno, protože distribuční funkce není normální. Myslím, že důvod, proč jste mohli podlehnout pokušení, je, že jsme používali z-scóre v kontextu normálního rozdělení. Ale z-skóre doslova znamená, kolik standardních odchylek jste vzdáleni od střední hodnoty. Mohlo by být uplatněno na libovolnou distribuční funkci, pro kterou můžete spočítat střední hodnotou a směrodatnou odchylku. Takže e není správná odpověď. Z-skóre lze použít i na ne-normální rozdělení, tedy odpověď je c, a tuším, že tohle je vhodná úroveň znalostí na to, abychom toto opustili. Uvažoval jsem, že bych v tomto videu mohl probrat dva problémy, protože ten předchozí byl docela krátký. Tady problém číslo 6: Výška chlapců páté třídy ve Spojených státech je přibližně normálně rozdělená, to je dobré vědět, se střední hodnotou výšky 143.5, takže střední hodnota je 143.5 centimetrů a standardní odchylka je 7.1 centimetrů. Směrodatná odchylka 7.1 centimetrů. Jaká je pravděpodobnost, že náš náhodně zvolený chlapec páté třídy by byl vyšší než 157.7 centimetrů? Vykresleme tedy tuto distribuční funkci, tak jako jsme to již udělali u několika problémů. Pokládají nám jen jednu otázku, takže můžete vyznačit tuto distribuční funkci trochu výše. Dejme tomu, že toto je naše distribuční funkce – a střední hodnota tady, střední hodnota, jak bylo řečeno, je 143.5. Ptají se nás na vyšší než 157.7, takže jdeme směrem nahoru. Takže jedna směrodatná odchylka nad střední hodnotou nás vezme přesně sem a musíme tedy přidat 7.1 k tomuto číslu tady. Stoupáme o 7.1. Tedy 143.5 plus 7.1 je kolik? 150.6. To je jedna směrodatná odchylka. Kdybychom šli o další směrodatnou odchylku, Jdeme o 7.1 dál. Kolik je 7.1 plus 150.6? To je 157.7, což se ukazuje jako přesně stejná číslo, na jaké se ptají. Ptají se na výšku, pravděpodobnost dosažení výšky, vyšší než tato. Takže chtějí vědět, jaká je pravděpodobnost, že spadneme pod tuto oblast tady, nebo v podstatě více než dvě směrodatné odchylky od střední hodnoty nebo nad dvě směrodatné odchylky. Nemůžeme počítat tento levý konec tady. Takže můžeme použít empirické pravidlo. Můžeme použít empirické pravidlo. Pokud uděláme naše směrodatné odchylky nalevo, jedna směrodatná odchylka, dvě směrodatné odchylky. Víme, kolik je celá tato oblast. Dovolte mi vybrat jinou barvu. Takže víme, kolik je tato oblast, oblast uvnitř dvou směrodatných odchylek. Empirické pravidlo nám říká, nebo ještě lépe, pravidlo 68-95-99.7 nám říká, že tato oblast, protože je to mezi dvěma směrodatnými odchylkami, je 95 %, nebo 0.95, nebo je to 95 % plochy pod normální distribuční funkcí, což nám říká, že to, co zbylo mimo, tento konec, který nás zajímá o tento levý konec tady, musí dávat zbytek, neboli 5 %. Takže ty dva konce dohromady musí být 5 % a jsou symetrické. Toto jsme dělali již předtím. Toto je vlastně trochu redundantní vůči ostatních problémům, které jsme již řešili. Ale pokud tyto dva dohromady jsou 5 %, pak říkají, že každý z nich je 2.5 procenta. Každý z těchto dvou je 2.5 procenta. Tedy k odpovědi na položenou otázku, jaká je pravděpodobnost, že náhodně vybraný chlapec páté třídy by byl vyšší než 157.7 centimetrů, no, to je doslova právě tato oblast pod touto zelenou částí. Možná to vyznačím v jiné barvě. Tato fialová část, kterou právě vybarvuji, to je právě ta oblast, kterou jsme spočítali jako 2,5 %. Existuje tedy 2.5 procentní šance, že náhodně vybraný chlapec páté třídy bude vyšší než 157.7 centimetrů, za předpokladu, že toto je střední hodnota a směrodatná odchylka a máme co do činění s normálním rozdělením. ...
video