Statistická indukce
Statistická indukce (3/20) · 8:16

Příklad: standardizované normální rozdělení a empirické pravidlo Použití empirického pravidla (pravidla tří sigma) u standardizovaného (normovaného) normální rozdělení

Navazuje na Popisná statistika.
... Nyní jsme u problému číslo 4, týkající se kapitoly normálního rozdělení Flexbooku AP statistiky na webových stránkách ck12.org. Můžete jít na jejich web, kde je možné si jej stáhnout. Je to vše zadarmo. Takže problém číslo 4, který je, alespoň v mé mysli, velmi dobrým procvičením. Pro normální nebo standardní normální rozdělení, pro standardní normální rozdělení, umístěte následující v pořadí od nejmenšího po největší. Vidíme tedy, procento dat pod 1, pod -1,... OK, pojďme nakreslit naše standardní normální rozdělení. Standardní normální rozdělení je to, kde střední hodnota je – promiňte, nakreslil jsem směrodatnou odchylku – je to, kde střední hodnota, mí jako střední hodnota, střední hodnota se rovná 0 a směrodatná odchylka je rovna 1. Dovolte mi nakreslit toto standardní normální rozdělení. Dovolte mi nakreslit osu asi takhle. Podívám se, jestli umím nakreslit hezky vypadající zvonovou křivku. A tady máme zvonovou křivku. Nyní máte představu. A tohle je standardní normální rozdělení, takže střední hodnota, nebo můžete svým způsobem vyznačit středový bod tady. Není zešikmená. Střední hodnota bude 0 právě tady a směrodatná odchylka je 1. Takže, když půjdeme jednu směrodatnou odchylku napravo, to bude 1. Jestliže půjdete dvě směrodatné odchylky, tak to bude 2, tři směrodatné odchylky 3, přesně takto. Jedna směrodatná odchylka doleva bude minus 1. Dvě směrodatné odchylky doleva bude minus 2, a tak dále a tak dále. Mínus 3 budou tři směrodatné odchylky doleva, protože směrodatná odchylka je 1. Podívejme se, jestli můžeme na tuto otázku odpovědět. Jaké procento dat tedy leží pod 1? Takže procento – část a, to je tohle tady, takže všechno pod 1. To je tedy všechno tohle – nikoliv jen tato malá střední část. Pokračuje to. Všechno pod 1, správně? Procento údajů pod 1. Toto je tedy další situace, kdy bychom měli použít empirické pravidlo. ... Další procvičení není nikdy na škodu. Empirické pravidlo. Nebo možná lepší způsob, jak si empirické pravidlo zapamatovat, je pravidlo 68, 95, 99,7. A tomu já říkám lepší způsob, protože vám to v podstatě vytváří toto pravidlo. Jsou to jen čísla, která si budete muset v podstatě zapamatovat. Pokud máte kalkulačku nebo tabulku normálního rozdělení, nemusíte tohle dělat. Ale ve třídě po vás někdy lidé chtějí odhadnout procenta, a tak je dobré to umět. Víte, můžete zapůsobit na lidi, pokud toto dokážete spočítat v hlavě. Podíváme se tedy, jestli můžeme použít empirické pravidlo k zodpovězení této otázky. Celá oblast pod zvonovou křivkou až k 1, nebo všechno nalevo od 1. Empirické pravidlo nám říká, že oblast uprostřed mezi jednou směrodatnou odchylkou nalevo a jednou směrodatnou odchylkou napravo, tohle přímo tady je 68 %. Podobně jako jsme to viděli v předchozím videu. To je to, co nám říká empirické pravidlo. Teď tedy vše ostatní s těmito 68 %, jak jsme viděli v posledním videu, sečte-li se dohromady, dává 1 nebo 100 %, že tento levý konec – dovolte mi to vyznačit – tato část tady plus tato část tady, musí dávat v součtu pokud to přičteme k 68, musí dát v součtu 1 nebo 100 %. Takže tyto dvě části dohromady jsou 32 %. 32 plus 68 je 100. Teď toto je symetrické. Tyto dvě části jsou přesně stejné, takže jeli součet 32, toto tady je 16 % a tohle tady je 16 %. Teď k otázce, chtějí po nás zjistit plochu všeho dovolte mi abych to vyznačil novou barvou všeho pod 1, správně? Procento dat pod 1, takže všechno vlevo od tohoto bodu. To je 68 %, to je tady, takže to je 68 %, což je tato střední část v rámci jedné směrodatné odchylky, plus tato levá větev tady. To je 68 plus 16 %, a to je kolik? To se rovná 84 %. Takže tato část za a) je 84 %. Chtějí po nás, abychom tohle nakonec uspořádali, ale je dobré zatím vyřešit tohle, to je ta těžká část. Jakmile známe čísla, srovnání je docela snadné. Část b. Procento dat pod mínus 1. Mínus 1 je tedy tady. Takže po nás vlastně chtějí zjistit tuto oblast zde, procento dat pod mínus 1. No, to bude 16 %. To jsme právě spočítali. A možná již víte, dokonce i bez znalosti empirického pravidla, pouhým pohledem na normální distribuční funkci, že tato celá oblast, tato část b je podmnožinou části a, takže to bude menší číslo. Takže pokud máte pouze porovnat výsledky, mohli jste to udělat intuitivně, ale je dobré si procvičit empirické pravidlo. A teď část c), chtějí vědět, jaká je střední hodnota? To je ta nejsnazší věc. Střední hodnota standardního normálního rozdělení je, podle definice, rovna 0, takže číslo c) je 0. d) Směrodatná odchylka. Podle definice, směrodatná odchylka pro standardní normální rozdělení je 1. Takže tohle tady je 1. Je to snazší, než jsem si myslel. Část e) Procento dat nad 2. Takže chtějí procento dat nad 2. Takže víme z pravidla 68, 95, 99,7, že pokud chceme zjistit, kolik dat je v rámci dvou standardních odchylek – tak dovolte mi toto nakreslit jinou barvou. Takže pokud se díváme z tohoto - dovolte mi to udělat v živějších barvách, zelená. Pokud se díváme z tohoto bodu do tohoto bodu, to je v rámci dvou standardních odchylek, že, směrodatná odchylka tady je 1. Pokud se díváme v rámci dvou směrodatných odchylek, tato celá oblast zde je podle empirického pravidla 95 % v rámci dvou směrodatných odchylek. To je 95 %, což nám říká, že všechno ostatní dohromady – takže pokud si vezmete tuto žlutou část tady a tuto žlutou část tady, takže všechno za dvěma standardními odchylkami v obou směrech, to musí být zbytek. Tedy víte, že všechno uprostřed bylo 95 v rámci dvou směrodatných odchylek, takže to musí být 5 %, pokud dáte dohromady tento konec a tento konec, tedy všechno nalevo a napravo od dvou směrodatných odchylek. Dobře, předtím jsem udělal argument, všechno je symetrické. Tohle a tohle si je rovno, takže toto tady je 2,5 procenta a tohle tady je rovněž 2,5 procenta. Takže nás žádají o procento dat nad 2. To je tento konec, pouze tento konec přímo tady. Procento dat, vzdálené více než dvě směrodatné odchylky od střední hodnoty, tedy to je 2,5 procenta. Udělám to tmavší barvou, 2,5 procenta. A teď po nás požadují, abychom umístili následující v pořadí od nejmenšího po největší. Takže je tu trochu nejasností, protože pokud píšou "procento dat pod 1", chtějí abychom řekli, dobře, to je 84 %? Měli bychom tedy považovat odpověď na část a) 84? Nebo bychom měli zvážit – pokud píšou "část dat pod 1", pak bych řekl 0,84. To tedy záleží na tom, jak to chtějí interpretovat. Stejně tak zde. Procento dat pod mínus 1, mohl bych říci, odpověď je 16. 16 je procento dat pod mínus 1, ale skutečné číslo, kdybych řekl část dat pod mínus 1, pak bych řekl 0,16, takže by se to ve skutečnosti velmi lišilo v tom, jak bychom výsledky seřadili. Podobně, kdyby se mě někdo zeptal na procento, řekl bych, Oh, to je 2,5, ale skutečné číslo je 0,025. To je skutečný podíl neboli skutečné desetinné číslo. Tedy, myslím tím, že to je jen řazení čísel, takže bych se na to neměl příliš vázat. Řekněme tedy, že tím mysleli desetinná čísla. Takže, kdybychom to chtěli udělat touto cestou, když chtějí seřadit čísla od nejmenšího po největší, nejmenší číslo, které tu máme, je c, že? To je 0. A pak druhé nejmenší je e, což je 0.025. Pak další nejmenší je b, což je 0.16. Další pak je a, což je 0.84, a největší by pak byla směrodatná odchylka d. Odpověď je tedy cbad. A pochopitelně, pořadí bude rozdílné, pokud by byla odpověď místo 0.84 řekněme 84, protože požadují procenta. Takže trochu nejednoznačnosti. Pokud by jste měli otázku, jako je tato, u zkoušky, vyjasnil bych si toto s učitelem. Doufám, že jste toto shledali jako užitečné. ...
video