Statistická indukce (9/20) · 14:28
Příklad na výběrové rozdělení Výpočet pravděpodobnosti, že dojde voda na výletě v přírodě.
Navazuje na
Popisná statistika.
Průměrný muž vypije při aktivním pobytu venku 2 litry vody se směrodatnou odchylkou 0,7 litru. Plánujete celodenní výlet do přírody pro 50 mužů a budete mít s sebou 110 litrů vody. Jaká je pravděpodobnost, že vám voda dojde? Takže o co tu jde. Máme tedy nějaké rozložení toho, kolik litrů vody potřebuje jeden muž při aktivním pobytu venku. Nakreslím ten příklad sem. Může vypadat nějak takto. Všichni tedy budou potřebovat minimálně více než 0 litrů, takže tady bude 0. Průměrné množství vody, které potřebuje jeden muž při aktivním pobytu venku, jsou 2 litry. 2 litry tedy budou někde tady. Průměr se tedy rovná 2 litrům. Má směrodatnou odchylku 0,7 litru. Asi to nakreslím takto. Nevíme, jestli se jedná o normální rozložení nebo ne. Může to být i nějaké neobvyklé rozložení. Někteří lidé potřebují vody... každý potřebuje alespoň trochu vody, ale někteří lidé možná potřebují jen velmi, velmi málo vody. Pak máme spoustu lidí, kteří potřebují tolik, několik lidí, kteří potřebují víc a nikdo asi nebude schopen vypít více než 4 litry vody. Toto je tedy naše rozdělení. Jedna směrodatná odchylka je 0,7 litru. Tady bude 1 litr, 2 litry, 3 litry. Čili jedna směrodatná odchylka bude asi takto daleko od průměru. Když půjdete od průměru dolů, je to asi tady, když půjdete nahoru, nakreslím to sem. Toto je směrodaná odchylka. Toto je směrodatná odchylka doprava, toto je směrodatná odchylka doleva. Víme, že směrodatná odchylka se rovná 0,7 litru. Toto je tedy naše rozdělení spotřeby vody průměrného muže při aktivním pobytu venku. A teď co je na tomto problému zajímavé. Plánujeme celodenní výlet do přírody pro 50 mužů a budeme mít s sebou 110 litrů vody. Jaká je pravděpodobnost, že nám voda dojde? Pravděpodobnost, že nám dojde... napíšu to sem. Pravděpodobnost, že nám dojde voda se rovná nebo je stejná jako pravděpodobnost, že během svého výletu spotřebujeme více než 110 litrů vody, ať už tam děláme cokoliv. A to je stejné jako pravděpodobnost, že spotřebujeme více než 110 litrů, to znamená v průměru... Protože máme 50 mužů, takže 110 děleno 50 je kolik? Vezmu si kalkulačku, abychom neudělali chybu. Tady ji mám. Pokud 50 mužů vypije 110 litrů - předpokládám, že včetně nás - dojde nám voda, když v průměru spotřebujeme více než 2,2 litru na hlavu. Je to tedy stejné jako pravděpodobnost průměru, nebo možná bychom měli říct výběrového průměru... zapíšu to takto: že průměrná spotřeba vody na hlavu je větší než... možná bychom měli říct větší než nebo se rovná... řekněme větší než, aby to bylo úplně správně, větší než 2,2 litru na hlavu. V podstatě vybíráme 50 mužů z nějakého obecného výběrového souboru. Získali jsme tato data, bůhví odkud to máme, že průměrný muž vypije dva litry a že směrodatná odchylka je tolik. Existuje možná nějaká velká studie a toto byl nejlepší odhad parametrů populace. Tento průměr a tato směrodatná odchylka. Nyní vybereme vzorek o velikosti 50 mužů. Teď potřebujeme vypočítat, jaká je pravděpodobnost, že průměr výběru, výběrový průměr, bude větší než 2,2 litru. Proto musíme vypočítat rozdělení výběrového průměru. Víme, jak se tomu říká... Je to výběrové rozdělení výběrového průměru. A víme, že půjde o normální rozdělení. A známe také některé vlastnosti normálního rozdělení. Toto je rozdělení všech mužů. Pokud provedeme výběr o velikosti, řekněme, 50 mužů, bude to... napíšu to sem. Tady dole nakreslím výběrové rozdělení výběrového průměru, kde "n", tedy velikost výběru, se rovná 50. Ukáže nám to v podstatě pravděpodobnost různých průměrů, pokud vybereme 50 mužů z této populace a vezmeme jejich průměrnou spotřebu vody. Takže to nakreslím... Řekněme, že toto je četnost a tady jsou různé hodnoty. Průměrná hodnota, průměr... napíšu to sem... průměr výběrového rozdělení výběrového průměru, osa x... je to skutečně jen výběrový průměr... se rovná, když to zopakujeme milionkrát... Pokud nakreslíme graf ze všech průměrů, provedeme 50 výběrů a zaneseme je do grafu, ukáže se, že průměr tohoto rozdělení je stejný jako průměr naší skutečné populace. Bude to stejná hodnota, napíšu to modře. Bude to stejná hodnota jako u populace tady nahoře. Tedy 2 litry. Stále tedy máme uprostřed 2 litry. Co je na tom ovšem krásné, že výběrové rozdělení výběrového průměru... vyberete 50 lidí, najdete průměr, zaznamenáte četnost. Toto bude normální rozdělení bez ohledu na to, jaké rozdělení máme tady nahoře. Přestože toto není normální rozdělení, tady dole bude normální, jak jsme viděli už v předchozích videích. Toto bude normální rozdělení. Směrodatná odchylka... viděli jsme to v předchozím videu a snad tušíme, proč to tak je. Směrodatná odchylka... Možná to vysvětlím trochu lépe. Rozptyl výběrového průměru bude rozptyl... vzpomeňte si... toto je směrodatná odchylka, rovná se rozptyl populace děleno "n". Pokud chceme směrodatnou odchylku tohoto rozdělení, odmocníme zkrátka obě strany rovnice. Pokud odmocníme obě strany, vyjde nám, že směrodatná odchylka výběrového průměru se rovná odmocnině této strany, tedy směrodatné odchylce populace, děleno odmocninou "n". Co to v našem případě znamená? Víme, že směrodatná odchylka základního souboru je 0,7. Kolik je "n"? Máme 50 mužů. 0,7 lomeno odmocnina z 50. Kolik to je, spočítáme na kalkulačce. 0,7 děleno odmocnina z 50 je 0,09, vlastně 0,098 nebo zaokrouhleně spíš 0,099. Napíšu to sem. Rovná se 0,099. To je směrodatná odchylka tady toho. Směrodatná odchylka tu bude tedy nižší. Rozdělení bude normální a bude vypadat nějak takto. Tady máme 3 litry, tady 1 litr. Směrodatná odchylka je skoro desetina, bude to tedy mnohem užší rozdělení. Bude vypadat... pokusím se ho nakreslit. Bude vypadat nějak takto. Asi tak. Směrodatná odchylka je tu téměř 0,1, přesněji 0,09, téměř desetina. Bude to tedy... jedna směrodatná odchylka od průměru bude vypadat asi nějak takto. A máme naše rozdělení. Je to normální rozdělení. Vraťme se nyní k naší původní otázce. Chceme znát pravděpodobnost, že náš výběr bude mít průměr větší než 2,2. Toto je rozdělení všech možných výběrů. Průměry všech možných výběrů. Větší než 2,2... 2,2 bude někde tady. V podstatě nám tedy dojde voda, když se náš výběrový průměr dostane tady do toho kyblíku. Musíme tedy vypočítat... zajímá nás tady ta oblast pod křivkou. A abychom ji mohli spočítat, musíme spočítat kolik směrodatných odchylek od průměru se nacházíme, což bude naše Z-skóre. Pak můžeme použít Z-tabulku, s jejíž pomocí vypočítáme oblast tady pod křivkou. Chceme tedy vědět, kdy budeme nad 2,2 litru, takže 2,2 litru je to, co nás zajímá. To je asi tady. Náš průměr je 2, takže jsme 0,2 nad průměrem. Pokud to chceme ve směrodatných odchylkách, vydělíme to směrodatnou odchylkou tohoto rozdělení. Už jsme spočítali, kolik to je. Směrodatná odchylka tohoto rozdělení je 0,099. Máme vzorec, podle kterého vezmete tuto hodnotu mínus průměr a vydělíte směrodatnou odchylkou. A to je celé. Jen počítáme, kolik směrodatných odchylek nad průměrem se nacházíme. Takže vezmete tady to číslo a vydělíte ho směrodatnou odchylkou 0,099 a vyjde nám... Vezmu si kalkulačku. Přesné číslo máme vlastně tady. Vezmeme tedy 0,2 děleno tady tím číslem. Na mojí kalkulačce zmáčknu toto tlačítko, což znamená poslední výsledek. Vezmu tedy 0,2 děleno tady tím číslem a vyjde mi 2,020. Znamená to, že tato hodnota... Tato pravděpodobnost je stejná jako pravděpodobnost, že jsme 2,02 směrodatné odchylky... Možná bych to měl zapsat jinak. Více než.... Napíšu to dolů, jet tu víc místa. Pravděpodobnost, že nám dojde voda, se scvrkne na pravděpodobnost, že výběrový průměr bude více než... Jen těch 50, které jsme vybrali... když provedeme několik výběrů o rozsahu 50 a vytvoříme graf, vyjde nám tady to rozdělení. Jedna padesátka, skupina 50 lidí, které jsme vybrali... pravděpodobnost, že nám dojde voda se rovná pravděpodobnosti, že průměr těchto lidí, bude více než 2,02 směrodatné odchylky nad průměrem... tohoto rozdělení, což je v podstatě stejné rozdělení. Co to znamená? Nyní se musíme podívat do naší Z-tabulky. Tady ta hodnota 2,02 0,2 děleno 0,09. Musel jsem pozastavit video, protože venku dělala rámus nějaká stíhačka nebo co. No snad už se nevrátí. Potřebujeme tedy vypočítat pravděpodobnost, že výběrový průměr bude více než 2,02 směrodatné odchylky nad průměrem. Abychom to mohli spočítat, potřebujeme Z-tabulku, kterou najdete skoro všude. Obvykle v nějaké učebnici statistiky, na internetu, kdekoliv. Chceme znát pravděpodobnost... Z-tabulka vám řekne, jak velká oblast je pod touto hodnotou. Najdete si "z" 2,02 - to je hodnota, která nám vyšla. Máme tedy 2,02. Najdete si 2,0 a pak 2,02. 2,02 je přesně tady. Tady jsme našli 2,0 a další číslici 02 najdeme tady nahoře. 2,02 je tedy přesně tady. A je to 0,9783. Napíšu to dolů. 0,9783, musím to napsat správně. 0,9783, to ale není hodnota tady toho nahoře. 0,9783 ze Z-tabulky vyjadřuje celou tady tu oblast nalevo. Říká nám pravděpodobnost, že jsme pod tou hodnotou. Že jsme méně než 2,02 směrodatné odchylky nad průměrem. Vyjadřuje tady tu hodnotu. Musíme to odečíst od 1, abychom mohli odpovědět na naši otázku, protože všechny tyto hodnoty se přičítají k 1. Vezmu si opět kalkulačku... 1 mínus 0,9783 se rovná 0,0217. Tady ta oblast je 0,0217. Jinak se dá také říci, že je 2,17% pravděpodobnost, že nám dojde voda. A máme to. Jen se ujistím, že je to číslo správně. Bylo to 0,0217, správně. Máme 2,17% šanci, že nám dojde voda.
0:00
14:28