Statistická indukce
Statistická indukce (11/20) · 8:20

Průměr a rozptyl Bernouilliho rozdělení Příklad na výpočet průměru a rozptylu Bernouilliho rozdělení

Navazuje na Popisná statistika.
- Řekněme, že půjdu ven a udělám průzkum s každým člověkem v populaci, což v praxi není možné, ale dejme tomu. Zeptám se každého z nich, co si myslí o prezidentovi. A dám jim jen dvě možné odpovědi. Mohou ho hodnotit buď negativně, nebo pozitivně. A poté, co se zeptám úplně všech lidí v populaci, 40 % z nich ho bude dejme tomu hodnotit negativně a 60 % pozitivně. Takže když nakreslím pravděpodobnostní rozdělení, tak bude diskréní, protože máme jen dvě možné hodnoty u každého člověka. Buď ho hodnotí negativně, nebo ho hodnotí pozitivně. A 40 % z nich ho hodnotí negativně, nakreslím to barevně. Takže tohle je 40 %, tedy 0,4, nebo sem prostě napíšu 40 %. A 60 % lidí ho hodnotí pozitivně. Takže to zakreslím barevně. 60 % ho hodnotí pozitivně. Takže tato dvě čísla v součtu dají 100 %. Protože každý si musel vybrat jednu z těchto možností. Kdybych teď šel a vybral náhodného člověka z populace a zeptal se, jaká je očekávané hodnocení prezidenta u tohoto člověka, kolik by to bylo? Nebo jinak, jaký je průměr tohoto rozdělení? Pro diskrétní rozdělení jako toto je očekávaná hodnota prostě vážený součet různých hodnot, které může rozdělení nabývat. Takže sem jsem to napsal takto, vážený součet U a F, čili záporného a kladného hodnocení. Nemůžeme ale spočítat 40 % krát U plus 60 % krát F. Z toho žádné číslo nedostaneme. Musíme nějak definovat U a F. Přiřadit jim nějakou hodnotu. Takže řekněme, že U se rovná 0 a F se rovná 1. A nyní už součet vážený pravděpodobností dává smysl. Takže průměr tohoto rozdělení bude 0,4, což je pravděpodobnost tady, krát 0, plus 0,6 krát 1, což se bude rovnat prostě jen 0,6 krát 1, což je 0,6. Průměr je 0,6. Takže pochopitelně hodnota pro žádného člověka nemůže být 0.6. Nikdo Vám neřekne, že prezidenta hodnotí z 60 % pozitivně a ze 40 % negativně. Každý si musí vybrat jen jednu z těchto dvou možností. Nenajdeme nikoho, kdo by hodnotil prezidenta pozitivně z 60 %. Musí to být buď 1, nebo 0. Tohle je tedy zajímavý případ, kde průměr nebo očekávaná hodnota není hodnotou, kterou by náhodná veličina z tohoto rozdělení mohla mít. Je to nějaká hodnota někde tady, kterou nikdy nedostaneme. Ale je to průměr, očekávaná hodnota. Důvod, proč to dává smysl, je že kdybyste vzali 100 lidí a zeptali se, zda hodnotí prezidenta kladně, a vynásobiil toto číslo stem, pak byste mohli očekávat, že 60 lidí řekne ano. Kdybyste to posčítali, 60 lidí by řeklo ano, a 40 lidí by řeklo ne. Kdybyste to všechno posčítali, 60 % lidí by řeklo ano, a to je přesně to, co nám naše rozdělení v populaci říká. A jaký je rozptyl? Jaký je rozptyl tohoto rozdělení? Takže rozptyl, napíšu to sem, vezmu si na to jinou barvu. Rozptyl je prostě součet čtverců vzdáleností od průměru vážený pravděpodobností, neboli očekávaná hodnota druhých mocnin vzdáleností od průměru. Kolik to tedy bude? Máme tu jen dvě možné hodnoty, které můžeme dostat. Můžeme mít buď 0, nebo 1. Pravděpodobnost, že dostaneme 0, je 0,4, takže to máme čtyřicetiprocentní pravděpodobnost, že dostaneme 0. Máme-li 0, jaká je vzdálenost od průměru? Vzdálenost od průměru je 0 mínus 0,6, nebo můžu říct i 0,6 mínus 0, to je jedno, protože to stejně umocníme na druhou. 0 mínus 0,6 na druhou, pamatujeme si, že rozptyl je vážený součet druhých mocnin vzdáleností. Takže to je rozdíl nuly a průměru. A k tomu přičteme toto: máme pravděpodobnost 0,6, že dostaneme 1. Počítáme rozdíl mezi 1 a 0,6, tedy naším průměrem. A pak to také umocníme. Kolik to bude? To bude 0,4 krát 0,6 na druhou, protože 0 mínus 0,6 je mínus 0,6. Když to umocníme, dostaneme 0,36. To bude tato hodnota, vybarvím to. Tohle bude 0,36. A pak tato hodnota napravo, vezmu si jinou barvu, takže to máme plus 0,6 krát 1 mínus 0,6 na druhou. 1 mínus 0,6 je 0,4. 0,4 na druhou je 0,16. Tak to zapíšeme. Tohle bude tedy rovno 0,16. Vytáhnu si kalkulačku a spočítám to. Spočítám tyto hodnoty. - Tohle bude 0,4 krát 0,36 plus 0,6 krát 0,16, což se rovná 0,24. Takže rozptyl tohoto rozdělení je 0,24. Nebo jinak, rozptyl je 0,24 a směrodatná odchylka je jen odmocnina z rozptylu, takže směrodatná odchylka tohoto rozdělení bude odmocina z 0,24, na což musím použít kalkulačku. To bude odmocnina z 0,24, což bude 0,48. Zaokrouhlím to na 0,49. Takže když se podíváme na toto rozdělení, jeho průměr je 0,6, průměr je 0,6. A směrodatná odchylka je přibližně 0,5. Takže směrodatná odchylka... sahá to až sem, když přičteme jednu směrodatnou odchylku, dostaneme se skoro k 1,1. Tohle je jedna směrodatná odchylka nad průměrem. A jedna směrodatná odchylka pod průměrem je někde tady. Což dává smysl. Je trochu těžké si to představit pro diskrétní rozdělení, protože nemůžete dostat žádnou z těchto hodnot. Ale dává smysl, že rozdělení je sešikmené doprava. Každopádně jsem použil konkrétní čísla, abych ukázal, k čemu je toto rozdělení dobré. V dalším videu to udělám s obecnými čísly, kdy tohle bude p, čili pravděpodobnost úspěchu, a tohle bude 1 mínus p, čili pravděpodobnost neúspěchu. A pak si ukážeme obecné vzorce pro průměr a směrodatnou odchylku tohoto rozdělení, kterému se říká Bernouilliho rozdělení. Je to nejjednodušší případ binomického rozdělení.
video