Pravděpodobnostní rozdělení
Pravděpodobnostní rozdělení (5/5) · 14:53

Střední hodnota náhodné veličiny V mnoha učebnicích najdete vzorec pro výpočet střední hodnoty náhodné veličiny. Ale co to vůbec střední hodnota je?

Navazuje na Kombinatoriku.
... Když jsme se poprvé věnovali středním hodnotám a metodám měření průměru, mluvili jsme o aritmetickém průměru, což byl prostý součet čísel vydělený počtem čísel. Řekněme, že v populaci čísel máme trojku. Máme tři trojky a čtyřku a pětku. To je naše populace. Pokud bychom chtěli průměr populace, pak sečteme všechna čísla, tj. 3 plus 3 plus 3 plus 4 plus 5. Součet pak vydělíme počtem čísel. Budeme dělit číslem 5. A získáme. ... To je 9 plus 9, to je 18/5. Takže 18/5, což je? 3 a 3/5, což je 3,6. To je průměr populace pro tuto populaci čísel. Upravíme tuto rovnici. Podíváme se na to jinak. Kolik trojek máme? Máme 3 trojky, takže 3 krát 3. Kolik čtyřek máme? To je jedna čtyřka, takže plus 1 krát 4. Plus 1 krát 5. ... To celé děleno 5. A to je stejný výsledek. To je jednoduchá manipulace s čísly. To je stejné jako 1/5 krát 3 krát 3 plus 1 krát 4 plus 1 krát 5. A když to roznásobíme, tak dostaneme co? 3/5 krát 3 plus 1/5 krát 1. Takže plus 1/5 krát 4 plus 1/5 krát 5. ... To je jen jiný pohled na stejnou věc. Vyjádříme to v desetinných číslech: 3/5 To je 0,6 krát 3 plus 0,2 krát 4 plus 0,2 krát 5. Nebo také v procentech. To je 60% krát 3 plus 20% krát 4. Plus 20% krát 5. To je totéž, jako kdybychom čísla sečetli a pak je vydělili celkovým počtem čísel, která máme. Je to zajímavé. Původně jsme museli vědět, kolik máme celkem čísel. Sečetli jsme 5 čísel, a tak jsme dělili pěti. Pak jsem si trochu pohrál s aritmetikou. A získal jsem tuto rovnici. Ale tato rovnice je zajímavější. Tedy ne nutně zajímavější. Ale jiná. Tato rovnice nám neřekne, kolik bylo původně čísel. Obsahuje pouze četnost čísel. Takže 60 % z čísel je 3, 20 % z čísel je 4, a 20 % z čísel je 5. A pokud to spočítáme, získáme 60 % krát 3, což je 1,8. Plus 20 % krát 4 je 0,8 Plus 20 % krát 5. Což je 20 % plus 1, což je rovno 2,6, plus 1, je rovno 3,6 Získáme stejné číslo. Ale zajímavé je to, že jsou zde pouze četnosti, relativní četnosti trojek, čtyřek a pětek. Jaké procento populace jsou trojky? 60 %. Jaké procento jsou čtyřky? 20 %. A pětky? Říkám to proto, že jsme před chvílí mluvili o náhodných veličinách. Na začátku jsme mluvili o populacích a výběrových souborech. Pokaždé, když provádíme pokus, získáme novou hodnotu pro náhodnou veličinu. Uděláme si klasický příklad. Máme náhodnou veličinu X, která je rovna počtu případů, kdy padla panna, po 6 hodech spravedlivou mincí. To je naše náhodná veličina. Teď se pokusíme spojit, co jsme si říkali o aritmetickém průměru a střední hodnotě a populaci versus výběrovém souboru, a propojíme to s konceptem náhodných veličin. Nejdříve jsme mluvili o populaci. Z této populace vybereme soubor. To jsme si ukázali. Například chceme odhadnout výsledek prezidentských voleb. Populace jsou všichni, kdo budou volit v těchto volbách. Nelze se ptát všech 50 milionů lidí, nebo kolik jich vlastně bude volit. Takže náhodně vybereme soubor, vzorek, této populace a pak můžeme spočítat statistiku na tomto výběrovém souboru s cílem získat odhad pro populaci jako celek. Co se stane, pokud je populace nekonečně velká? Pokud má populace konečnou velikost, můžeme spočítat právě například průměr populace. Řekli jsme si, že průměr populace je řecké písmeno mí. Vezmeme doslova všechny položky v populaci, sečteme je, a vydělíme počtem položek. To jsme udělali tady. Pokud je toto celá populace čísel, pak jsme zjistili, co je mí. Pokud je to výběrový soubor z populace, pak toto bude výběrový průměr. Ale to nás teď nezajímá. Co uděláme, pokud bude populace nekonečně veliká? Nekonečná, jako, ale pozor to přeci nedává smysl. Možná ale náhodná veličina může být nekonečně veliká - pokud uvažujeme každý případ. Pokaždé, když provedeme pokus, popíšeme jeden případ nekonečně velké populace. Tento experiment můžeme opakovat nekonečně krát. ... Není to případ, kdy bychom řekli po jednom tisíci pokusů, že už nelze dál házet mincí šestkrát a sečíst, kolikrát padla panna. Můžeme pokračovat do nekončena. Takže, konkrétní případ náhodné veličiny, ty jsou psány obvykle malými písmeny, malé x1, nebo x2, nebo x3. Ty představují konkrétní případy náhodné veličiny. Jsou to vlastně výběrové soubory z nekonečně veliké populace. Nakreslíme si nekonečně velikou populaci. Což je těžší. Nakreslím šipky do všech směrů. Jakože populace nemá žádnou hranici. Můžeme pokračovat v experimentu a získat další výběry, ale výběry mají obvykle konečnou velikost. ... Takže v rámci experimentu jsme hodili spravedlivou mincí šestkrát. Opakovali jsme to 100 krát. Budeme mít 100 výběrů, x1, x2 až do x100. Chci ukázat provázanost mezi náhodnou veličinou a spočtenou statistikou, kterou jsme si již ukázali. Ukáži vám koncept střední hodnoty náhodné veličiny. ... Středí hodnota náhodné veličiny, očekávaná hodnota náhodné veličiny je totéž jako průměr populace. Někdy se jí také říká průměr pulace. Zajímavé je, že máme nekonečně velikou populaci. Nelze prostě sečíst všechna čísla a podělit je počtem čísel, protože máme nekonečné množství čísel. Ale můžeme zjistit četnost čísel. Trojka se objeví v 60 % případů, čtyřka ve 20 %, pětka ve 20 % případů. Přestože máme nekonečný počet čísel, můžeme spočítat průměr. Tak se to provádí pro střední hodnotu náhodné veličiny. Jak zjistíme četnost jednotlivých čísel? Podíváme se na rozdělení pravděpodobnosti, na diskrétní rozdělení pravděpodobnosti. Ukážeme si to ... v Excelu. n je rovno 6 pokusů, pravděpodobnost pan a orlů je 0,5. Poupravím tento graf. ... Vyberu vstupní hodnoty pro tento graf. ... ... Zde. To je rozdělení pravděpodobnosti sittuace, kterou jsem právě popsal. Hodím spravedlivou mincí a chci vědět, kolikrát padne panna v šesti hodech. Můžeme si ten experiment zkusit. Toto ukazuje četnost této náhodné veličiny. Uděláme tento experiment. ... V 9 % případů padne přesně 1 panna. Ve 23 % případů padnou 2 panny. Ve 31 % případů padnou 3 panny. Ve 23% případů padnou 4 panny. A v 9 % případů padne panna pětkrát. Pak ve 2 % případů padne panna šestkrát. S touto informací můžeme zjistit průměr populace pro tuto populaci. Ten je zachycen v tomto rozdělení pravděpodobnosti. Neboli střední hodnotu. ... Dám to z cesty. ... Budu se dívat na graf. ... Viděli jsme rozdělení pravděpodobnosti této náhodné veličiny. Počet hlav po 6 hodech spravedlivou mincí. Střední hodnotu náhodné veličiny získáme tak, že vezmeme každý výsledek... První výsledek je žádná panna krát četnost, s jakou padla 0 krát panna. Předtím jsme zjistili... ... přesná čísla. ... Žádná panna nepadne v 0,01563 % případů. ... ... Napíši to jako 1.563 % případů. Plus 1 panna padne v 9,375 % případů. A pak plus 2 panny padnou v 23,438 % případů. Plus 3 panny padnou v 31,25 % případů. ... Čtyři panny z 6 pak ve 23 % případů. Krát 23,438 %. 5krát padne panna ve 9,375 % případů. A nakonec samé panny padnou ve 1,563 % případů. A to dává smysl, protože samé panny musí být stejně pravděpodobné jako samí orli. Samí orli jsou vlastně stejná situace jako žádné panny. Je to totéž, co jsme dělali na začátku. Vzali jsme relativní četnost každého výsledku v populaci a tu jsme vynásobili daným výsledkem, načež jsme vše sečetli. To je stejná věc, matematicky řečeno. Jako tady nahoře. Teď můžeme použít stejný postup při hledání aritmetického průměru nekonečně veliké populace. Neboli střední hodnotu náhodné veličiny, což je totéž jako aritmetický průměr populace této náhodné veličiny. Tato hodnota je rovna... ... Střední hodnota: kolikrát padne panna v 6 hodech. To je 0 krát příslušná četnost, stejně postupuji ve všech případech. Toto bude 1 krát příslušná četnost, 2 krát příslušná četnost, a součet toho všeho se rovná přesně 3. A to je ve středu, že? Neměl bych říkat 've středu' často. Centrální tendence, či průměr populace této náhodné veličiny, či vlastně střední hodnota této náhodné veličiny je přesně 3. A v tomto případě 3 dává smysl také intuitivně. Je to úplně uprostřed. Je to nejpravděpodobnější hodnota. Ale uvidíme, že střední hodnota vůbec nemusí být nejpravděpodobnější hodnota. Může být vysoká pravděpodobnost. že nepadne žádná panna, a velká pravděpodobnost, že jich padne 6. A střední hodnota by byla stejně 3, i přestože 6 i 0 by měly větší pravděpodobnost. Ukážu k tomu víc příkladů. Ale nyní jsem chtěl ukázat, že výpočet střední hodnoty je stejný jako výpočet průměru populace. Ale je nutno to dělat tímto způsobem, protože nelze sečíst nekonečně velké množství dat a podělit je nekonečně velkým číslem. Místo toho je nutno znát četnost každého výsledku a pak sečíst výsledky vážené svými četnostmi. To je stejné jako zde nahoře. Je dobré vědět, jak to funguje, protože v některých učebnicích dají pouze vzorec: střední hodnota rozdělení pravděpodobnosti je každý z možných výsledků krát jeho četnost. Zde jsem chtěl ukázat, že jde o stejnou věc, jako průměr populace Uvidíme se příště. ...
video