Pravděpodobnostní rozdělení
Přihlásit se
Pravděpodobnostní rozdělení (1/7) · 9:00

Zákon velkých čísel Úvod do zákona velkých čísel (LLN)

Navazuje na Kombinatoriku.
Naučme se trochu o zákonu velkých čísel, což je v mnoha případech jeden z nejintuitivnějších zákonů v matematice a pravděpodobnosti, ale protože se dá aplikovat mnoha způsoby, je často nevhodně používán či nepochopen. Takže abychom byli trochu formální v matematice, nechte mě to nejprve definovat a pak budeme mluvit o intuici. Takže řekněme že máme náhodnou proměnnou, X. A víme, že to je očekávaná hodnota či populační průměr. Zákon velkých čísel říká, že pokud vezmeme příklad n výskytů naší náhodné proměnné, a uděláme průměr těchto pozorování... A nechte mě definovat další proměnnou. Nazveme to X s dolním indexem n s čárou nad X. Toto je znak n pozorování naší náhodné proměnné. Takže doslovně je tohle moje první pozorování. Řekněme, že provádím experiment jednou a dosáhnu tohoto pozorování, udělám ho znovu a dosáhnu tohoto pozorování. Provedu ho tedy n-krát a potom vydělím mým počtem pozorování. Tak tohle je můj výběrový průměr. Je to střední hodnota všech pozorování, která jsem učinil. Zákon velkých čísel nám jen říká, že můj výběrový průměr se přiblíží mé očekávané hodnotě náhodné proměnné. Nebo můžu napsat, že můj výběrový průměr se přiblíží mému populačnímu průměru pro n blížící se nekonečnu. A budu trochu neformální s tím, co dělá postup nebo co dělá konvergenční průměr... Ale myslím, že budete máte obecný intuitivní pocit, že když sem zvolím dostatečně velký vzorek, že nakonec dostanu očekávanou hodnotu populace jako celku. A myslím, že pro mnoho z nás je to celkem intuitivní. Že když udělám dostatek pokusů na velkých vzorcích, ty pokusy mi dají čísla, která bych očekával vzhledem k očekávané hodnotě, pravděpodobnosti a tomu všemu. Ale myslím, že je to často trochu špatně pochopeno z pohledu toho, proč se tak děje. A než se do toho pustím, dovolte mi dát vám konkrétní příklad. Zákon velkých čísel nám řekne toto... Řekněme, že mám náhodnou proměnnou - X je rovné tomu, kolikrát padne rub po 100 hodech běžnou mincí. Za prvé, víme co je očekávanou hodnotou této náhodné proměnné. Je to počet hodů, tedy počet pokusů krát pravděpodobnost na úspěch kteréhokoliv pokusu. To se rovná 50. Takže zákon velkých čísel jen říká, že pokud bych měl mít vzorek nebo kdybych měl určit průměr vzorku ze spousty těchto pokusů, tak, víte, dostanu... poprvé, když provádím tenhle pokus hodím 100 mincí, nebo mám 100 mincí v krabici od bot, zastřesu krabicí a spočítám množství případů, kdy padne rub. Dostanu 55. Takže to by bylo X1. Pak zatřesu krabicí znovu a dostanu 65. Pak zatřesu krabicí znovu a dostanu 45. Udělám to n-krát a pak vydělím počtem pokusů. Zákon velkých čísel nám jen říká, že tento průměr, průměr všech mých pozorování, bude směřovat k 50, jak se n blíží nekonečnu. Nebo pro n blížící se 50. Promiňte, n blížící se nekonečnu. A já chci mluvit trochu o tom, proč se to stane nebo intuitivně, proč tomu tak je. Spousta lidí si říká, páni, to znamená, že když po 100 pokusech, pokud jsem nad průměrem, mi nějak zákon pravděpodobnosti dá vícekrát rub nebo méněkrát, aby vytvořil rozdíl. Tohle není přesně to, co se bude dít. Často se tomu říká gamblerův klam. Dovolte mi to rozlišit. A použiji tenhle příklad. Takže řekněme... dovolte mi vytvořit graf. A já zapnu barvy. Tohle je n, moje osa x je n. Je to počet pokusů, které provedu. A moje osa y, dovolte, abych z ní udělal výběrový průměr. A my víme, co je očekávanou hodnotou, víme, že očekávaná hodnota této náhodné proměnné je 50. Dovolte mi nakreslit to tady. Tohle je 50. Takže jdeme na ten příklad, který jsem uvedl. Takže pokud n se rovná... Dovolte mi jen... Tady. Takže při prvním pokusu jsem dostal 55 a to byl můj průměr. Měl jsem jen jeden datový bod. Po dalších dvou pokusech, podívejme se, mám 65. A tak můj průměr bude 65 plus 55, děleno dvěma, což je 60. Takže můj průměr šel trochu nahoru. Potom jsem měl 45, což posune můj průměr trochu dolů. Nebudu tam už zakreslovat 45. Teď musím určit průměr ze všech těch hodnot. Kolik je 45 plus 65? Dovolte mi vlastně jen získat to číslo, abyste to pochopili. Takže to je 55 plus 65. 125 plus 45 je 165. Děleno třemi. 5 krát 3 je 15. Je to 53. Ne, ne, ne. 55. Takže průměr jde zpátky dolů na 55. A v pokusech bychom mohli pokračovat. Takže byste mohli tvrdit, že zákon velkých čísel říká... Dobře, potom, co jsme provedli 3 pokusy a náš průměr je tady. Čili mnoho lidí si myslí, že bohové pravděpodobnosti nějak zařídí, že pravděpodobně dostaneme v budoucnu méně rubů. Že další dvojice pokusů musí vyjít někde tady dole, aby posunula náš průměr dolů. A to není nutný případ. Do budoucna jsou pravděpodobnosti vždy stejné. Je pořád 50% pravděpodobnost, že mi padne rub. Není to tak, že bych měl spoustu rubů ze začátku, nebo více, než bych předpokládal, a že by se staly všechny ty náhlé věci a já bych dostal vícekrát líc. Tohle by byl gamblerův klam. Že když máte dlouho řadu rubů, nebo máte nesouměrný počet rubů, v určitém bodu budete mít... Mít s vyšší pravděpodobností zase nesouměrnou řadu lící. A to není tak docela pravda. Zákon velkých čísel nám říká, že, na tom nezaleží... Řekněme po nějakém konečném počtu pokusů, že váš průměr vlastně... Je malá pravděpodobnost, že se tak stane, ale řekněme, že váš průměr je ve skutečnosti tady nahoře. Ve skutečnosti je na 70. A říkáte si, no teda, odchýlili jsme se o pořádný kousek od očekávané hodnoty. Ale co říká zákon velkých čísel, no, mě nezajímá, kolik je to pokusů. mě nezajímá, kolik je to pokusů. Pořád nám zbývá nekonečné množství pokusu. A očekávaná hodnota pro toto nekonečné množství pokusů, zvláště v takovéto situaci, bude vypadat takhle. Takže když určíte průměr konečného množství, který se bude rovnat nějakému vysokému číslu, a potom určíte průměr nekonečného množství, který se bude blížit tomuto, budete v průběhu času směřovat zpět k očekávané hodnotě. A to byl velice neformální způsob, jak to popsat, ale to je to, co nám říká zákon velkých čísel. A to je důležitá věc. Neříká vám, že když dostanete spoustu rubů, pravděpodobnost druhé možnosti se bude zvyšovat jako nějaká kompenzace pro líce. Co vám však říká je, že bez ohledu na to, co se stalo, při konečném počtu pokusů, bez ohledu na to, jaký je průměr při konečném počtu pokusů, vám zbývá nekonečné množství dalších pokusů. A pokud jich provedete dost, bude to směřovat zpět k vaší očekávané hodnotě. A to je důležitá věc k zamyšlení. Ale tohle není použito v praxi každý den v loterii a v kasinech, protože oni vědí, že když vytvoříte dostatečně velké vzorky... A mohli bychom ještě počítat. Když vytvoříte dostatečně velký vzorek, jaká je pravděpodobnost, že věci se významným způsobem odchylují. Ale kasina a loterie každý den pracují na tomto principu, že když vezmete dostatek lidí... Jistě, v krátkém období nebo s málo lidmi, by pár lidí mohlo porazit dům. Ale v dlouhém časovém období bude dům vždycky vyhrávat, kvůli parametrům her, které vás nutí hrát. Každopádně, toto je důležitá věc v pravděpodobnosti a já myslím, že je velice intuitivní. Ačkoliv, někdy když to vidíte formálně vysvětleno jako tohle, s náhodnými proměnnými, je to trochu matoucí. Všechno, co to říká je, že jak vytváříte větší a větší vzorek, průměr tohoto vzorku se bude přibližovat skutečnému průměru. Nebo bych měl být trochu víc konkrétní. Průměr vašeho vzorku bude konvergovat ke skutečnému populačnímu průměru nebo k očekávané hodnotě náhodné proměnné. Každopádně, na viděnou v dalším videu.
video