Regrese
Přihlásit se
Regrese (3/10) · 6:47

Čtvercová chyba regresní přímky Máme skupinu bodů a chceme jimi proložit přímku tak, aby byl součet čtverců odchylek bodů od této přímky co nejmenší. V tomto videu si ukážeme, co máme vůbec na mysli, když mluvíme o součtu čtverců odchylek.

Navazuje na Pravděpodobnostní rozdělení.
- V následujících několika videích se pustíme do něčeho, z čeho vzejde metoda, kterou je velmi snadné použít. A na většině hodinách statistiky uvidíte pouze tento finální výsledek. Zkusíme si však ukázat, jakým způsobem se k němu dostat. Ale varuji vás předem. Čeká na vás spousta záludné matematiky, většina z toho bude nepříjemná algebra. A pak budeme muset dokonce trochu zabrousit k derivacím. Budeme muset dokonce udělat pár parciálních derivací. Takže pokud ve vás něco z toho vzbuzuje přílišné obavy, nebo pokud vás něco z toho odrazuje, nemusíte tohle video sledovat. Můžete přeskočit na konec a podívat se až na výsledek, který si v tomto videu odvodíme. Ale za sebe můžu říct, že mám vážně lepší pocit, když si výsledek odvodím. Takže, o čem tu budeme přemýšlet, je toto. Řekněme, že máme n bodů v soustavě souřadnic. A nemusí být všechny v prvním kvadrantu. Ale pro jednoduchost a přehlednost si je nakreslíme všechny do prvního kvadrantu. Takže řekněme, že máme tady tenhle bod. Ale ne, nakreslíme si je raději různými barvami. Řekněme, že máme tento bod. Tak, a jeho souřadnice jsou x1, y1. A pak řekněme, že máme další bod zde. Ale ne, jinou barvou. Jeho souřadnice jsou x2, y2. Pak můžeme přidávat další body. A dále je kreslit. Tak bychom získali spousty bodů. Tady a tady a tady. Až se dopracujeme k n-tému bodu. Tak, k n-tému bodu. Mohl by být třeba tady. Nazvěme ho xn, yn. Máme zde tedy n bodů. Všechny jsme si tady nenakreslili. Ale teď bychom chtěli najít nějakou přímku tak, aby součet druhých mocnin vzdáleností všech těchto bodů od této přímky byl co nejmenší. Zamysleme se nad tím na chvíli. Na minutku si takovou přímku představme. Takže bude tady nějaká přímka. Pokusím se nakreslit přímku, která by tomu alespoň trochu odpovídala. Nakreslíme ji tedy takhle. Mohla by vypadat přibližně takto. Pokusím se ji odhadnout co nejlépe. Vlastně bych ji raději nakreslil trošku jinak. Možná by mohla vypadat přibližně takto. V tuhle chvíli ani nevím, jak naše hledaná přímka vypadá. Co chceme udělat, je minimalizovat čtvercovou chybu každého z těchto bodů vzhledem k hledané přímce. Zamysleme se nad tím, co to vlastně znamená. Napíšeme si rovnici této přímky: y = mx + b Tohle známe z algebry. Tohle je směrnice přímky a tohle je průsečík s osou y. Je to vlastně bod o souřadnicích 0, b. Co chci udělat, a co bude obsahem několika dalších videí, je zjistit, jak nalézt m a b. Protože tyto dva parametry určují přímku, kterou hledáme. A to tak, aby čtvercová chyba byla minimální. Co to vlastně je tato chyba? Pro každý z těchto bodů platí, že chyba se rovná jeho vertikální vzdálenosti od přímky. Takže tohle nazvěme chybou jedna. Chybou jedna. A tohle zde by byla chyba dvě. Byla by to vertikální vzdálenost mezi tímto bodem a přímkou. Nebo si to můžete představit jako souřadnici y tohoto bodu a souřadnici y na přímce. A když se posuneme na konec, najdeme zde chybu opět jako vzdálenost mezi souřadnicí y tohoto bodu a souřadnicí y na přímce. Takže když se nad tím zamyslíte, tahle chyba, neboli chyba jedna, je tato hodnota y. Ta se rovná y1 mínus tato hodnota y. Jenže čemu se rovná tahle hodnota y? Zde máme souřadnici x, která se rovná x1. A tento bod je bod m krát x1 plus b. Zkrátka vezmeme bod x1 a dosadíme ho do rovnice přímky, čímž dostaneme právě tento bod. Bude se tedy rovnat m krát x1 plus b. To je první chyba. Totéž provedeme se všemi body. Chyba zde bude rovna y2 mínus (m krát x2 plus b). A tento bod zde se rovná m krát x2 plus b. Jde o hodnotu, kterou dostanete, pokud dosadíte x2 do rovnice této přímky. A takto budeme pokračovat až k n-tému bodu. Chyba zde se bude rovnat yn mínus (m krát xn plus b). Kdybychom chtěli zjistit součet těchto chyb, mohli bychom prostě sečíst délky těchto čar. Ale my chceme minimalizovat čtvercovou chybu mezi každým tímto bodem a přímkou, tedy druhou mocninu vzdálenosti každého z těchto n bodů od přímky. Takže si definujeme čtvercovou chybu vzhledem k této přímce jako součet těchto jednotlivých čtvercových chyb. Takže tato chyba zde, nazvali jsme ji chybou jedna, je rovna y1 mínus (m krát x1 plus b). Teď ji umocníme na druhou. Čímž dostaneme čtvercovou chybu jedna. Teď je na řadě čtvercová chyba.dvě. Čtvercová chyba dvě se rovná y2 mínus (m krát x2 plus b). A teď umocníme tuhle chybu. Budeme pokračovat a provedeme totéž pro všech n bodů. Dostaneme se tak až k této n-té chybě. Chyba n se rovná yn mínus (m krát xn plus b). Nyní ji umocníme na druhou. Uděláme druhou mocninu. Tohle je tedy čtvercová chyba naší přímky. A v následujících videích se pokusíme najít m a b tak, abychom minimalizovali čtvercovou chybu této přímky. To, co jsme si tu ukázali, můžeme považovat za nejlepší způsob, jak vyhodnotit, zda jsme vybrali pro tyto body dobrou přímku. Nyní se však pokusíme najít přímku, která těmto bodům vyhovuje co nejlépe. Budu pokračovat v příštím videu. Protože si myslím, že s touhle ošemetnou matematikou je lepší brát to postupně. Takto minimalizuji pravděpodobnost, že udělám chybu. -
video