Lineární algebra
Přihlásit se
Lineární algebra (28/29) · 16:56

Důkaz Cauchyho-Schwarzovy nerovnosti Důkaz tvrzení, že absolutní hodnota skalárního součinu dvou realných vektorů je menší nebo rovna součina jejich velikostí.

Navazuje na Algebra: Posloupnosti.
Mějme dva nenulové vektory. Označme první vektor <i>x</i>, druhý vektor jako <i>y</i>. Oba dva vektory jsou prvky množiny Rn. A oba vektory jsou nenulové. Ukazuje se, že absolutní hodnota jejich… ...použiju jinou barvu. Tahle barva je pěkná. Tak tedy, absolutní hodnota jejich skalárního součinu ...a pamatujme, že jde pouze o skalární veličinu... je menší nebo rovna součinu jejich velikostí. Již jsme si definovali skalární součin a taky velikost vektoru. Takže, je menší nebo rovna součinu jejich velikostí a navíc, jediný případ, kdy se jedná o rovnost, tedy, že skalární součin vektorů bude roven součinu jejich délek pouze v případě, že jeden z vektorů je skalárním násobkem vektoru druhého. Nebo-li, jedná se o lineární kombinaci. Však víte, to je přece totéž. Jen jiný pojem. Tudíž jen v případě, že, dejme tomu, <i>x</i> je skalárním násobkem <i>y</i>. Tato nerovnost, nebo vlastně rovnost této nerovnosti, se nazývá Cauchyho-Schwarzova nerovnost. Cauchyho-Schwarzova nerovnost. Nyní si větu dokažme, protože se přece nespokojíme, s tvrzením, že to tak prostě je. Začněme vytvořením pomocné funkce. Vytvoříme funkci… funkci nějaké proměnné, nějaké skalární veličiny, například <i>t</i>. Označme p(t) jako délku vektoru <i>t</i> krát vektor <i>y</i>... tedy nějaký skalár <i>t</i> krát vektor <i>y</i> minus vektor <i>x</i>. Je to tedy délka tohoto vektoru. Toto je nyní také vektor. A to na druhou. Ještě, než budeme pokračovat, chtěl bych ještě něco připomenout. Pokud vezmu velikost jakéhokoli reálného vektoru... což teď udělám. Vezměme velikost nějakého vektoru <i>v</i>. Měli bychom si uvědomit, že velikost bude kladné číslo. Nebo alespoň nezáporné. Protože každý člen bude umocněn na druhou. ...<i>v2</i> na druhou... až do <i>vn</i> na druhou. Všechny členy jsou reálná čísla. Pokud tedy umocníme jakékoliv reálné číslo na druhou, výsledek bude vždy větší nebo roven nule. Součet těchto nezáporných členů bude opět větší nebo roven nule. A když výraz odmocníme, zase dostaneme něco většího nebo rovného nule. Tudíž velikost jakéhokoliv reálného vektoru bude vždy větší nebo rovna nule. Toto je tedy velikost reálného vektoru. Z toho plyne, že výraz bude větší nebo roven nule. V minulém videu, teda asi v předminulém, jsme si ukázali, že velikost vektoru na druhou může být zapsána taktéž jako skalární součin vektoru se sebou samým. Přepišme tedy náš vektor tímto způsobem. Velikost tohoto vektoru je tedy rovna skalárnímu součinu vektoru se sebou samým. Takže, (<i>ty</i> minus <i>x</i>) krát (<i>ty</i> minus <i>x</i>). V posledním videu jsme si ukázali, že se skalárním součinem můžeme pracovat podobně jako s běžným násobením, pokud jde o asociativitu, distributivitu a komutativitu. Takže, když provedeme toto násobení, můžeme se na to dívat jako na násobení dvou dvojčlenů. Lze to provést podobně jako násobení běžných algebraických dvojčlenů. Jednoduše využijeme distributivity. Ale pamatujme, že nejde o běžné násobení. Provádíme přece skalární součin. Jde o násobení vektorů... nebo o jednu z variant. Využijme distributivity, takže nyní máme <i>ty</i> . <i>ty</i>, ....napíši to. Takže nyní píšeme <i>ty</i> . <i>ty</i>. A následně dostaneme minus... uděláme to takhle. Pak dostaneme mínus <i>x</i> krát tento výraz <i>ty</i>. Vlastně bych měl místo "krát" používat "sklární součin". Takže skalární součin <i>-x</i> a <i>ty</i>. A nyní máme tedy tohle <i>ty</i> krát toto <i>-x</i>. Pak píšeme skalární součin <i>-ty</i> a <i>x</i>. A konečně máme skalární součin obou <i>x</i>. Což je tedy skalární součin <i>-x</i> a <i>-x</i>. Přičteme tedy <i>-x</i>. Můžeme to vidět jako plus (-<i>x</i>) nebo plus (-1)<i>x</i>. Takže to máme skalární součin výrazů <i>minus 1x</i> a <i>minus 1x</i>. Toto je celý zjednodušený výraz... nebo tedy rozšířený. Vlastně to nemůžu nazvat zjednodušením. Ale můžeme využít komutativity a asociativity k přepsání tohoto výrazu. To je tedy rovno skalárním součinu <i>y</i> a <i>y </i> krát <i>t</i> na druhou ..t je skalární veličina. Mínus... a tohle je vlastně 2. Tyto dva členy jsou si rovny. Jde pouze o jinou formu téhož a již jsme nahlédli, že skalární součin je asociativní. Proto je toto rovno dvěma... krát skalární součin <i>x</i> a <i>y</i> krát t. Možná bych měl změnit barvu. Takže tyto dva členy lze přepsat jako tento člen. A pak, po přehození dostáváme minus 1 krát minus 1. To se vykrátí, získáme plus a zůstane nám pouze skalární součin dvou x. A tohle chce taky jinou barvou. Třeba oranžovou. Takže tyto členy se nakonec stanou tímto členem. Samozřejmě, tento člen se pak změní takto. Jediné, co jsem udělal, je, že jsem tu věc přepsal a řekl, podívejme... ...toto musí být větší nebo rovno nule. Takže to mohu napsat i zde. Tento výraz je totiž stále stejná věc. Pouze jsem jej přepsal. Takže stále musí být větší nebo roven nule. Nyní proveďme malou substituci, abychom náš výraz trochu vyčistili. Později substituci odstraníme. Označme tento výraz jako <i>a</i>. Tuto část jako <i>b</i>. Takže ta celá věc bude <i>b</i>. <i>t</i> tam ponecháme. A nyní označme tento člen jako <i>c</i>. Skalární součin <i>x</i> a <i>x</i> bude <i>c</i>. Jak bude náš výraz vypadat? Bude to <i>t na druhou</i> minus.. měl bych být opatrný s barvami... <i>b</i> krát <i>t</i> plus <i>c</i>. Samozřejmě víme, že výraz je větší nebo roven nule. Stále jde o stejnou věc jako nahoře, větší nebo rovno nule. Můžu tu napsat <i>p(t)</i>. Takže toto je větší nebo rovno nule pro jakékoliv <i>t</i>, které zde dosadíme. Pro libovolné reálné <i>t</i>, které dosadíme. Dosaďme do naší funkce <i>b</i> lomeno <i>2a</i>. A to mohu bez problému udělat. Protože vím, co je <i>a</i>. Pouze musíme ošetřit dělení nulou. <i>a</i> je tedy skalární součin nějakého vektoru se sebou samým. A předpokládali jsme, že vektor je nenulový. Tudíž, vidíme, že jde o velikost vektoru na druhou. Jde o nenulový vektor, takže některé výrazy budou určitě kladné, když budeme brát jejich velikost. Takže tento člen je určitě nenulový. Jde přece o nenulový vektor. Tedy tento skalární součin násobený dvojkou je stále nenulový. Takže bez problému. Žádné dělení nulou. Ale čemu se to tedy bude rovnat? To se bude rovnat... a zůstaňme u zelené. Zabírá moc času měnit barvy. Takže se to rovná <i>a</i> krát tento výraz na druhou. To je <i>b</i> na druhou lomeno <i>4a</i> na druhou. Umocnil jsem <i>2a</i>, abych dostal 4 (<i>a</i> na druhou). Minus <i>b</i> krát toto. Tedy <i>b</i> krát ... tohle je běžné násobení. <i>b</i> krát <i>b</i> lomeno <i>2a</i>. Zapišme tu běžné násobení. Plus <i>c</i>. A víme, že vše je stále větší nebo rovno nule. Nyní, když výraz zjednodušíme, co dostaneme? No, toto <i>a</i> se vykrátí a zde nám zůstane <i>b</i> na druhou. Takže máme <i>b</i> na druhou lomeno <i>4a</i> mínus <i>b</i> na druhou lomeno <i>2a</i>. To je tenhle výraz. Plus <i>c</i>. Větší nebo rovno nule. A ještě to upravme. Pokud výraz rozšířím dvojkou, co dostaneme? Získáme 2 (<i>b</i> na druhou) lomeno <i>4a</i>. Důvod, proč jsme tuto úpravu provedli, je společný jmenovatel. Takže co dostaneme? Máme <i>b</i> na druhou lomeno <i>4a</i> mínus <i>2</i><i>b</i> na druhou lomeno <i>4a</i>. Takže jak tento výraz zjednodušíme? Čitatel je tedy <i>b</i> na druhou minus <i>2</i>(<i>b</i> na druhou). Zůstane nám minus <i>b</i> na druhou lomeno <i>4a</i> plus <i>c</i> je větší nebo rovno nule. Z těchto dvou členů vznikne jeden. Nyní, když toto přičteme k oběma stranám rovnice, získáme: <i>c</i> je větší nebo rovno <i>b</i> na druhou lomeno <i>4a</i>. Původně to bylo na levé straně záporné. Když to přičtu k oběma stranám, bude to kladné, na pravé straně. Takže jsme dostali něco, co vypadá jako nerovnost. Odstraňme nyní substituci a podívejme se, jak vypadá výraz nyní. Kde mám tu původní substituci? Tady byla. A vlastně, abychom výraz ještě víc zjednodušili, vynásobme obě strany <i>4a</i>. Připomenu, že <i>a</i> je nejenom nenulové, ale také kladné. Toto je druhá mocnina jeho velikosti. A již jsme si ukázali, že velikost libovolného reálného vektoru bude vždy kladná. A důvod, proč se tak snažím dokázat, že <i>a</i> bude kladné je, že pokud vynásobím obě strany nerovnice, nechci, aby se změnila znaménka. Takže vynásobme obě strany rovnice členem <i>a</i>, než odstraníme substituci. Takže získáme <i>4ac</i> je větší nebo rovno <i>b</i> na druhou. To je ono. A stálo to hodně úsilí. Dokázali jsme, že <i>a</i> bude kladné, protože jde o druhou mocninu jeho velikosti. Skalární součin <i>y</i> a <i>y</i> je druhá mocnina velikosti vektoru <i>y</i>, což je kladné číslo, musí být kladná. Pracujeme přece s reálnými vektory. Nyní odstraňme substituci. Takže, <i>4</i> krát <i>a</i>, <i>4</i> krát skalární součin <i>y</i> a <i>y</i>. Skalární součin je... mohl bych to tady napsat. Skalární součin je totéž jako velikost vektoru <i>y</i> na druhou. To je skalární součin. Toto je <i>a</i>. Skalární součin jsem vysvětloval minule. Krát <i>c</i>. <i>c</i> je skalární součin <i>x</i> a <i>x</i>. Tedy, tento skalární součin je totéž jako velikost vektoru <i>x</i>, to celé na druhou. To bylo tedy <i>c</i>. Tedy, <i>4</i> krát <i>a</i> krát <i>c</i> bude větší nebo rovno <i>b</i> na druhou. A cože bylo to <i>b</i>? Tohle bylo <i>b</i>. Takže <i>b</i> na druhou bude dvakrát skalární součin <i>x</i> a <i>y</i>, ten na druhou. Takže jsme došli až sem. Co uděláme dál? Pardon, celé je to na druhou. Celý tenhle člen byl <i>b</i>. Podívejme se, jak to lze dál zjednodušit. Takže dostaneme.... změním barvu. <i>4</i> krát velikost vektoru <i>y</i> na druhou krát velikost vektoru <i>x</i> na druhou, je větší nebo rovno... pokud umocníme tento člen, získáme 4 krát skalární součin <i>x</i> a <i>y</i>. 4 krát skalární součin <i>x</i> a <i>y</i>, krát skalární součin <i>x</i> a <i>y</i>. Anebo, ještě lépe, zapišme to takto. Pišme 4 krát skalární součin <i>x</i> a <i>y</i>, ten na druhou. Nyní můžeme obě strany vydělit čtyřkou. To nijak nezmění nerovnost. To se prostě vyruší. A nyní obě strany rovnice odmocníme. Takže odmocnina je... jde o kladná čísla, takže odmocnina této strany je odmocnina každé jednotlivého členu. To je pouze pravidlo pro počítání s exponenty. Takže když odmocníme obě dvě strany, získáme velikost vektoru <i>y</i> krát velikost vektoru <i>x</i> je větší nebo rovna odmocnině tohoto. A získáme kladnou odmocninu. Kladnou odmocninu na obou stranách rovnice. Takže se nemusíme starat o žádná znaménka nebo tak něco. Takže kladná odmocnina bude absolutní hodnotou skalárního součinu <i>x</i> a <i>y</i>. A musíme být velmi opatrní, abychom mohli prohlásit, že je to absolutní hodnota... protože je možné, že tato věc, tady vpravo je záporná. Ale když to umocníme na druhou, chceme si být jisti, že když člen odmocníme, číslo stále zůstane kladné. Protože v opačném případě bychom museli řešit znaménka. Takže získáme kladnou odmocninu, která bude... když teď vezmeme absolutní hodnotu, budeme si jisti, že máme kladnou hodnotu. Ale to je přesně ono. Absolutní hodnota skalárního součinu našich vektorů je menší nebo rovna součinu velikostí dvou vektorů. Získali jsme Cauchyho-Schwarzovu nerovnost. Nyní se ještě podívejme, co by se stalo, kdyby <i>x</i> byl násobkem vektoru <i>y</i>? V tomto případě, co je absolutní hodnotou? Absolutní hodnotou skalárního součinu vektorů <i>x</i> a <i>y</i>? To se rovná... to se rovná čemu? Když dosadíme, tak dostaneme absolutní hodnotu z <i>c</i> krát <i>y</i>. To je tedy skalární součin <i>x</i> a <i>y</i>, což je díky asociativitě rovno absolutní hodnotě <i>c</i> krát... chceme si být jisti, že díky absolutní hodnotě je vše kladné.... krát skalární součin <i>y</i> a <i>y</i>. Což je rovno právě <i>c</i> krát velikost <i>y</i>... což je velikost <i>y</i> na druhou. Což se tedy rovná velikosti <i>c</i> krát... ...nebo tedy absolutní hodnotě našeho skaláru <i>c</i> krát velikost vektoru <i>y</i>. A to můžeme ještě dále upravit. To si můžete sami dokázat, pokud nevěříte, ale toto... můžeme vložit <i>c</i> dovnitř, do velikosti, což pro vás může být dobré cvičení k dokázání. Ale je to zřejmé. Prostě použijeme definici velikosti. A vynásobíme ji <i>c</i>. Toto je tedy rovno velikosti <i>cy</i> krát... řekněme velikosti <i>cy</i> krát velikost <i>y</i>. Zapomněl jsem značit vektory. A nyní. Toto je <i>x</i>. Takže se to rovná velikosti <i>y</i> krát velikost <i>y</i>. Takže jsem dokázal druhou část Cauchyho-Schwarzovy nerovnosti, že rovnost platí pouze v případě, že jeden z vektorů je násobkem vektoru druhého. Pokud nejsou některé kroky jasné, mohlo by být užitečné zkusit si toto tvrzení skutečně dokázat. Například dokázat, že absolutní hodnota <i>c</i> krát velikost vektoru <i>y</i> je totéž jako velikost <i>c</i> krát <i>y</i>. Každopádně, snad to bylo užitečné. Cauchyho-Schwarzovu nerovnost budeme používat k dokazování dalších tvrzení v lineární algebře. V budoucích videích ukáži, proč tomu tak je, ve vztahu ke skalárnímu součinu.
video