Násobení matic

Z testwiki
Skočit na navigaci Skočit na vyhledávání
Pro součin matic musí být počet sloupců v první matici roven počtu řádků ve druhé matici. Výsledná matice má počet řádků první matice a počet sloupců druhé matice.

Součin matic[1][2] hovorově též maticové násobení (neplést se skalárním násobkem matice) je v matematice zobecnění součinu čísel na matice. Formálně se dá definovat jako binární operace na maticích odpovídajících typů. Využívá se v matematice, fyzice a jejich aplikacích, obvykle pro popis skládání lineárních zobrazení.

Speciálním případem násobení matic je součin matice typu m×n a vektoru braného jako matice o typu n×1 (sloupcový vektor). Tento součin lze interpretovat jako aplikaci lineárního zobrazení reprezentovaného transformační maticí na vektor.

Formální definice

Pokud je 𝑨 matice typu m×n a 𝑩 je matice typu n×p, jejich součin 𝑨𝑩 je matice typu m×p definovaná vztahem

(𝑨𝑩)ij=k=1naikbkj=ai1b1j+ai2b2j++ainbnj.

pro všechny prvky výsledné matice indexované i{1,,m} a j{1,,p}.

Ve většině případů jsou prvky matice čísla, ale mohou to být jakékoli druhy matematických objektů, pro které je definováno sčítání a násobení, které jsou asociativní a takové, že sčítání je komutativní a násobení je distributivní s ohledem na sčítání, typicky prvky nějakého tělesa. Prvky mohou být dokonce samotné matice (bloková matice).

U reálných matic lze prvek v i-tém řádku a j-tém sloupci výsledné matice lze také chápat jako standardní skalární součin vektoru i-tého řádku první matice s vektorem j-tého sloupce druhé matice.

Tečka se v součinu vynechává a píše se pouze 𝑨𝑩.[2]

Ukázka výpočtu

Schéma součinu 𝑨𝑩 dvou matic 𝑨 a 𝑩.

Součin matic 𝑨=(123456) a 𝑩=(123456) je

𝑨𝑩=((11+23+35)(12+24+36)(41+53+65)(42+54+66))=(22284964)

Prvky matice 𝑨 zůstávají v řádcích tak, jak jsou, a prvky v matici 𝑩 se rozmístí opět do levého a pravého sloupce.

Použití

Historicky bylo násobení matic zavedeno pro usnadnění a objasnění výpočtů v lineární algebře. Tento silný vztah mezi maticovým součinem a lineární algebrou zůstává je fundamentální v celé matematice, stejně jako ve fyzice, chemii, inženýrství a informatice.

Soustavy lineárních rovnic

Obecný tvar soustavy lineárních rovnic je

a11x1+a12x2++a1nxn=b1a21x1+a22x2++a2nxn=b2am1x1+am2x2++amnxn=bm

Při použití stejné notace jako výše je zápis soustavy ekvivalentní jednoduché maticové rovnici

𝑨𝒙=𝒃.

Lineární zobrazení

Pokud má vektorový prostor konečnou bázi, každý z jeho vektorů je jednoznačně reprezentován konečnou posloupností skalárů, nazývanou vektor souřadnic, tvořenou souřadnicemi vektoru vzhledem k bázi. Tyto vektory souřadnic tvoří další vektorový prostor, který je izomorfní původnímu vektorovému prostoru. Vektor souřadnic je běžně zapisován jako sloupcový vektor, což je matice pouze s jedním sloupcem. Sloupcový vektor pak představuje jak souřadnicový vektor, tak i vektor původního vektorového prostoru.

Lineární zobrazení A prostoru dimenze n do vektorového prostoru dimenze m převádí sloupcový vektor

𝒙=(x1x2xn)

na sloupcový vektor

𝒚=A(𝒙)=(a11x1++a1nxna21x1++a2nxnam1x1++amnxn).

Lineární zobrazení A je proto definováno maticí

𝑨=(a11a12a1na21a22a2nam1am2amn),

a zobrazuje sloupcový vektor 𝒙 na maticový součin

𝒚=𝑨𝒙.

Je-li B další lineární zobrazení z předchozího vektorového prostoru dimenze m, do vektorového prostoru dimenze p, pak jej lze reprezentovat maticí 𝑩 řádu p×m. Přímý výpočet ukazuje, že matice složeného zobrazení BA je rovna součinu 𝑩𝑨. Obecný vzorec (BA)(𝒙)=B(A(𝒙)), který definuje složené zobrazení, je jedním z specifických případů asociativity maticového součinu:

(𝑩𝑨)𝒙=𝑩(𝑨𝒙)=𝑩𝑨𝒙.

Geometrické rotace

Při použití systému kartézských souřadnic v euklidovské rovině je rotace o úhel α kolem počátku (počátek odpovídá nulovému vektoru) lineární zobrazení. Přesněji, (xy)=(cosαsinαsinαcosα)(xy), kde výchozí bod (x,y) i jeho obraz (x,y) jsou zapsány jako sloupcové vektory.

Složení rotací o úhel α a pak o úhel β odpovídá maticovému součinu (cosβsinβsinβcosβ)(cosαsinαsinαcosα)=(cosβcosαsinβsinαcosβsinαsinβcosαsinβcosα+cosβsinαsinβsinα+cosβcosα)=(cos(α+β)sin(α+β)sin(α+β)cos(α+β)), ve druhé rovnosti jsou použity součtové vzorce. Výsledné složení odpovídá rotaci o úhel α+β, jak lze očekávat.

Skalární součin, bilineární forma a seskvilineární forma

Standardní skalární součin dvou reálných sloupcových vektorů lze zapsat maticovým součinem

𝒙𝖳𝒚,

kde 𝒙𝖳 je řádkový vektor získaný pomocí transpozice 𝒙. (Výsledná matice 1×1 je zde ztotožněna se svým jediným prvkem.)

Obecněji lze jakoukoli bilineární formu ve vektorovém prostoru konečného rozměru vyjádřit jako maticový součin

𝒙𝖳𝑨𝒚,

a jakoukoliv seskvilineární formu lze vyjádřit jako

𝒙𝖧𝑨𝒚,

kde 𝒙𝖧 je hermitovsky sdružený vektor k vektoru 𝒙.

Alokace zdrojů v ekonomii

Výpočet prvku v levém dolním rohu součinu 𝑨𝑩 odpovídá všem možným cestám (zvýrazněné) od suroviny b4 ke konečnému výrobku f1 v grafu toku výroby.

Jako příklad si představme fiktivní továrnu, která používá 4 druhy surovin b1,b2,b3,b4 k výrobě 3 meziproduktů, m1,m2,m3, které se následně používají k výrobě 3 druhů výrobků, f1,f2,f3.

Matice 𝑨=(101211011112)   a   𝑩=(121231422) udávají množství surovin potřebných pro výrobu meziproduktů, respektive množství meziproduktů potřebných pro výsledné výrobky. Například k výrobě jednoho meziproduktu m1 je třeba jedna jednotka suroviny b1, dvě jednotky b2, žádné b3 a jedna jednotka b4, což odpovídá prvnímu sloupci matice 𝑨.

Součin 𝑨𝑩=(543895 6531196) pak přímo udává množství surovin potřebných pro výrobu jednotlivých výrobků. Například prvek v levém dolním rohu 𝑨𝑩 je vypočítán jako 11+12+24=11, což odpovídá tomu, že 11 jednotek b4 je potřeba k výrobě jednoho výrobku f1. Jmenovitě jedna jednotka b4 je třeba pro m1, 2 pro m2 a 4 pro každý ze dvou meziproduktů m3, které jsou potřeba pro jeden kus f1, viz obrázek.

Aby bylo možné vyrobit např. 100 výrobků f1, 80 f2 a 60 f3, lze potřebné množství surovin vypočítat jako

(𝑨𝑩)(1008060)=(1000182011802180),

tj. 1000 jednotek b1, 1820 jednotek b2, 1180 jednotek b3 a 2180 jednotek b4.Matice součinu 𝑨𝑩 může být použita k výpočtu množství surovin i pro jiné počty výrobků.[3]

Vlastnosti

Rovnosti uvedené v následujících odstavcích platí, pokud mají výsledky operací smysl.

(1122)(33)=(00).
  • Součin matic 𝑨 typu m×n a 𝑩 typu n×p lze vyjádřit jako
𝑨𝑩=𝒂1𝒃1𝖳+𝒂2𝒃2𝖳++𝒂n𝒃n𝖳,
kde 𝒂1,𝒂2,,𝒂n jsou sloupce matice 𝑨 a 𝒃1𝖳,𝒃2𝖳,,𝒃n𝖳 řádky matice 𝑩. (Neboli 𝒃1,𝒃2,,𝒃n jsou sloupce 𝑩𝖳.) Zde každý sčítanec 𝒂i𝒃i𝖳 je matice typu m×p, protože sloupcové vektory odpovídají maticím o jednom sloupci.
  • Transpozice součinu matic je součin transponovaných matic v opačném pořadí, tj. (𝑨𝑩)𝖳=𝑩𝖳𝑨𝖳
  • Inverzní matice součinu regulárních matic je součin inverzních matic v opačném pořadí, tj. (𝑨𝑩)1=𝑩1𝑨1
  • Hermitovské sdružení (hermitovská transpozice) součinu matic je součin matic hermitovsky sdružených v opačném pořadí, tj. (𝑨𝑩)𝖧=𝑩𝖧𝑨𝖧
  • Maticový součin odpovídá skládání lineárních zobrazení, které matice reprezentují.

Součiny čtvercových matic

Mocniny matice

Čtvercovou matici lze umocnit na jakoukoli nezápornou celočíselnou mocninu tím, že ji opakovaně násobíme stejným způsobem jako u běžných čísel, konkrétně

𝑨0=𝐈,
𝑨1=𝑨,
𝑨k=𝑨𝑨𝑨k krát.

Výpočet k-té mocniny matice potřebuje k1 maticových součinů, pokud se provádí triviálním algoritmem (opakované násobení). Protože to může být velmi časově náročné, obecně se dává přednost použití umocňování pomocí druhé mocniny, které vyžaduje nejvýše log2k maticových součinů, a je tedy mnohem efektivnější.

Snadným případem umocňování je diagonální matice. Protože součin diagonálních matic se rovná prostému vynásobení odpovídajících diagonálních prvků dohromady, získáme k-tou mocninu diagonální matice umocněním prvků na diagonále na k-tou:

(a11000a22000ann)k=(a11k000a22k000annk).

Regulární a singulární matice

Označme n(R) množinu čtvercových matic řádu n s prvky z okruhu R, což je v praxi často těleso.

V n(R) je součin definován pro každou dvojici matic. Toto dělá z n(R) okruh, který má jednotkovou matici 𝐈 za neutrální prvek.

Pokud je n>1, mnoho matic nemá inverzní prvek vůči násobení, např. nulová matice. Pokud inverzní prvek existuje, značí se 𝑨1 a nazývá se inverzní matice k matici 𝑨. Splňuje:

𝑨𝑨1=𝑨1𝑨=𝐈.

Matice, která má inverzi, je regulární matice, někdy též invertibilní matice. Pokud inverzní matici nemá, nazývá se singulární matice.

Součin matic 𝑨𝑩 je regulární, právě když je každý z činitelů 𝑨 i 𝑩 regulární. V tomto případě platí

(𝑨𝑩)1=𝑩1𝑨1.

Determinant součinu

Determinant součinu čtvercových matic je součin jejich determinantů.

det(𝑨𝑩)=det(𝑩𝑨)=det𝑨det𝑩.

Tento vztah platí kdykoli je R komutativní okruh, jmenovitě i v tělesech.

Výpočetní složitost

Výpočetní složitost výše popsaného algoritmu je O(n3) (počítáme n2 čísel; pro každé potřebujeme 2n1 aritmetických operací). Existují však algoritmy s nižší složitostí vhodné pro matice vyšších řádů. Nejpoužívanější z nich je Strassenův algoritmus se složitostí O(nlog27)O(n2.807). Nižší složitost u tohoto algoritmu však získáváme za cenu snížené numerické stability. Asymptoticky nejrychlejší ze známých algoritmů je Coppersmithův-Winogradův algoritmus (O(n2.376)), který je však použitelný až pro matice tak velkých řádů, že je nelze zpracovávat pomocí současných počítačů[4].

Teoreticky by se dala složitost ještě snížit, ale nikdy nemůže být menší než O(n2), protože je třeba spočítat n2 čísel.

Hledání nejkratší cesty v grafu

Algoritmy pro násobení matic s malou výpočetní složitostí lze využít i pro hledání nejkratší cesty v grafu z každého do každého vrcholu. To má v nejjednodušší podobě složitost O(n3). V tomto případě se však nepoužívá zde popsané násobení matic, ale upravená verze, kde je místo sčítání výběr nejmenšího prvku a místo násobení sčítání, proto nelze použít například Strassenův algoritmus, který využívá operaci odčítání jako inverzní operaci ke sčítání, která k operaci min není.

Graf lze popsat maticí vzdáleností 𝑨. Pokud je pro výpočty operace sčítání dvou čísel definována jako jejich minimum, a místo násobení se použije sčítání, je možno matici nejkratších cest 𝑩 získat jako (𝑨n) kde n je řád matice vzdáleností. Při reálném výpočtu není třeba cyklicky násobit původní maticí, ale vždy se vynásobí vzniklé výsledky - nejkratší cesty jsou získány po log2(n) násobeních. Je-li použit pro násobení algoritmus se složitostí menší než O(n3log2(n)), složitost hledání cest se tímto postupem sníží.

Odkazy

Reference

Šablona:Překlad

Literatura

Související články

Externí odkazy

Šablona:Autoritní data

Šablona:Portály