Násobení matic

Součin matic^[1]^[2] hovorově též maticové násobení (neplést se skalárním násobkem matice) je v matematice zobecnění součinu čísel na matice. Formálně se dá definovat jako binární operace na maticích odpovídajících typů. Využívá se v matematice, fyzice a jejich aplikacích, obvykle pro popis skládání lineárních zobrazení.

Speciálním případem násobení matic je součin matice typu $m \times n$ a vektoru braného jako matice o typu $n \times 1$ (sloupcový vektor). Tento součin lze interpretovat jako aplikaci lineárního zobrazení reprezentovaného transformační maticí na vektor.

Formální definice

Pokud je $𝑨$ matice typu $m \times n$ a $𝑩$ je matice typu $n \times p$ , jejich součin $𝑨 \cdot 𝑩$ je matice typu $m \times p$ definovaná vztahem

(𝑨 \cdot 𝑩)_{i j} = \sum_{k = 1}^{n} a_{i k} b_{k j} = a_{i 1} b_{1 j} + a_{i 2} b_{2 j} + \dots + a_{i n} b_{n j} .

pro všechny prvky výsledné matice indexované $i \in {1, \dots, m}$ a $j \in {1, \dots, p}$ .

Ve většině případů jsou prvky matice čísla, ale mohou to být jakékoli druhy matematických objektů, pro které je definováno sčítání a násobení, které jsou asociativní a takové, že sčítání je komutativní a násobení je distributivní s ohledem na sčítání, typicky prvky nějakého tělesa. Prvky mohou být dokonce samotné matice (bloková matice).

U reálných matic lze prvek v $i$ -tém řádku a $j$ -tém sloupci výsledné matice lze také chápat jako standardní skalární součin vektoru $i$ -tého řádku první matice s vektorem $j$ -tého sloupce druhé matice.

Tečka $\cdot$ se v součinu vynechává a píše se pouze $𝑨 𝑩$ .^[2]

Ukázka výpočtu

Schéma součinu $𝑨 𝑩$ dvou matic $𝑨$ a $𝑩$ .

Součin matic $𝑨 = (\begin{matrix} 1 & 2 & 3 \\ 4 & 5 & 6 \end{matrix})$ a $𝑩 = (\begin{matrix} 1 & 2 \\ 3 & 4 \\ 5 & 6 \end{matrix})$ je

𝑨 𝑩 = (\begin{matrix} (1 \cdot 1 + 2 \cdot 3 + 3 \cdot 5) & (1 \cdot 2 + 2 \cdot 4 + 3 \cdot 6) \\ (4 \cdot 1 + 5 \cdot 3 + 6 \cdot 5) & (4 \cdot 2 + 5 \cdot 4 + 6 \cdot 6) \end{matrix}) = (\begin{matrix} 22 & 28 \\ 49 & 64 \end{matrix})

Prvky matice $𝑨$ zůstávají v řádcích tak, jak jsou, a prvky v matici $𝑩$ se rozmístí opět do levého a pravého sloupce.

Použití

Historicky bylo násobení matic zavedeno pro usnadnění a objasnění výpočtů v lineární algebře. Tento silný vztah mezi maticovým součinem a lineární algebrou zůstává je fundamentální v celé matematice, stejně jako ve fyzice, chemii, inženýrství a informatice.

Soustavy lineárních rovnic

Obecný tvar soustavy lineárních rovnic je

\begin{matrix} a_{11} x_{1} + a_{12} x_{2} + \dots + a_{1 n} x_{n} & = & b_{1} \\ a_{21} x_{1} + a_{22} x_{2} + \dots + a_{2 n} x_{n} & = & b_{2} \\ ⋮ \\ a_{m 1} x_{1} + a_{m 2} x_{2} + \dots + a_{m n} x_{n} & = & b_{m} \end{matrix}

Při použití stejné notace jako výše je zápis soustavy ekvivalentní jednoduché maticové rovnici

𝑨 𝒙 = 𝒃

.

Lineární zobrazení

Pokud má vektorový prostor konečnou bázi, každý z jeho vektorů je jednoznačně reprezentován konečnou posloupností skalárů, nazývanou vektor souřadnic, tvořenou souřadnicemi vektoru vzhledem k bázi. Tyto vektory souřadnic tvoří další vektorový prostor, který je izomorfní původnímu vektorovému prostoru. Vektor souřadnic je běžně zapisován jako sloupcový vektor, což je matice pouze s jedním sloupcem. Sloupcový vektor pak představuje jak souřadnicový vektor, tak i vektor původního vektorového prostoru.

Lineární zobrazení $A$ prostoru dimenze $n$ do vektorového prostoru dimenze $m$ převádí sloupcový vektor

𝒙 = (\begin{matrix} x_{1} \\ x_{2} \\ ⋮ \\ x_{n} \end{matrix})

na sloupcový vektor

𝒚 = A (𝒙) = (\begin{matrix} a_{11} x_{1} + \dots + a_{1 n} x_{n} \\ a_{21} x_{1} + \dots + a_{2 n} x_{n} \\ ⋮ \\ a_{m 1} x_{1} + \dots + a_{m n} x_{n} \end{matrix}) .

Lineární zobrazení $A$ je proto definováno maticí

𝑨 = (\begin{matrix} a_{11} & a_{12} & \dots & a_{1 n} \\ a_{21} & a_{22} & \dots & a_{2 n} \\ ⋮ & ⋮ & ⋱ & ⋮ \\ a_{m 1} & a_{m 2} & \dots & a_{m n} \end{matrix}),

a zobrazuje sloupcový vektor $𝒙$ na maticový součin

𝒚 = 𝑨 𝒙

.

Je-li $B$ další lineární zobrazení z předchozího vektorového prostoru dimenze $m$ , do vektorového prostoru dimenze $p$ , pak jej lze reprezentovat maticí $𝑩$ řádu $p \times m$ . Přímý výpočet ukazuje, že matice složeného zobrazení $B \circ A$ je rovna součinu $𝑩 𝑨$ . Obecný vzorec $(B \circ A) (𝒙) = B (A (𝒙))$ , který definuje složené zobrazení, je jedním z specifických případů asociativity maticového součinu:

(𝑩 𝑨) 𝒙 = 𝑩 (𝑨 𝒙) = 𝑩 𝑨 𝒙 .

Geometrické rotace

Při použití systému kartézských souřadnic v euklidovské rovině je rotace o úhel $α$ kolem počátku (počátek odpovídá nulovému vektoru) lineární zobrazení. Přesněji, $(\begin{matrix} x^{'} \\ y^{'} \end{matrix}) = (\begin{matrix} \cos α & - \sin α \\ \sin α & \cos α \end{matrix}) (\begin{matrix} x \\ y \end{matrix}),$ kde výchozí bod $(x, y)$ i jeho obraz $(x^{'}, y^{'})$ jsou zapsány jako sloupcové vektory.

Složení rotací o úhel $α$ a pak o úhel $β$ odpovídá maticovému součinu $(\begin{matrix} \cos β & - \sin β \\ \sin β & \cos β \end{matrix}) (\begin{matrix} \cos α & - \sin α \\ \sin α & \cos α \end{matrix}) = (\begin{matrix} \cos β \cos α - \sin β \sin α & - \cos β \sin α - \sin β \cos α \\ \sin β \cos α + \cos β \sin α & - \sin β \sin α + \cos β \cos α \end{matrix}) = (\begin{matrix} \cos (α + β) & - \sin (α + β) \\ \sin (α + β) & \cos (α + β) \end{matrix}),$ ve druhé rovnosti jsou použity součtové vzorce. Výsledné složení odpovídá rotaci o úhel $α + β$ , jak lze očekávat.

Skalární součin, bilineární forma a seskvilineární forma

Standardní skalární součin dvou reálných sloupcových vektorů lze zapsat maticovým součinem

𝒙^{𝖳} 𝒚,

kde $𝒙^{𝖳}$ je řádkový vektor získaný pomocí transpozice $𝒙$ . (Výsledná matice $1 \times 1$ je zde ztotožněna se svým jediným prvkem.)

Obecněji lze jakoukoli bilineární formu ve vektorovém prostoru konečného rozměru vyjádřit jako maticový součin

𝒙^{𝖳} 𝑨 𝒚,

a jakoukoliv seskvilineární formu lze vyjádřit jako

𝒙^{𝖧} 𝑨 𝒚,

kde $𝒙^{𝖧}$ je hermitovsky sdružený vektor k vektoru $𝒙$ .

Alokace zdrojů v ekonomii

Jako příklad si představme fiktivní továrnu, která používá 4 druhy surovin $b_{1}, b_{2}, b_{3}, b_{4}$ k výrobě 3 meziproduktů, $m_{1}, m_{2}, m_{3}$ , které se následně používají k výrobě 3 druhů výrobků, $f_{1}, f_{2}, f_{3}$ .

Matice $𝑨 = (\begin{matrix} 1 & 0 & 1 \\ 2 & 1 & 1 \\ 0 & 1 & 1 \\ 1 & 1 & 2 \end{matrix})$ a $𝑩 = (\begin{matrix} 1 & 2 & 1 \\ 2 & 3 & 1 \\ 4 & 2 & 2 \end{matrix})$ udávají množství surovin potřebných pro výrobu meziproduktů, respektive množství meziproduktů potřebných pro výsledné výrobky. Například k výrobě jednoho meziproduktu $m_{1}$ je třeba jedna jednotka suroviny $b_{1}$ , dvě jednotky $b_{2}$ , žádné $b_{3}$ a jedna jednotka $b_{4}$ , což odpovídá prvnímu sloupci matice $𝑨$ .

Součin $𝑨 𝑩 = (\begin{matrix} 5 & 4 & 3 \\ 8 & 9 & 5 \\ 6 & 5 & 3 \\ 11 & 9 & 6 \end{matrix})$ pak přímo udává množství surovin potřebných pro výrobu jednotlivých výrobků. Například prvek v levém dolním rohu $𝑨 𝑩$ je vypočítán jako $1 \cdot 1 + 1 \cdot 2 + 2 \cdot 4 = 11$ , což odpovídá tomu, že $11$ jednotek $b_{4}$ je potřeba k výrobě jednoho výrobku $f_{1}$ . Jmenovitě jedna jednotka $b_{4}$ je třeba pro $m_{1}$ , 2 pro $m_{2}$ a $4$ pro každý ze dvou meziproduktů $m_{3}$ , které jsou potřeba pro jeden kus $f_{1}$ , viz obrázek.

Aby bylo možné vyrobit např. 100 výrobků $f_{1}$ , 80 $f_{2}$ a 60 $f_{3}$ , lze potřebné množství surovin vypočítat jako

(𝑨 𝑩) (\begin{matrix} 100 \\ 80 \\ 60 \end{matrix}) = (\begin{matrix} 1000 \\ 1820 \\ 1180 \\ 2180 \end{matrix}),

tj. $1000$ jednotek $b_{1}$ , $1820$ jednotek $b_{2}$ , $1180$ jednotek $b_{3}$ a $2180$ jednotek $b_{4}$ .Matice součinu $𝑨 𝑩$ může být použita k výpočtu množství surovin i pro jiné počty výrobků.^[3]

Vlastnosti

Rovnosti uvedené v následujících odstavcích platí, pokud mají výsledky operací smysl.

Součin matice $𝑨$ s jednotkovou maticí $𝐈$ zprava i zleva má za výsledek matici $𝑨$ , tj. $𝐈 𝑨 = 𝑨 𝐈 = 𝑨$ .
Maticový součin je asociativní, tedy $𝑨 (𝑩 𝑪) = (𝑨 𝑩) 𝑪$ .
Maticový součin není komutativní, tedy existují příklady matic, pro něž platí $𝑨 𝑩 \neq 𝑩 𝑨$ .
Maticový součin je distributivní vůči sčítání, tj. $𝑨 (𝑩 + 𝑪) = 𝑨 𝑩 + 𝑨 𝑪$ .
Maticový součin je lineární vůči násobení skalárem (typicky reálné nebo komplexní číslo), tj. $𝑨 (c 𝑩) = (c 𝑨) 𝑩 = c (𝑨 𝑩)$ .
Matice vzhledem k součinu mohou být dělitelé nuly, tj. součin dvou nenulových matic může být nulová matice, například

(\begin{matrix} 1 & 1 \\ 2 & 2 \end{matrix}) (\begin{matrix} - 3 \\ 3 \end{matrix}) = (\begin{matrix} 0 \\ 0 \end{matrix})

.

Součin matic $𝑨$ typu $m \times n$ a $𝑩$ typu $n \times p$ lze vyjádřit jako

𝑨 𝑩 = 𝒂_{1} 𝒃_{1}^{𝖳} + 𝒂_{2} 𝒃_{2}^{𝖳} + \dots + 𝒂_{n} 𝒃_{n}^{𝖳}

,
kde

𝒂_{1}, 𝒂_{2}, \dots, 𝒂_{n}

jsou sloupce matice

𝑨

a

𝒃_{1}^{𝖳}, 𝒃_{2}^{𝖳}, \dots, 𝒃_{n}^{𝖳}

řádky matice

𝑩

. (Neboli

𝒃_{1}, 𝒃_{2}, \dots, 𝒃_{n}

jsou sloupce

𝑩^{𝖳}

.) Zde každý sčítanec

𝒂_{i} 𝒃_{i}^{𝖳}

je matice typu

m \times p

, protože sloupcové vektory odpovídají maticím o jednom sloupci.

Transpozice součinu matic je součin transponovaných matic v opačném pořadí, tj. ${(𝑨 𝑩)}^{𝖳} = 𝑩^{𝖳} 𝑨^{𝖳}$
Inverzní matice součinu regulárních matic je součin inverzních matic v opačném pořadí, tj. ${(𝑨 𝑩)}^{- 1} = 𝑩^{- 1} 𝑨^{- 1}$
Hermitovské sdružení (hermitovská transpozice) součinu matic je součin matic hermitovsky sdružených v opačném pořadí, tj. ${(𝑨 𝑩)}^{𝖧} = 𝑩^{𝖧} 𝑨^{𝖧}$
Maticový součin odpovídá skládání lineárních zobrazení, které matice reprezentují.

Součiny čtvercových matic

Mocniny matice

Čtvercovou matici lze umocnit na jakoukoli nezápornou celočíselnou mocninu tím, že ji opakovaně násobíme stejným způsobem jako u běžných čísel, konkrétně

𝑨^{0} = 𝐈,

𝑨^{1} = 𝑨,

𝑨^{k} = \underset{k krát}{\underset{⏟}{𝑨 𝑨 \dots 𝑨}} .

Výpočet $k$ -té mocniny matice potřebuje $k - 1$ maticových součinů, pokud se provádí triviálním algoritmem (opakované násobení). Protože to může být velmi časově náročné, obecně se dává přednost použití umocňování pomocí druhé mocniny, které vyžaduje nejvýše $\log_{2} k$ maticových součinů, a je tedy mnohem efektivnější.

Snadným případem umocňování je diagonální matice. Protože součin diagonálních matic se rovná prostému vynásobení odpovídajících diagonálních prvků dohromady, získáme $k$ -tou mocninu diagonální matice umocněním prvků na diagonále na $k$ -tou:

{(\begin{matrix} a_{11} & 0 & \dots & 0 \\ 0 & a_{22} & \dots & 0 \\ ⋮ & ⋮ & ⋱ & ⋮ \\ 0 & 0 & \dots & a_{n n} \end{matrix})}^{k} = (\begin{matrix} a_{11}^{k} & 0 & \dots & 0 \\ 0 & a_{22}^{k} & \dots & 0 \\ ⋮ & ⋮ & ⋱ & ⋮ \\ 0 & 0 & \dots & a_{n n}^{k} \end{matrix}) .

Regulární a singulární matice

Označme $ℳ_{n} (R)$ množinu čtvercových matic řádu $n$ s prvky z okruhu $R$ , což je v praxi často těleso.

V $ℳ_{n} (R)$ je součin definován pro každou dvojici matic. Toto dělá z $ℳ_{n} (R)$ okruh, který má jednotkovou matici $𝐈$ za neutrální prvek.

Pokud je $n > 1$ , mnoho matic nemá inverzní prvek vůči násobení, např. nulová matice. Pokud inverzní prvek existuje, značí se $𝑨^{- 1}$ a nazývá se inverzní matice k matici $𝑨$ . Splňuje:

𝑨 𝑨^{- 1} = 𝑨^{- 1} 𝑨 = 𝐈 .

Matice, která má inverzi, je regulární matice, někdy též invertibilní matice. Pokud inverzní matici nemá, nazývá se singulární matice.

Součin matic $𝑨 𝑩$ je regulární, právě když je každý z činitelů $𝑨$ i $𝑩$ regulární. V tomto případě platí

(𝑨 𝑩)^{- 1} = 𝑩^{- 1} 𝑨^{- 1} .

Determinant součinu

Determinant součinu čtvercových matic je součin jejich determinantů.

\det (𝑨 𝑩) = \det (𝑩 𝑨) = \det 𝑨 \det 𝑩

.

Tento vztah platí kdykoli je $R$ komutativní okruh, jmenovitě i v tělesech.

Výpočetní složitost

Výpočetní složitost výše popsaného algoritmu je $O (n^{3})$ (počítáme $n^{2}$ čísel; pro každé potřebujeme $2 n - 1$ aritmetických operací). Existují však algoritmy s nižší složitostí vhodné pro matice vyšších řádů. Nejpoužívanější z nich je Strassenův algoritmus se složitostí $O (n^{\log_{2} 7}) \approx O (n^{2.807})$ . Nižší složitost u tohoto algoritmu však získáváme za cenu snížené numerické stability. Asymptoticky nejrychlejší ze známých algoritmů je Coppersmithův-Winogradův algoritmus ( $O (n^{2.376})$ ), který je však použitelný až pro matice tak velkých řádů, že je nelze zpracovávat pomocí současných počítačů^[4].

Teoreticky by se dala složitost ještě snížit, ale nikdy nemůže být menší než $O (n^{2})$ , protože je třeba spočítat $n^{2}$ čísel.

Hledání nejkratší cesty v grafu

Algoritmy pro násobení matic s malou výpočetní složitostí lze využít i pro hledání nejkratší cesty v grafu z každého do každého vrcholu. To má v nejjednodušší podobě složitost $O (n^{3})$ . V tomto případě se však nepoužívá zde popsané násobení matic, ale upravená verze, kde je místo sčítání výběr nejmenšího prvku a místo násobení sčítání, proto nelze použít například Strassenův algoritmus, který využívá operaci odčítání jako inverzní operaci ke sčítání, která k operaci $\min$ není.

Graf lze popsat maticí vzdáleností $𝑨$ . Pokud je pro výpočty operace sčítání dvou čísel definována jako jejich minimum, a místo násobení se použije sčítání, je možno matici nejkratších cest $𝑩$ získat jako ( $𝑨^{n}$ ) kde $n$ je řád matice vzdáleností. Při reálném výpočtu není třeba cyklicky násobit původní maticí, ale vždy se vynásobí vzniklé výsledky - nejkratší cesty jsou získány po $\log_{2} (n)$ násobeních. Je-li použit pro násobení algoritmus se složitostí menší než $O (\frac{n^{3}}{\log_{2} (n)})$ , složitost hledání cest se tímto postupem sníží.

Odkazy

Reference

Šablona:Překlad

↑ Šablona:Citace monografie
↑ ^2,0 ^2,1 Šablona:Citace normy
↑ Šablona:Cite book Zde: příklad 5.4.10, s.205-206
↑ Robinson, Sara (2005), "Toward an Optimal Algorithm for Matrix Multiplication Šablona:Wayback", SIAM News 38 (9), http://www.siam.org/pdf/news/174.pdf Šablona:Wayback

Literatura

Související články

Externí odkazy

Šablona:Commonscat
Lineární algebra: algebra matic Šablona:Wayback Aplikace, která násobí a sčítá matice zadané uživatelem a zobrazuje postup výpočtu.

Šablona:Autoritní data

Šablona:Portály

[1] Šablona:Citace monografie

[norma-2] 2,0 ^2,1 Šablona:Citace normy

[3] Šablona:Cite book Zde: příklad 5.4.10, s.205-206

[rob2005-4] Robinson, Sara (2005), "Toward an Optimal Algorithm for Matrix Multiplication Šablona:Wayback", SIAM News 38 (9), http://www.siam.org/pdf/news/174.pdf Šablona:Wayback

[1]

[2]

[3]

[4]

Násobení matic

Obsah

Formální definice

Ukázka výpočtu

Použití

Soustavy lineárních rovnic

Lineární zobrazení

Geometrické rotace

Skalární součin, bilineární forma a seskvilineární forma

Alokace zdrojů v ekonomii

Vlastnosti

Součiny čtvercových matic

Mocniny matice

Regulární a singulární matice

Determinant součinu

Výpočetní složitost

Hledání nejkratší cesty v grafu

Odkazy

Reference

Literatura

Související články

Externí odkazy

Navigační menu

Násobení matic

Formální definice

Ukázka výpočtu

Použití

Soustavy lineárních rovnic

Lineární zobrazení

Geometrické rotace

Skalární součin, bilineární forma a seskvilineární forma

Alokace zdrojů v ekonomii

Vlastnosti

Součiny čtvercových matic

Mocniny matice

Regulární a singulární matice

Determinant součinu

Výpočetní složitost

Hledání nejkratší cesty v grafu

Odkazy

Reference

Literatura

Související články

Externí odkazy

Navigační menu

Hledat