Gramova–Schmidtova ortogonalizace

Z testwiki
Skočit na navigaci Skočit na vyhledávání

Šablona:Upravit Gramův-Schmidtův proces neboli Gramova-Schmidtova ortogonalizace (nesprávně[1] Gram-Schmidtova ortogonalizace) je metoda, která v daném unitárním prostoru (neboli vektorovém prostoru se skalárním součinem) umožňuje pro zadanou konečnou množinu vektorů nalézt ortonormální bázi podprostoru jimi generovaného.

Algoritmus

Uvažujme pro jednoduchost m reálný lineární vektorový prostor sloupcových vektorů o m složkách (se standardním skalárním součinem). Nechť a1,,anm jsou, opět pro jednoduchost, lineárně nezávislé, tedy nm. Úkolem je nalézt ortonormální bázi q1,,qn n-rozměrného podprostoru m, který vektory ai generují; má tedy platit

span{a1,,an}=span{q1,,qn},qk,qj=qjTqk=δk,j

kde span značí lineární obal množiny v závorce.

Algoritmus danou sadu vektorů prochází postupně přičemž v každém kroku vygeneruje nový vektor hledané báze. Omezíme-li se pouze na první vektor, a protože požadujeme aby q1=1, musí platit

a1=q1r1,1,kder1,1=a12,

a dostáváme vztah pro výpočet prvního vektoru ortonormální báze q1=a1/a12. Protože a2 je lineárně nezávislý na a1 a tedy i na q1, můžeme ho vyjádřit jako

a2=q1r1,2+q2r2,2,

kde q2 je nějaký nový vektor takový, že q1Tq2=0,q22=1. Po pronásobení předchozího vztahu q1T zleva,

q1Ta2=q1Tq1r1,2+q1Tq2r2,2=r1,2

(připomeňme, že q1Tq1=q122=1), dostaneme vztah pro výpočet r1,2 (ortogonalizační koeficient; tj. velikost projekce a2 do směru q1). Protože známe a2,q1,r1,2 dostáváme

a2q1r1,2=q2r2,2,kder2,2=a2q1r1,22

je norma zbytku vektoru a2 po ortogonalizaci proti q1. Všimněme si, že po dosazení za r1,2 dostáváme

a2q1q1Ta2=(Imq1q1T)a2=q2r2,2,kde matice(Imq1q1T)

není nic jiného, než ortogonální projektor do ortogonálního doplňku span{q1} lineárního obalu vektoru q1 v m.

Tento postup lze zřejmě opakovat do vyčerpání všech vektorů ak.

Algoritmicky zapsáno:

00: vstup a1,,an
01: r1,1:=a12
02: q1:=a1/r1,1
03: for k:=2,,n
04:     p:=ak
05:     for j:=1,,k1
06:        rj,k:=qjTp=p,qj
07:     end
08:     for j:=1,,k1
09:        p:=pqjrj,k
10:     end
11:     rk,k:=p2
12:     qk:=p/rk,k
13: end

Tato varianta algoritmu se nazývá klasický Gramův-Schmidtův algoritmus (CGS) a je novější než varianta původní, dnes zvaná modifikovaný Gramův-Schmidtův algoritmus (MGS). MGS získáme z výše popsaného CGS prostým vypuštěním řádků 07 a 08, tedy, spojením obou vnitřních cyklů.

Varianty algoritmu a jejich chování

Oba algoritmy CGS i MGS jsou matematicky ekvivalentní, jejich reálné implementace mají výrazně odlišné chování.

CGS algoritmus je výrazně paralelní. Výpočet první vnitřní smyčky (tj. výpočet koeficientů rj,k) lze provádět nezávisle pro jednotlivá j; tedy, jednotlivá rj,k mohu počítat na různých procesorech, jejich výpočet se neovlivňuje, nezávisí na sobe a může probíhat paralelně. Zatímco MGS je z tohoto pohledu sekvenční.

Na druhou stranu výpočet pomocí MGS je numericky výrazně stabilnější než výpočet pomocí CGS, kde může, vlivem zaokrouhlovacích chyb, dojít k úplné ztrátě ortogonality mezi vektory q1,,qn.

Označíme-li Qk=[q1,,qk]m×k,QkTQk=Ik, lze vztah pro ortogonalizaci vektoru ak+1 psát pomocí projektorů dvěma matematicky ekvivalentními způsoby

p:=(ImQkQkT)ak+1=(ImqkqkT)(Imq2q2T)(Imq1q1T)ak+1.

První projekce odpovídá výpočtu pomocí CGS, druhá postupná výpočtu pomocí MGS. Je zřejmé že CGS ortogonalizace (projekce) se počítá paralelně do všech směrů najednou, kdežto sekvenční ortogonalizace (projekce) MGS umožňuje v j-tém kroku částečně eliminovat chyby vzniklé zaokrouhlováním v předchozích krocích (j1),,2,1.

Řešením v praxi používaným bývá tzv. klasický Gramův-Schmidtův algoritmus s iteračním zpřesněním (ICGS), který obsahuje dvě vnitřní smyčky jako CGS (je tedy paralelizovatelný), ale obě smyčky se provedou dvakrát (čímž se výrazně zlepší numerické vlastnosti, ztráta ortogonality mezi vektory qi je pak dokonce menší než u MGS).

Ztráta ortogonality

Nechť Q^n je matice vektorů spočtených pomocí některé varianty Gramova-Schmidtova algoritmu v počítači se standardní konečnou aritmetikou s plovoucí řádovou čárkou, tj. Q^n=Qn+EnQn a Q^nTQ^nIn. Veličina

Q^nTQ^nIn2

se nazývá ztráta ortogonality a je jednou z klíčových veličin sloužících k posouzení kvality spočtené ortonormální báze.

Uvažujme tzv. Lauchliho matici[2]

A=[11ρ00ρ](n+1)×n,n=20,ρ=107,κ2(A)4.47×107,

kde κ2(A) je podmíněnost matice A. Uvažujeme-li standardní aritmetiku se strojovou přesností ϵM2.22×1016 (double), pak ztráta ortogonality odpovídající jednotlivým výše zmíněným algoritmům aplikovaným na danou Lauchliho matici, je ve druhém sloupci následující tabulky. Ve třetím sloupci je obecný vztah platný pro libovolnou matici A

Algoritmus Ztráta ortogonality (Lauchliho matice) Ztráta ortogonality (obecně)
CGS 2.2×102 κ22(A)ϵM
MGS 2.2×109 κ2(A)ϵM
ICGS 2.4×1016 ϵM

Vztah Gramova-Schmidtova algoritmu a QR rozkladu

Srovnáním sloupcových vektorů ak,qj a koeficientů rj,k do matic,

A=[a1,,an],Q=[q1,,qn]m×n,R=[r1,1r1,2r1,n0r2,2r2,n00rn,n]n×n,

kde QTQ=In a R je čtvercová regulární matice dostáváme

A=QR

tedy QR rozklad matice A (pro ověření stačí porovnat k-tý sloupec rovnosti, tedy ak s k-tým sloupcem součinu QR).

Ortogonální polynomy

Gramův-Schmidtův algoritmus lze aplikovat na prvky libovolného prostoru se skalárním součinem. Uvažujeme například prostor polynomů 𝒫(a,b) se skalárním součinem

p(x),q(x)w=abp(x)q(x)w(x)dx,

kde w(x) je nějaká váhová funkce. Aplikací Gramova-Schmidtova algoritmu na sadu vektorů (polynomů) 1,x,x2,,xn1 (v tomto pořadí) dostáváme, pro vhodně volené a,b a váhovou funkci w(x) libovolnou sadu ortogonálních polynomů (normalizovanou vzhledem k normě indukované daným skalárním součinem).

Pro a=1,b=1,w(x)=1 Gramův-Schmidtův algoritmus generuje Legenderovy polynomy, pro a=1,b=1,w(x)=(1x2)1/2 dostaneme Čebyševovy polynomy prvního druhu, atd.

Reference

Literatura

  • Gene Howard Golub, Charles F. Van Loan: Matrix Computations, Johns Hopkins University Press, 1996 (3rd Ed.). (Zejména kapitoly 5.2.7 CGS, 5.2.8 MGS a 5.2.9 Work and Accuracy.)
  • J. Duintjer Tebbens, I. Hnětynková, M. Plešinger, Z. Strakoš, P. Tichý: Analýza metod pro maticové výpočty, základní metody. Matfyzpress 2012. Šablona:ISBN. (Kapitola 3, Ortogonální transformace a QR rozklady, str. 53-88.)

Šablona:Autoritní data