Energie (zpracování signálu)

Z testwiki
Skočit na navigaci Skočit na vyhledávání

Energie signálu v časové oblasti se definuje jako velikost skalárního součinu signálu se sebou samým. Jinými slovy je to integrál nebo suma kvadrátů magnitud (absolutních hodnot) signálu v daném čase. U spojitého signálu x(t) můžeme psát

E=|x,x|=|x(t)|2dt,

kde E je energie signálu x(t) a zobrazení , značí skalární součin.

U diskrétní signálů je energie definována analogicky

E=n=0N1|x[n]|2

Rozpoznávání řeči

Šablona:Upravit část Energie signálu se používá pro krátkodobou analýzu signálu při rozpoznávání mluvčích (jejich identifikace či verifikace) či rozpoznávání slov. Energie je vedle střední hodnoty, rozptylu a výkonu hlavní charakteristikou číslicových signálů. Mezi další patří apriorní charakteristiky posloupnosti slov (např. po písmenu y je velmi pravděpodobné, že dalším písmenem bude souhláska). Každé písmeno – na základě rozboru internetového zpravodajství zpracovaného společností NewtonMedia a Technickou univerzitou v Liberci má svou pravděpodobnost výskytu po předchozím písmenu. Tento jev se využívá u přepisu mluvené řeči do počítače pomocí mikrofonu. Významnou roli zde hraje i výskyt tzv. sykavek – hlásek, pro něž je charakteristické vybočení z pitch frekvence. Ty potom z velké míry ovlivňují i výše uvedený rozptyl. Energii řečového signálu (ve smyslu nespojistého číslicovitého signálu s omezeným počtem vzorků), můžeme považovat za příznak řečového signálu pro použití bayesovského klasifikátoru pro více příznaků při rozpoznávání mluvčích.

Energie
E=i=0N1x[i]2.
Výkon
P=1Ni=0N1x[i]2.

Šablona:Autoritní data