Kullbackova nerovnost

Z testwiki
Verze z 8. 8. 2021, 11:56, kterou vytvořil imported>JAnDbot ({{Autoritní data}}; kosmetické úpravy)
(rozdíl) ← Starší verze | zobrazit aktuální verzi (rozdíl) | Novější verze → (rozdíl)
Skočit na navigaci Skočit na vyhledávání

Kullbackova nerovnost je v teorii informace a statistice spodní mez Kullbackovy–Leiblerovy divergence vyjádřená pomocí poměrové funkce teorie velkých odchylek[1]. Pokud P a Q jsou rozdělení pravděpodobnosti na reálné ose taková, že P je absolutně spojitá funkce vzhledem ke Q (píšeme P<<Q) a jejich první momenty existují, pak

DKL(PQ)ΨQ*(μ'1(P)),

kde ΨQ* je poměrová funkce, tj. konvexní transformace kumulantové vytvořující funkce rozdělení Q, a μ'1(P) je první moment rozdělení P.

Důsledkem Kullbackovy nerovnosti je Cramérova–Raova mez.

Důkaz

Nechť P a Q jsou rozdělení pravděpodobnosti (míry) na reálné ose, jejichž první momenty existují, a P<<Q.

Uvažujme přirozenou rodinu exponenciálních rozdělení rozdělení Q danou vztahem

Qθ(A)=AeθxQ(dx)eθxQ(dx)=1MQ(θ)AeθxQ(dx)

pro každou měřitelnou množinu A, kde MQ je momentová vytvořující funkce rozdělení Q. Přitom Q0=Q. Pak

DKL(PQ)=DKL(PQθ)+suppP(logdQθdQ)dP.

Gibbsova nerovnost říká, že DKL(PQθ)0, z čehož plyne

DKL(PQ)suppP(logdQθdQ)dP=suppP(logeθxMQ(θ))P(dx)

Zjednodušením pravé strany dostáváme pro každé reálné θ, pro něž MQ(θ)<:

DKL(PQ)μ'1(P)θΨQ(θ),

kde μ'1(P) je první moment neboli střední hodnota rozdělení P, a ΨQ=logMQ se nazývá kumulantová vytvořující funkce. Použitím suprema uzavřeme proces konvexní transformace a dostaneme vzorec pro poměrovou funkci:

DKL(PQ)supθ{μ'1(P)θΨQ(θ)}=ΨQ*(μ'1(P)).

Důsledek: Cramérova–Raova mez

Šablona:Podrobně

Použití Kullbackovy nerovnosti

Nechť Xθ je rodina rozdělení pravděpodobnosti na reálné ose indexované reálným parametrem θ vyhovující určitým podmínkám regularity. Pak

limh0DKL(Xθ+hXθ)h2limh0Ψθ*(μθ+h)h2,

kde Ψθ* je konvexní transformace kumulantové vytvořující funkce rozdělení Xθ a μθ+h je prvním momentem Xθ+h.

Levá strana

Postupnými úpravami levé strany dostáváme:

limh0DKL(Xθ+hXθ)h2=limh01h2log(dXθ+hdXθ)dXθ+h=limh01h2log(1(1dXθ+hdXθ))dXθ+h... funkci log(1t) vyjádříme Taylorovým rozvojem =limh01h2[(1dXθdXθ+h)+12(1dXθdXθ+h)2+o((1dXθdXθ+h)2)]dXθ+h=limh01h2[12(1dXθdXθ+h)2]dXθ+h=limh01h2[12(dXθ+hdXθdXθ+h)2]dXθ+h=12X(θ)

což je polovina Fisherovy informace parametru θ.

Pravá strana

Pravou stranu nerovnosti lze upravit takto:

limh0Ψθ*(μθ+h)h2=limh01h2supt{μθ+htΨθ(t)}.

Tohoto suprema je dosaženo pro t=τ, kde první derivace kumulantové vytvořující funkce je Ψ'θ(τ)=μθ+h, přičemž Ψ'θ(0)=μθ,, takže

Ψ'θ(0)=dμθdθlimh0hτ.

Navíc

limh0Ψθ*(μθ+h)h2=12Ψ'θ(0)(dμθdθ)2=12Var(Xθ)(dμθdθ)2.

Dosazení do původní nerovnosti

Máme:

12X(θ)12Var(Xθ)(dμθdθ)2,

což lze upravit na

Var(Xθ)(dμθ/dθ)2X(θ).

Odkazy

Reference

Šablona:Překlad

Související články

Šablona:Autoritní data