Metoda maximální věrohodnosti

Z testwiki
Skočit na navigaci Skočit na vyhledávání

Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Jednou z hlavních úloh matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech.

Odhad v kontextu matematické statistiky sestává ze dvou částí

  1. formulace pravděpodobnostního modelu, který popisuje danou reálnou situaci
  2. ověření shody daného modelu se skutečností na základě pozorovaných dat.

Z těchto dat se dále odhadují hodnoty volných parametrů modelu. [1] Metoda maximální věrohodnosti je univerzální metoda pro konstrukci odhadů parametrů.

Definice

Pozorovaná data se uvažují jako soubor stejně rozdělených nezávislých náhodných veličin X1,X2,,Xn s neznámou funkcí hustoty fθ. Dostupnou informací je, že tato funkce náleží do parametrické množiny {gθ,θΘ}, jejíž prvky se liší pouze hodnotou parametru Θ. Jinými slovy existuje hodnota θ0 taková, že fθ=gθ0. Protože hodnota θ0 je neznámá, je potřeba se jí pomocí nějakého odhadu θ^ co nejlépe přiblížit.

Pro soubor stejně rozdělených, nezávislých náhodných veličin platí, že jejich sdruženou hustotu lze faktorizovat (tj. rozdělit na součin hustot jednotlivých rozdělení)

f(X1,X2,,Xn|θ)=f(X1|θ)f(X2|θ)f(Xn|θ)=i=1Nf(Xi|θ)

Chceme-li odhadovat hodnoty θ, pak získáme přepsáním předchozí rovnice vztah pro odhad (θ|.)

(θ|X1,X2,,Xn)=f(X1|θ)f(X2|θ)f(Xn|θ)=i=1Nf(Xi|θ)

Funkci (θ|.) nazýváme věrohodnostní funkce[2].

Velmi často se využívá logaritmus věrohodnostní funkce , tj.

log(θ|X1,X2,,Xn)=i=1Nlogf(Xi|θ)

Jednou z výhod logaritmu je převod součinu na součet, se kterým se v některých případech lépe pracuje.

Jestliže existuje hodnota θ^ taková, že pro všechny možné hodnoty parametru θ platí

(θ|X1,X2,,Xn)(θ^|X1,X2,,Xn)

pak nazveme θ^ maximálním věrohodným odhadem.

Alternativní formulace je

θ^=argmaxθΘ(θ|X1,X2,,Xn)

Příklady

Diskrétní rozdělení

Uvažujme náhodný výběr (X1,X2,X3,X4) z alternativního rozdělení, tj. X nabývá pouze hodnot 0 a 1 a sice s pravděpodobností P(X=1)=p a P(X=0)=1p. Získaná data jsou (0,0,1,0). Úkol je odhadnout hodnotu parametru p, přičemž náš model předpokládá hodnoty buď p = 0,25 nebo p=0,8.

Pro pravděpodobnost pozorovaných dat máme podle alternativního rozdělení:

P(X1=0,X2=0,X3=1,X4=0)=p(1p)3

což je pro p=0,25 rovno 0,1055 a pro p=0,8 rovno 0,0064. Princip maximálního věrohodného odhadu spočívá v tom, že za odhad p vezmeme tu hodnotu, pro kterou je výsledek nejpravděpodobnější, tedy p=0,25[1].

Spojité rozdělení

Uvažujme situaci popsanou normálním rozdělením 𝒩(μ,σ2) s hustotou

f(xμ,σ2)=12π σ exp((xμ)22σ2),

kde parametr σ2 je znám. Pro odhad parametru μ metodou maximální věrohodnosti dostáváme vztah

log(θ|X1,X2,,Xn)=log(i=1N12π σ exp((Xiθ)22σ2))=n2log2πn2logσ212σ2i=1N(Xiθ)2

Pro výpočet maximálního věrohodného odhadu θ^ postačuje pomocí první derivace určit maxima funkce na pravé straně, tj. najít řešení rovnice

log(θ|X1,X2,,Xn)θ=1σ2i=1N(Xiθ)=0

které je

θ^=1nXi=X¯n

tedy výběrový průměr.

Vlastnosti

Statistické odhady lze charakterizovat pomocí několika základních vlastností:

  • Odhad ϕ(x) parametrické funkce g(θ) nazveme nestranný odhad, jestliže odhad není zatížen systematickou chybou, tj. 𝔼θϕ(x)=θ.
  • Odhad ϕn(X1,X2,,Xn) parametrické funkce g(θ) na základě náhodného výběru X1,X2,,Xn nazveme konzistentní odhad, jestliže zvyšováním počtu pozorování lze chybu odhadu udělat libovolně malou, tj. platí Pθ(limnϕn(X1,X2,,Xn)=g(θ))=1.

Přednosti

V některých případech odhadu parametrů založeném na malém počtu pozorování se maximálně věrohodný odhad nechová nestranně, nicméně při splnění mírných předpokladů má řadu důležitých vlastností [3].

  1. Je konzistentní.
  2. Pro dostatečně velká n má přibližně normální rozdělení, tj. pro odhad θ^ a parametr θΘ platí n(θ^θ)d𝒩(0,1(θ)).
    Přičemž se jedná o tzv. konvergenci v distribuci. Veličina (θ) označuje Fisherovu informaci, kterou lze chápat jako míru informace o parametru θ obsažené v jednom pozorování.[1]
  3. Je asymptoticky (pro počet pozorování n) eficientní, tj. odhaduje neznámý parametr nejlepším možným způsobem.
  4. Pro spojité parametrické funkce g(θ) je maximální věrohodný odhad roven g(θ^).

Nedostatky

  • Základní předpoklad pro využití maximálního věrohodnostního odhadu je přesný a správný popis pravděpodobnostního modelu. Je-li tento popis reálné situace nepřesný, pak jsou získané odhady nekonzistentní s pozorovanými daty.
  • Věrohodnostní funkce mohou být na základě zvoleného modelu a neznámých parametrů libovolně komplikované. Důsledkem jsou věrohodnostní rovnice, pro které nemusí existovat analytické řešení a při hledání maxima věrohodnostní funkce je pak nutné použít numerické metody.
  • Přednosti maximálního věrohodnostního odhadu vycházejí z asymptotických vlastností. Pro nízké počty pozorování je tedy vhodnější použít jiné metody odhadu.[3]

Využití

Metoda maximální věrohodnosti má široké využití v matematické statistice, například

  1. při testování hypotéz,
  2. ve faktorové analýze.

Navíc se tato metoda často využívá i v jiných oborech, například

  1. při rozpoznávání objektů v obrazových datech,
  2. v ekonometrii a modelování finančních trhů,
  3. při přesné lokalizaci (pomocí GPS apod.).

Reference

Externí odkazy

Šablona:Autoritní data