Statistická nezávislost

Z testwiki
Skočit na navigaci Skočit na vyhledávání
Vrhneme-li zároveň dvě hrací kostky, lze čísla, která padnou, považovat za nezávislá, protože znalost čísla na jedné kostce nic neříká o tom, co padlo na druhé z nich

Nezávislost je základní pojem teorie pravděpodobnosti, matematické statistiky a teorie stochastických procesů. Dva náhodné jevy jsou nezávislé, statisticky nezávislé nebo stochasticky nezávislé,[1] pokud výskyt jednoho nemá vliv na pravděpodobnost výskytu druhého (ekvivalentně řečeno, nemá vliv na šance výskytu druhého jevu). Podobně jsou dvě náhodné veličiny nezávislé, pokud realizace jedné neovlivní rozdělení pravděpodobnosti druhé. Definiční a často využívanou vlastností nezávislých jevů je, že pravděpodobnost jejich společného výskytu se rovná součinu pravděpodobností jejich výskytů. Opakem nezávislosti je statistická závislost, například korelace.

Pokud jde o soubor více než dvou jevů, je třeba rozlišovat slabé a silné pojetí nezávislosti. Jevy se nazývají po dvou nezávislé, pokud jsou jakékoli dva jevy v souboru nezávislé, a nezávislé (nebo kolektivně nezávislé), pokud každý jev je nezávislý na jakékoli kombinaci dalších jevů v souboru. Podobná definice platí pro soubory náhodných proměnných. Z (kolektivní) nezávislosti plyne nezávislost po dvou, ale naopak to neplatí.

Obecnějším konceptem je podmíněná nezávislost, která vyjadřuje, že dva náhodné jevy či veličiny A a B jsou nezávislé ve smyslu pravděpodobností podmíněných třetím náhodným jevem či veličinou Z. To neformálně řečeno znamená, že jakmile máme k dispozici informaci obsaženou v Z, není už další informace A užitečná pro přesnější poznání B ani znalost B nepřidá nic pro pochopení A, i kdyby A a B byly vzájemně závislé.

Příklady

Házení hrací kostkou: Jev, že padne 6 při prvním hodu kostkou a jev padnutí 6 při druhém hodu jsou nezávislé. Naproti tomu jev, že padne 6 při prvním hodu kostkou a jev, že součet čísel zaznamenaných v prvním a druhém pokusu je 8, nejsou nezávislé jevy.

Tahání náhodných karet z promíchaného balíčku: Pokud jsou z balíčku karet vytaženy dvě karty s vracením (první vytažená karta se vrátí do balíčku před tažením druhé karty), jsou jevy vytažení červené karty v prvním pokusu a vytažení červené karty ve druhém pokusu nezávislé. Naproti tomu pokud jsou dvě karty vytaženy bez vracení, událost tažení červené karty v prvním pokusu a událost tažení červené karty ve druhém pokusu nejsou nezávislé, protože po vytažení první červené karty balíček už obsahuje o jednu červenou kartu méně.

Definice

Náhodné jevy

Viz též Pravděpodobnost#Nezávislé jevy.

Dva náhodné jevy A a B jsou nezávislé (zapsáno AB nebo AB) právě tehdy, pokud se pravděpodobnost jejich společného výskytu rovná součinu pravděpodobností jejich výskytů:[2] Šablona:Rp [3] Šablona:Rp

P(AB)=P(A)P(B)

Proč se nezávislost definuje takto, je jasné po přepsání s použitím podmíněných pravděpodobností:

P(AB)=P(A)P(B)P(A)=P(AB)P(B)=P(AB) .

a podobně

P(AB)=P(A)P(B)P(B)=P(BA) .

To znamená, že výskyt B nemá vliv na pravděpodobnost A a naopak. Ačkoli se odvozené výrazy mohou zdát intuitivnější, nejedná se o upřednostňovanou definici, protože podmíněné pravděpodobnosti nemusejí být definované, pokud P(A) nebo P(B) jsou 0. Kromě toho upřednostňovaná definice je zjevně symetrická, takže je z ní vidět, že když A je nezávislý na B, tak B je také nezávislý na A.

P(A)=P(AA)=P(A)P(A)P(A)=0 or P(A)=1 .

Zobecnění na více jevů: Konečná množina jevů {Ai}i=1n je po dvou nezávislá, pokud je každá dvojice jevů nezávislá — to znamená, že pro všechny vzájemně odlišné páry indexů m,k

P(AmAk)=P(Am)P(Ak)

Konečná množina jevů je nezávislá, pokud je každý jev nezávislý na libovolném průniku ostatních jevů[3] Šablona:Rp — to znamená, že pro každé kn a pro každou k -prvkovou podmnožina jevů {Bi}i=1k z {Ai}i=1n platí

P(i=1kBi)=i=1kP(Bi)

Toto se nazývá pravidlo násobení pravděpodobností pro nezávislé jevy. Všimněte si, že nejde o jedinou podmínku zahrnující pouze součin všech pravděpodobností všech jednotlivých jevů; vzorec musí platit pro všechny podmnožiny dané množiny jevů.

Pro více než dva jevy je nezávislá množina jevů (podle definice) také nezávislá po dvou; ale opak nemusí nutně platit.[2]Šablona:Rp

Náhodné veličiny

Dvě reálné náhodné veličiny X a Y jsou nezávislé tehdy a právě tehdy, jsou-li prvky jimi generovaného π systému nezávislé; to znamená, že pro každé x a y jsou jevy {Xx} a {Yy} nezávislé (jak je definováno výše). Z toho plyne, že X a Y s distribučními funkcemi FX(x) a FY(y) jsou nezávislé, pokud kombinovaná náhodná proměnná (X,Y) má kumulativní distribuční funkci[3]Šablona:Rp

FX,Y(x,y)=FX(x)FY(y)x,y,

z čehož plyne, že pokud existují hustoty pravděpodobnosti fX(x) a fY(y) a společná hustota pravděpodobnosti fX,Y(x,y), tak

fX,Y(x,y)=fX(x)fY(y)x,y .

Zobecnění na více než dvě náhodné veličiny: Konečná množina n náhodných veličin {X1,,Xn} je po dvou nezávislá, jestliže je každá dvojice náhodných veličin z této množiny nezávislá.

Konečná množina n náhodných veličin {X1,,Xn} je nezávislá, jestliže pro jakoukoli posloupnost čísel {x1,,xn} jsou jevy {X1x1},,{Xnxn} vzájemně nezávislé (jak je definováno výše). To je ekvivalentní následující podmínce o společné distribuční funkci FX1,,Xn(x1,,xn): množina {X1,,Xn} je nezávislý právě tehdy, když[3]Šablona:Rp

FX1,,Xn(x1,,xn)=FX1(x1)FXn(xn)x1,,xn

Všimněte si, že zde není nutné vyžadovat, aby rozdělení pravděpodobnosti faktorizovalo pro všechny možné podmnožiny k prvků jako v případě pro n jevů. Je to proto, že např. FX1,X2,X3(x1,x2,x3)=FX1(x1)FX2(x2)FX3(x3) totiž implikuje FX1,X3(x1,x3)=FX1(x1)FX3(x3) atp.

Náhodné vektory

Dva reálné náhodné vektory 𝐗=(X1,...,Xm)T a 𝐘=(Y1,...,Yn)T jsou nezávislé, pokud[4]Šablona:Rp

F𝐗,𝐘(𝐱,𝐲)=F𝐗(𝐱)F𝐘(𝐲)𝐱,𝐲,

kde F𝐗(𝐱) a F𝐘(𝐲) jsou distribuční funkce 𝐗 a 𝐘 a F𝐗,𝐘(𝐱,𝐲) označuje jejich společnou distribuční funkci. Nezávislost 𝐗 a 𝐘 se často označuje 𝐗𝐘 . Rozepsáno po komponentách:

FX1,,Xm,Y1,,Yn(x1,,xm,y1,,yn)=FX1,,Xm(x1,,xm)FY1,,Yn(y1,,yn)x1,,xm,y1,,yn .

Stochastické procesy

Definici nezávislosti lze rozšířit z náhodných vektorů na stochastické procesy. Nezávislý stochastický proces je takový, u kterého náhodné veličiny získané jeho vzorkováním v libovolných n časových okamžicích t1,,tn (pro libovolné přirozené n) jsou nezávislé náhodné veličiny.[5]Šablona:Rp

Formálně zapsáno se stochastický proces {Xt}t𝒯 nazývá nezávislý, právě když pro všechna n a pro všechny t1,,tn𝒯

FXt1,,Xtn(x1,,xn)=FXt1(x1)FXtn(xn)x1,,xn,

kde FXt1,,Xtn(x1,,xn)=P(X(t1)x1,,X(tn)xn) . Nezávislost stochastického procesu je jeho vnitřní vlastnost, nikoli vztah mezi dvěma různými stochastickými procesy.

Vzájemná nezávislost dvou stochastických procesů je vztah mezi dvěma stochastickými procesy {Xt}t𝒯 a {Yt}t𝒯 definovanými na stejném pravděpodobnostním prostoru (Ω,,P). Formálně dva stochastické procesy {Xt}t𝒯 a {Yt}t𝒯 jsou považovány za nezávislé, pokud pro všechna n a pro všechny t1,,tn𝒯 jsou náhodné vektory (X(t1),,X(tn)) a (Y(t1),,Y(tn)) navzájem nezávislé,[6]Šablona:Rp tj. pokud

FXt1,,Xtn,Yt1,,Ytn(x1,,xn,y1,,yn)=FXt1,,Xtn(x1,,xn)FYt1,,Ytn(y1,,yn)x1,,xn
P(X=x|Y=y,Z=z)=P(X=x|Z=z)

Vlastnosti

Nezávislost na sobě samém

Všimněte si, že jev je na sobě nezávislý právě tehdy, když

P(Xx,Yy|Z=z)=P(Xx|Z=z)P(Yy|Z=z)

Jev je tedy na sobě nezávislý, právě když k němu skoro jistě dojde nebo skoro jistě nedojde (dojde k jeho doplňku); tato skutečnost je užitečná při dokazování různých vět, které tvrdí, že nějaký jev má buď pravděpodobnost jedna nebo nula, nic mezi (anglicky tzv. zero-one laws).

Střední hodnota a kovariance

Pokud X a Y jsou nezávislé náhodné veličiny, pak operátor střední hodnoty E má vlastnost

E[XY]=E[X]E[Y],

a kovariance cov[X,Y] je nula, jak vyplývá z

cov[X,Y]=E[XY]E[X]E[Y] .

Opačné tvrzení neplatí: pokud dvě náhodné proměnné mají kovarianci 0, stále nemusejí být nezávislé.

Podobně pro dva stochastické procesy {Xt}t𝒯 a {Yt}t𝒯 : Pokud jsou nezávislé, pak jsou nekorelované.[7]Šablona:Rp

Charakteristická funkce

Dvě náhodné proměnné X a Y jsou nezávislé právě tehdy, pokud charakteristická funkce náhodného vektoru (X,Y) splňuje

φ(X,Y)(t,s)=φX(t)φY(s) .

Konkrétně charakteristická funkce jejich součtu je produktem jejich marginálních charakteristických funkcí:

φX+Y(t)=φX(t)φY(t),

ačkoli obrácená implikace neplatí.

Testování nezávislosti

Častou úlohou v matematické statistice je testování hypotézy, že naměřené veličiny jsou vzájemně nezávislé. Pro nominální znaky se k tomu účelu používá test nezávislosti nominálních znaků, jeden z rodiny chí kvadrátových testů. Pro znaky vyšších typů se obvykle používá testování nulovosti korelačních koeficientů (typicky Spearmanovy či Pearsonovy korelační koeficienty), i když je nutno mít na paměti, že nekorelovanost je nutným, ale nikoli dostatečným předpokladem stochastické nezávislosti, takže se může stát, že veličiny jsou nekorelované, ale přitom vzájemně závislé.

Podmíněná nezávislost

Pro jevy je podmíněná nezávislost definována takto: Jevy A a B jsou podmíněně nezávislé vzhledem k jevu C, když

P(ABC)=P(AC)P(BC) .

Pro náhodné veličiny je definice podobná. Neformálně řečeno jsou dvě náhodné veličiny X a Y podmíněně nezávislé vzhledem k Z, pokud platí, že jakmile je známa hodnota Z, tak Y už nepřidá žádné další informace o X . Například dvě měření X a Y stejné hodnoty Z nejsou nezávislé, ale jsou podmíněně nezávislé vzhledem k Z (pokud chyby v obou měřeních nejsou nějakým způsobem spojeny).

Formální definice podmíněné nezávislosti je založena na myšlence podmíněného rozdělení Pokud X, Y a Z jsou diskrétní náhodné veličiny, pak definujeme X a Y jako podmíněně nezávislé vzhledem k Z, pokud

P(Xx,Yy|Z=z)=P(Xx|Z=z)P(Yy|Z=z)

pro všechny x, y a z takové, že P(Z=z)>0. Dále pokud jsou náhodné proměnné spojité a mají společnou funkci hustoty pravděpodobnosti fXYZ(x,y,z), pak X a Y jsou podmíněně nezávislé vzhledem k Z, pokud

fXY|Z(x,y|z)=fX|Z(x|z)fY|Z(y|z)

pro všechna reálná čísla x, y a z taková, že fZ(z)>0 .

Je-li diskrétní X a Y jsou podmíněně nezávislé vzhledem k Z, pak

P(X=x|Y=y,Z=z)=P(X=x|Z=z)

pro všechny x, y a z při podmínce P(Z=z)>0. To znamená, že rozdělení X podmíněné Y a Z je stejné jako rozdělení podmíněné jen samotným Z. Podobná rovnice platí pro podmíněné funkce hustoty pravděpodobnosti v spojitém případě.

Nezávislost lze chápat jako zvláštní druh podmíněné nezávislosti, protože na pravděpodobnost lze pohlížet jako na zvláštní případ podmíněné pravděpodobnosti, pokud ji nepodmiňujeme žádným jevem.

Pro statistické testování podmíněné nezávislosti se používají chí-kvadrát testy a testy parciálních korelací.

Příklad podmíněné nezávislosti: Teplota a intenzita osvětlení na nějakém místě bývají korelovány, protože v noci a v zimě je obvykle méně světla a zároveň nižší teplota. Ze znalosti teploty tedy můžeme pomocí regresní analýzy upřesnit odhad intenzity osvětlení a naopak. Kdybychom však k pozorování teploty a intenzity osvětlení přidali ještě údaj o přesném čase, tak se může stát, že znalost teploty již (příliš) nevylepší odhad intenzity osvětlení nad rámec odhadu založeného na čase, takže osvětlení a teplota budou (téměř) statisticky nezávislé podmíněno časem.

Reference

Šablona:Překlad

Externí odkazy

Šablona:Autoritní data