Úplná prostorová náhodnost

Z testwiki
Skočit na navigaci Skočit na vyhledávání

Úplná prostorová náhodnost (anglicky Complete spatial randomness – CSR) popisuje bodový proces, při kterém se bodové události vyskytují v rámci dané sledované oblasti zcela náhodně. CSR je synonymem pro homogenní Poissonův prostorový proces.[1] Takový proces je často modelován pouze jednou proměnnou, tj. hustotou bodů ρ ve vymezené oblasti. Termín úplná prostorová náhodnost je běžně používán v aplikované statistice v rámci zkoumání určitých bodových modelů, zatímco ve většině ostatních statistických kontextech odkazuje na koncept Poissonova prostorového procesu.[1]

Model

Data v podobě sady bodů, nepravidelně rozmístěných v dané oblasti, se vyskytují v mnoha různých kontextech; například jako umístění stromů v lese, ptačích hnízd, jader v tkáni nebo poloha nemocných lidí. Jakýkoliv takový souboru dat nazýváme prostorový bodový model a odkazujeme jím na umístění jako na události, k odlišení od jakýchkoli jiných bodů příslušné oblasti. Hypotéza úplné prostorové náhodnosti prostorového bodového modelu tvrdí, že počet událostí jakékoli oblasti je dán Poissonovým rozdělením o daném průměru při jednotném rozdělení. Události modelu jsou nezávisle a rovnoměrně rozložené v prostoru. Jinými slovy, pro jednotlivé události je stejně pravděpodobné, že se vyskytnou kdekoli a bez vzájemných interakcí.

"Rovnoměrný" se používá ve smyslu stejnoměrného rozdělení pravděpodobnosti v celé studované oblasti, nikoli ve smyslu "rovnoměrného" rozptýlení ve sledované oblasti.[2] Mezi událostmi nedochází k žádným interakcím, jelikož intenzita událostí v rovině se nemění. Předpoklad nezávislosti by byl porušen například v případě, že by existence jedné události buď podnítila, nebo potlačila výskyt jiných událostí v okolí.

Rozdělení

Pravděpodobnost nalezení právě k bodů v oblasti V s hustotou jevu ρ je tedy:

P(k,ρ,V)=(Vρ)ke(Vρ)k!.

Prvním momentem, kterým je průměrný počet bodů v této oblasti, je ρV. Tato hodnota je intuitivní, tak jako Poissonův parametr.

Pravděpodobnost s jakou se v určité radiální vzdálenosti r nachází N-tý soused daného bodu, je:

PN(r)=D(N1)!λNrDN1eλrD,

kde D je počet rozměrů, λ je intenzita daná vztahem λ=ρπD2Γ(D2+1) a Γ je gama funkce, která je faktoriální funkcí, jestliže je jeho argumentem integrál.

Předpokládanou hodnotu PN(r) je možné odvodit pomocí funkce gama, využívající statistické momenty. Prvním momentem je průměrná vzdálenost náhodně rozmístěných bodů v D rozměrech.

Aplikace

Studie CSR je nezbytná pro porovnávání naměřených bodových dat z výzkumných zdrojů. Jako statistická testovací metoda, má testování CSR mnoho aplikací v oblasti společenských věd a v astronomických výzkumech.[3] CSR je standard, na kterému jsou často testovány datové soubory. Zde je zhruba popsán jeden z přístupů testování hypotézy CSR:[4]

  1. Použijte statistiky, které jsou funkcí vzdálenosti každé události od další nejbližší události.
  2. Nejdříve se zaměřte na konkrétní událost a zformulujte metodu testování, zda jsou si událost a další nejbližší událost významně blízké (nebo vzdálené).
  3. Poté vezměte v úvahu všechny události a zformulujte metodu testování, zda je průměrná vzdálenost každé události od další nejbližší události významně krátká (nebo dlouhá).

V případech, kdy je výpočet statistik analyticky obtížný, jsou numerické metody, jako je metoda Monte Carlo, použity k simulaci náhodného procesu s velkým počtem opakování.[4]

Reference

Šablona:Překlad

  1. 1,0 1,1 O. Maimon, L. Rokach, Data Mining and Knowledge Discovery Handbook , Second Edition, Springer 2010, pages 851-852
  2. L. A. Waller, C. A. Gotway, Applied Spatial Statistics for Public Health Data, volume 1 Wiley Chichester, 2004, pages 119–121, 123–127, 137, 139–141, 146–148, 150–151, 157, 203.
  3. Šablona:Cite web
  4. 4,0 4,1 A. Okabe, K. Sugihara, "Spatial Analysis along Networks- Statistical and Computational Methods", volume 1 Wiley Chichester, 2012, pages 135-136

Literatura

Externí odkazy

Šablona:Autoritní data