Geostatistika

Z testwiki
Skočit na navigaci Skočit na vyhledávání

Geostatistika je obor statistiky, který je zaměřený především na prostorová nebo časoprostorová data. Geostatistika původně vznikla jako nástroj k predikci pravděpodobnosti rozložení ložisek rud pro těžební průmysl. V současné době se uplatňuje v různých disciplínách, jako jsou například ropná geologie, hydrogeologie, hydrologie, meteorologie, oceánografie, geochemie, hutnictví, geografie, lesnictví, ochrana životního prostředí, krajinná ekologie, pedologie a zemědělství. Geostatistika je také využívána v různých oblastech geografie, zejména tam, kde se snaží zachytit a modelovat šíření chorob (epidemiologie), v geomarketingu, vojenském plánování a v rozvoji efektivnějších prostorových sítí. Geostatistické algoritmy jsou začleněny na mnoha dalších místech, včetně geografických informačních systémů (GIS) nebo statistického prostředí a programovacího jazyka R.

Teoretický základ

Geostatistika je úzce spojena se základními interpolačními metodami, jejichž rámec však zdaleka překračuje. Geostatistické metody stojí na statistickém modelu, který je založen na teorii náhodné funkce (či náhodné regionalizané proměnné), kterou využívá k modelování nejistoty spojené s prostorovými odhady a simulacemi.

Řada jednodušších interpolačních metod/algoritmů, jako je metoda vážené inverzní vzdálenosti (IDW), bilineární interpolace a metoda nejbližšího souseda, byly známy již před vznikem geostatistiky. Geostatistika však přesahuje základní interpolační problém tím, že považuje studovaný jev na neznámých souřadnicích za soubor korelovaných náhodných proměnných.

Nechť Šablona:Math je hodnota požadované proměnné na určitém umístění Šablona:Math. Tato hodnota je neznámá (např. teplota, srážky, piezometrická úroveň). Ačkoliv na souřadnicích Šablona:Math existuje hodnota, kterou by bylo možné měřit, tak geostatistika tuto hodnotu považuje za čistě náhodnou, jelikož nebyla naměřena (nebo zatím nebyla naměřena). Nicméně, náhodnost Šablona:Math není úplná, ale je definována kumulativní distribuční funkcí (CDF), která je závislá na určitých informacích, které jsou známy o hodnotě Šablona:Math:

F(𝑧,𝐱)=Prob{Z(𝐱)𝑧informace}.

Obvykle, pokud je hodnota Šablona:Math známa na místech v blízkosti Šablona:Math (nebo v sousedství Šablona:Math), pak je možné tímto okolím omezit i CDF náležící Šablona:Math: pokud je předpokládána vysoká prostorová spojitost, pak Šablona:Math může mít pouze hodnoty podobné těm, které se nacházejí v jeho okolí. Naopak, v případě neexistence prostorové spojitosti může Šablona:Math nabývat libovolné hodnoty. Prostorová spojitost náhodných proměnných je popsána modelem prostorové spojitosti, která může být buď parametrickou funkcí v případě, že vychází z geostatistického variogramu nebo má neparametrickou formu při použití jiných metod, jako je vícenásobná bodová simulace nebo pseudo-genetické techniky.

Při použití jednotného prostorového modelu pro celou oblast, je vycházeno z předpokladu, že Šablona:Math je stacionární proces. To zjednodušeně znamená, že v celé oblasti je možné využít stejné statistické vlastnosti souboru. Několik geostatistických metod poskytuje způsoby uvolňující tento předpoklad stacionarity.

V tomto rámci lze rozlišit dva hlavní cíle modelování:

  1. Odhad hodnoty Šablona:Math, obvykle odhadem střední hodnoty, mediánem nebo modem CDF Šablona:Math. Toto je obvykle označováno jako problém odhadu.
  2. Vzorkování z celé funkce hustoty pravděpodobnosti Šablona:Math, kde jsou skutečně posuzovány všechny možné alternativy vybraných vzorků na každém místě. Takto obvykle vzniká několik alternativních map odhadů Šablona:Math, tzv. realizace. Uvažujme skupinu rozdělenou do Šablona:Math samostatných uzlů (nebo pixelů). Každá realizace je pak vzorkem úplného Šablona:Math-rozměrného spojení distribuční funkce
F(𝐳,𝐱)=Prob{Z(𝐱1)z1,Z(𝐱2)z2,...,Z(𝐱N)zN}.

V tomto přístupu je tak uznávána přítomnost několika možných řešení interpolace. Každá realizace je považována za možný scénář odhadu reálných hodnot skutečné proměnné vzniklý za dané kombinace podmínek. Všechny související pracovní postupy jsou pak považovány za soubor realizací, a následně za soubor predikcí, které umožňují pravděpodobnostní předpovědi. Z tohoto důvodu je geostatistika často používána pro tvorbu nebo aktualizaci prostorových modelů při řešení inverzních problémů.

Řada metod existuje jak pro geostatistické odhady, tak i pro metody simulací (postup vícenásobných realizací).

Metody

Odhad

Kriging

Kriging je skupina geostatistických technik sloužících k interpolaci hodnot náhodného pole (např. nadmořská výška, z, jako funkce závislá na geografické poloze) v místech, kde nebyl jev měřen či pozorován, z pozorování a měřených hodnot v místech, která jsou poblíž.

Indikátorový kriging

Mnohoindikátorový kriging (MIK) je jedním z posledních zlepšení technik sloužících k modelování ložisek minerálů a modelu blokového odhadu zdrojů, podobně jako ordinary kriging. MIK představuje významný příslib mezi metodami, které umožňují celkové zpřesnění odhadu ložisek minerálů a jejich koncentrace.

Metody simulace

Definice a nástroje

Hlavní odborné časopisy píšící o geostatistice

Vědecké organizace zabývající se geostatistikou

Související programy

  • The R programming language obsahuje přibližně 20 dalších rozšiřujících balíčků věnovaných geostatistice a zhruba 30 věnujících se jiné oblasti prostorové statistiky.
  • D-STEM je software na základě jazyka MATLAB, který je schopný zpracovávat jednorozměrné i vícerozměrné časoprostorové datové soubory. Tento software umožňuje vytvářet dynamické mapy pozorovaných proměnných v geografických regionech.

Související články

Literatura

  1. Armstrong, M and Champigny, N, 1988, A Study on Kriging Small Blocks, CIM Bulletin, Vol 82, No 923
  2. Armstrong, M, 1992, Freedom of Speech? De Geeostatisticis, July, No 14
  3. Champigny, N, 1992, Geostatistics: A tool that works, The Northern Miner, May 18
  4. Clark I, 1979, Practical Geostatistics, Applied Science Publishers, London
  5. David, M, 1977, Geostatistical Ore Reserve Estimation, Elsevier Scientific Publishing Company, Amsterdam
  6. Hald, A, 1952, Statistical Theory with Engineering Applications, John Wiley & Sons, New York
  7. Honarkhah, M and Caers, J, 2010, Stochastic Simulation of Patterns Using Distance-Based Pattern Modeling, Mathematical Geosciences, 42: 487 - 517 (best paper award IAMG 09)
  8. ISO/DIS 11648-1 Statistical aspects of sampling from bulk materials-Part1: General principles
  9. Lipschutz, S, 1968, Theory and Problems of Probability, McCraw-Hill Book Company, New York.
  10. Matheron, G. 1962. Traité de géostatistique appliquée. Tome 1, Editions Technip, Paris, 334 pp.
  11. Matheron, G. 1989. Estimating and choosing, Springer-Verlag, Berlin.
  12. McGrew, J. Chapman, & Monroe, Charles B., 2000. An introduction to statistical problem solving in geography, second edition, McGraw-Hill, New York.
  13. Merks, J W, 1992, Geostatistics or voodoo science, The Northern Miner, May 18
  14. Merks, J W, Abuse of statistics, CIM Bulletin, January 1993, Vol 86, No 966
  15. Myers, Donald E.; "What Is Geostatistics?
  16. Philip, G M and Watson, D F, 1986, Matheronian Geostatistics; Quo Vadis?, Mathematical Geology, Vol 18, No 1
  17. Sharov, A: Quantitative Population Ecology, 1996, https://web.archive.org/web/20020605050231/http://www.ento.vt.edu/~sharov/PopEcol/popecol.html
  18. Shine, J.A., Wakefield, G.I.: A comparison of supervised imagery classification using analyst-chosen and geostatistically-chosen training sets, 1999, https://web.archive.org/web/20020424165227/http://www.geovista.psu.edu/sites/geocomp99/Gc99/044/gc_044.htm
  19. Strahler, A. H., and Strahler A., 2006, Introducing Physical Geography, 4th Ed., Wiley.
  20. Tahmasebi, P., Hezarkhani, A., Sahimi, M., 2012, Multiple-point geostatistical modeling based on the cross-correlation functionsŠablona:Nedostupný zdroj, Computational Geosciences, 16(3):779-79742.
  21. Volk, W, 1980, Applied Statistics for Engineers, Krieger Publishing Company, Huntington, New York.

Externí odkazy

Šablona:Autoritní data