Dvouúrovňová morfologie
Dvouúrovňová morfologie (Šablona:Vjazyce2) je model morfologie přirozených jazyků založený na řetězení morfémů a uplatňování morfologických změn (alternací).Šablona:Sfn Na rozdíl od mnohaúrovňové generativní morfologie pracuje s pouhými dvěma úrovněmiŠablona:Sfn – morfematickou úrovní a s úrovní povrchové reprezentace, kterou může být buď psaná reprezentace (ortografie) nebo výslovnost (fonologie). Model byl původně navržen pro finštinu,Šablona:Sfn ale lze jej použít pro mnoho dalších jazyků včetně češtiny. Umožňuje zachytit nejen flektivní, ale i derivační morfologii jazyka. U jazyků, jejichž pravopis je blízký fonetickému, je použitelná i pro převody mezi psanou podobou jazyka a jeho výslovností.
Dvouúrovňovou morfologii lze technicky realizovat pomocí konečných převodníků (Šablona:Vjazyce2), které lze používat oboucestně – jak pro analýzu, tak pro syntézu (generování). Správně realizovaná dvouúrovňová morfologie může snížit enormní počty vzorů používaných pro ohýbání slov v počítačových morfologiích na hodnoty blízké počtům prezentovaným ve školních mluvnicích.
Vlastnosti
- Metoda pro charakterizaci alternací morfémů při jejich řetězení. Na rozdíl od generativní morfologie předpokládá existenci pouhých dvou úrovní – hloubkové morfologie a její povrchové reprezentace (psané ortografie nebo mluvené fonologické – dvouúrovňovou morfologie lze použít též pro fonologii).
- Převod mezi oběma úrovněmi se provádí pomocí konečných převodníků (Finite State Transducers – FST), což jsou konečné automaty pracující nad abecedou dvojic symbolů (např. grafémů, fonémů), například , kde znamená prázdný symbol, který umožňuje modelovat vznikové a zánikové alternace.Šablona:Sfn Každému elementárnímu morfologickému jevu odpovídá jeden nebo několik málo převodníků. Pro zachycení kompletní morfologie určitého jazyka se jednotlivé převodníky kombinují (spouštějí paralelně).
- Výhodou dvouúrovňové morfologie je její dvoucestnost – lze ji používat pro syntézu i analýzu.Šablona:Sfn
- Dvouúrovňová morfologie je velmi vhodný prostředek pro flektivní a aglutinační jazyky. Pro introflexní jazyky a jazyky, jejichž morfologie používá reduplikaci morfémů by mělo být použitelné její rozšíření.Šablona:Sfn
Mechanické realizace počítačových morfologických analyzátorů nebo generátorů slovních tvarů nezřídka narážejí u jazyků s bohatou morfologií na fakt, že křížením různých fonetických jevů a pravopisných pravidel se tradiční vzory skloňování a časování rozpadají na velké množství podvzorů.Šablona:Sfn Výhodou dvouúrovňové morfologie je, že k nárůstu počtu vzorů z uvedených důvodů nedochází, problémy však způsobuje kolísání některých slov mezi vzory.
Symbolický zápis pravidel
Každý fonetický jev (příp. pravopisné pravidlo) lze v dvouúrovňové morfologii popsat pomocí jednoho nebo několika pravidel, která se oproti zvyklostem obvyklým v matematice píšou zrcadlově obráceně, a mají obecný tvar:
CP op LC - RC
kde
CPje Šablona:Cizojazyčně popisující jádro dané alternace nebo jiného jevu; je zapsáno regulárním výrazem nad abecedou dvojicLC - RCpopisuje v jakém kontextu k uvedenému jevu dochází;-symbolizuje místo výskytu jevu,LCje levý kontext (Šablona:Cizojazyčně),RCje pravý kontext (Šablona:Cizojazyčně), oba se zapisují regulárním výrazem nad abecedou dvojicopje logická spojka, která vyjadřuje podmíněnost příslušného pravidla:<=>– ekvivalence –CPje realizováno právě v kontextuLC - RCa nikde jinde<=– implikace – v kontextuLC - RCje realizovánoCP=>– obrácená implikace –CPje realizováno pouze v kontextuLC - RC/<=– inhibice – v kontextuLC - RCnesmí být realizovánoCP
V zápisu dvojic se používají následující speciální symboly:
=– zastupuje libovolný jeden symbol (foném nebo grafém); v programech se obvykle místo=používá@0– prázdný symbol – používá se pro zápis zánikových nebo vznikových alternací#– symbol hranice slova (začátek nebo konec)
Odkazy
Reference
Literatura
Související články
Externí odkazy
- Dvojúrovňová morfologie – podklady k výuce