toody Creative Commons License 2018.02.02 0 0 263

Ezt egyszer már szerintem belinkeltem:

Croatian Morphological Lexicon: http://hml.ffzg.hr/hml/?lang=en

 

Csak mostanra sikerült kisilabizálni a használatát. Ha jól értem:

 

  Lemma - ez a címszó/alapkategória (valami ilyesmi, nem vagyok nyelvész...)
  Token - ez meg a generált ragozott alakok = szóalak
  MSD - ez a szóalak jellemzőinek kódolt leírása (morphosyntactic description)
    Ezeket a rövidítéseknek a jelentését ez alapján lehet megfejteni: http://nl.ijs.si/ME/V4/msd/html/msd-hr.html

 

Ha tudom az alapszót, akkor Lemma a beállítás. Utána Submit-ra kattintva kiadja a ragozott alakokat.
Pl.: vrijeme -> vremenom : Ncnsi (= főnév, köznév, semlegesnem, egyes szám, ins. eset)

 

Ha találunk egy szövegben egy szót és nem tudjuk mi az alap, akkor meg a Token-re kell állítani.
Pl.: idete -> ići : Vmip2p (ige, főige, kijelentő mód, jelenidő, második személy, többes szám)