Hornjoserbski tekstowy korpus

Pokiwy za ekspertowe pytanje

Za komfortne pytanje přihotowane teksty indicěrowachu so a sčinichu přepytajomne z pomocu IMS Open Corpus Workbench (CWB). Hdyž so w pytanskich nastajenjach aktiwěruje ekspertowe pytanje, móža so potajkim tež pytanske wurazy CQL a regularne wurazy wužiwać. Nałožiłe su so sćěhowace tokenowe atributy:

word
Tokenowa forma, kajkaž jewi so wona w teksće.
lemma
Lematizowana forma tokena. Pola skrótšenkow, ličbow a wosebitych znamješkow je tuta forma identiska z atributom word. Za interpunkciske tokeny njeje přimjet lemma definowany. Lematizowana twórba njeje powšitkownje disambiguěrowana, wšitke potencielne homonymy naliča so ze znamješkom | dźělene.
norm
Do tučasneho prawopisa přewjedźena (normalizowana) forma tokena. Za ličby, wosebite znamjenja a interpunkciske tokeny njeje atribut norm postajeny. Normalizowana forma njeje powšitkownje disambiguěrowana, wšitke potencielne homonymy naliča so ze znamješkom | dźělene.
name
Swójske mjeno.
Móžnej hódnoće stej ;,;1;,; za apelatiwa a ;,;0;,; za propria (konkretnej formje stej technisce wuměnjenej).
toktype
Typ tokena.
Móžnej hódnoće stej ;,;w;,; za słowny token a ;,;pc;,; za interpunkciski token (konkretnej formje stej technisce wuměnjenej).
type
Dalše informacije wo typje tokena.
Móžnej hódnoće stej number za ličby a symbol za wosebite znamješka, hewak njeje so přimjet definował.
foreign
Njehornjoserbske słowo.
Móžnej hódnoće stej ;,;0;,; za hornjoserbske słowo a ;,;1;,; za njehornjoserbske słowo (konkretnej formje stej technisce wuměnjenej).