Pokiwy za ekspertowe pytanje
Za komfortne pytanje přihotowane teksty indicěrowachu so a sčinichu přepytajomne z pomocu IMS Open Corpus Workbench (CWB). Hdyž so w pytanskich nastajenjach aktiwěruje ekspertowe pytanje, móža so potajkim tež pytanske wurazy CQL a regularne wurazy wužiwać. Nałožiłe su so sćěhowace tokenowe atributy:
word
- Tokenowa forma, kajkaž jewi so wona w teksće.
lemma
- Lematizowana forma tokena. Pola skrótšenkow, ličbow a wosebitych znamješkow je tuta forma identiska z atributom
word
. Za interpunkciske tokeny njeje přimjetlemma
definowany. Lematizowana twórba njeje powšitkownje disambiguěrowana, wšitke potencielne homonymy naliča so ze znamješkom|
dźělene. norm
- Do tučasneho prawopisa přewjedźena (normalizowana) forma tokena. Za ličby, wosebite znamjenja a interpunkciske tokeny njeje atribut
norm
postajeny. Normalizowana forma njeje powšitkownje disambiguěrowana, wšitke potencielne homonymy naliča so ze znamješkom|
dźělene. name
- Swójske mjeno.
- Móžnej hódnoće stej
;,;1;,;
za apelatiwa a;,;0;,;
za propria (konkretnej formje stej technisce wuměnjenej). toktype
- Typ tokena.
- Móžnej hódnoće stej
;,;w;,;
za słowny token a;,;pc;,;
za interpunkciski token (konkretnej formje stej technisce wuměnjenej). type
- Dalše informacije wo typje tokena.
- Móžnej hódnoće stej
number
za ličby asymbol
za wosebite znamješka, hewak njeje so přimjet definował. foreign
- Njehornjoserbske słowo.
- Móžnej hódnoće stej
;,;0;,;
za hornjoserbske słowo a;,;1;,;
za njehornjoserbske słowo (konkretnej formje stej technisce wuměnjenej).