Pokiwy za ekspertowe pytanje
Za komfortne pytanje přihotowane teksty indicěrowachu so a sčinichu přepytajomne z pomocu IMS Open Corpus Workbench (CWB). Hdyž so w pytanskich nastajenjach aktiwěruje ekspertowe pytanje, móža so potajkim tež pytanske wurazy CQL a regularne wurazy wužiwać. Nałožiłe su so sćěhowace tokenowe atributy:
word- Tokenowa forma, kajkaž jewi so wona w teksće.
lemma- Lematizowana forma tokena. Pola skrótšenkow, ličbow a wosebitych znamješkow je tuta forma identiska z atributom
word. Za interpunkciske tokeny njeje přimjetlemmadefinowany. Lematizowana twórba njeje powšitkownje disambiguěrowana, wšitke potencielne homonymy naliča so ze znamješkom|dźělene. norm- Do tučasneho prawopisa přewjedźena (normalizowana) forma tokena. Za ličby, wosebite znamjenja a interpunkciske tokeny njeje atribut
normpostajeny. Normalizowana forma njeje powšitkownje disambiguěrowana, wšitke potencielne homonymy naliča so ze znamješkom|dźělene. name- Swójske mjeno.
- Móžnej hódnoće stej
;,;1;,;za apelatiwa a;,;0;,;za propria (konkretnej formje stej technisce wuměnjenej). toktype- Typ tokena.
- Móžnej hódnoće stej
;,;w;,;za słowny token a;,;pc;,;za interpunkciski token (konkretnej formje stej technisce wuměnjenej). type- Dalše informacije wo typje tokena.
- Móžnej hódnoće stej
numberza ličby asymbolza wosebite znamješka, hewak njeje so přimjet definował. foreign- Njehornjoserbske słowo.
- Móžnej hódnoće stej
;,;0;,;za hornjoserbske słowo a;,;1;,;za njehornjoserbske słowo (konkretnej formje stej technisce wuměnjenej).