Sveicināti!

Latviešu valodas sintaktiski marķētais korpuss (LVTB) tiek viedots no 2010. gada. Korpuss marķēts manuāli, teikumu struktūras modelējot atbilstoši LVTB hibrīdajam gramatikas modelim. Korpusu plānots publicēt divos veidos – oriģinālo marķējumu un automātiski veidotu atvasinājumu Universal Dependencies (UD) formātā – atbilstoši UD laidienu grafikam.

Welcome!

Latvian Treebank (LVTB) is in development since 2010. Corpus is annotated manually according to LVTB hybrid dependency-constituency grammar model. We plan to release corpuss in two formalisms – both in original hybridmodel-annotated data and automatically derived Universal Dependency (UD) annotations. We plan to do releases twice a year according to UD version schedule.

Jaunākā versija: / Current Version:
LVTB & UD_Latvian-LVTB v2.15

19367
teikumi / sentences
LVTB gramatikas modelī /
in LVTB grammar model
UD gramatikas modelī /
in UD grammar model
Vaicājami dati /
data to query
LINDAT CLARIN-CZ LINDAT CLARIN-CZ
Lejuplādes /
downloads
CLARIN-LV LINDAT CLARIN-CZ

Marķējuma apraksts / annotation documentation:

Paraugdati / Sample dummy data: LVTB, UD.

Vaicājumu valodas PML-TQ apraksts / querry language documentation:

Iepriekšējās versijas pieejamas šeit. / Version history is available here.

Atbalsts/Acknowledgements