Sveicināti!

Latviešu valodas sintaktiski marķētais korpuss (LVTB) tiek viedots no 2010. gada. Korpuss marķēts manuāli, teikumu struktūras modelējot atbilstoši SemTi-Kamola hibrīdajam gramatikas modelim. Korpusu plānots publicēt divos veidos – oriģinālo marķējumu un automātiski veidotu atvasinājumu Universal Dependencies (UD) formātā – atbilstoši UD laidienu grafikam.

Welcome!

Latvian Treebank (LVTB) is in development since 2010. Corpus is annotated manually according to SemTi-Kamols hybrid dependency-constituency grammar model. We plan to release corpuss in two formalisms – both in original SemTi-Kamols-annotated data and automatically derived Universal Dependency (UD) annotations. We plan to do releases twice a year according to UD version schedule.

Jaunākā versija: / Current Version:
LVTB & UD_Latvian-LVTB v2.11

Vaicājami dati (16951 teikumi) / data to query (16951 sentences):

Marķējuma apraksts / annotation documentation:

Vaicājumu valodas PML-TQ apraksts / querry language documentation: EN (ÚFAL)

Iepriekšējās versijas pieejamas šeit. / Version history is available here.

Atbalsts/Acknowledgements