Sveicināti!

Latviešu valodas sintaktiski marķētais korpuss (LVTB) tiek viedots no 2010. gada. Korpuss marķēts manuāli, teikumu struktūras modelējot atbilstoši LVTB hibrīdajam gramatikas modelim. Korpusu plānots publicēt divos veidos – oriģinālo marķējumu un automātiski veidotu atvasinājumu Universal Dependencies (UD) formātā – atbilstoši UD laidienu grafikam.

Welcome!

Latvian Treebank (LVTB) is in development since 2010. Corpus is annotated manually according to LVTB hybrid dependency-constituency grammar model. We plan to release corpuss in two formalisms – both in original hybridmodel-annotated data and automatically derived Universal Dependency (UD) annotations. We plan to do releases twice a year according to UD version schedule.

Jaunākā versija: / Current Version:
LVTB & UD_Latvian-LVTB v2.13

Vaicājami dati (18295 teikumi) / data to query (18295 sentences):

Marķējuma apraksts / annotation documentation:

Vaicājumu valodas PML-TQ apraksts / querry language documentation:

Iepriekšējās versijas pieejamas šeit. / Version history is available here.

Atbalsts/Acknowledgements