Sveicināti!

Latviešu valodas sintaktiski marķētais korpuss (LVTB) tiek viedots no 2010. gada. Korpuss marķēts manuāli, teikumu struktūras modelējot atbilstoši LVTB hibrīdajam gramatikas modelim. Korpuss tiek regulāri publicēts divos veidos: oriģinālajā marķējumā un kā UD_Latvian-LVTB (UDLV-LVTB) – automātiski atvasināts Universal Dependencies (UD) korpuss, daļa no attiecīgās UD versijas. Jaunas korpusa versijas tiek izlaistas divreiz gadā, atbilstoši UD versiju grafikam – maija un novembra vidū.

Welcome!

Latvian Treebank (LVTB) is in development since 2010. Corpus is annotated manually according to LVTB hybrid dependency-constituency grammar model. Corpuss is released regularly in two forms: with the original hybrid annotations and as UD_Latvian-LVTB (UDLV-LVTB)—an automatically derived Universal Dependencies (UD) corpus, part of the corresponding UD version. New versions are relesed twice a year in accodance with UD version schedule—mid-May and mid-November.

Jaunākā versija: / Current Version:
LVTB & UD_Latvian-LVTB v2.18

19580
teikumi / sentences
LVTB gramatikas modelī /
in LVTB grammar model
UD gramatikas modelī /
in UD grammar model
Vaicājami dati /
data to query
LINDAT/CLARIAH-CZ LINDAT/CLARIAH-CZ
Lejuplādes /
downloads
CLARIN-LV LINDAT/CLARIAH-CZ

Marķējuma apraksts / annotation documentation:

Paraugdati / Sample dummy data → LVTB, UD.

Vaicājumu valodas PML-TQ apraksts / querry language documentation:

Iepriekšējās versijas pieejamas šeit. / Version history is available here.

Atbalsts/Acknowledgements