2021
DOI: 10.1007/978-3-030-83527-9_15
|View full text |Cite
|
Sign up to set email alerts
|

New Parallel Corpora of Baltic and Slavic Languages — Assumptions of Corpus Construction

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
1
1

Citation Types

0
1
0
2

Year Published

2021
2021
2023
2023

Publication Types

Select...
4

Relationship

1
3

Authors

Journals

citations
Cited by 4 publications
(3 citation statements)
references
References 4 publications
0
1
0
2
Order By: Relevance
“…Most of the examples were excerpted from internet sources, while other examples were constructed and verified by native speakers. This was necessary as the paper considers many combinations of variables and single sources of data, including corpora (more on the used corpus and corpora in contrastive studies see Duszkin et al, 2021;Koseska, 2014).…”
Section: Resultsmentioning
confidence: 99%
“…Most of the examples were excerpted from internet sources, while other examples were constructed and verified by native speakers. This was necessary as the paper considers many combinations of variables and single sources of data, including corpora (more on the used corpus and corpora in contrastive studies see Duszkin et al, 2021;Koseska, 2014).…”
Section: Resultsmentioning
confidence: 99%
“…Liczba odnotowanych form wołacza w języku litewskim nadal utrzymuje się na podobnie wysokim poziomie, podczas gdy liczba użyć form wołacza w języku polskim znacznie spadła. Szczegółowe wyniki tych badań zostały opisane w oddzielnym artykule (Roszko, Roszko, 2021). W przykładach ( 10)-( 11) wskazujemy na użycie formy mianownikowej w funkcji wołacza w języku polskim.…”
Section: Użycie Form Wołaczaunclassified
“…Najprostszym i najbardziej efektywnym sposobem zastosowania litewskich faktów gramatycznych, jak myślimy, jest rzutowanie jednoznacznie odczytywanych w strukturach języka litewskiego (to jest na płaszczyźnie formalnej) znaczeń na zasoby polskie, ściśle skorelowane z litewskimi w korpusach dwu-i wielojęzycznych. Do testów wybraliśmy najnowsze dwujęzyczne korpusy polsko-litewski i polsko-rosyjski z serii Corpora of Baltic and Slavic Languages (Duszkin, Roszko, Roszko, 2021), których zasoby są ręcznie zrównoleglone oraz automatycznie lematyzowane i tagowane (warstwa fleksyjna i składniowa). Konstrukcją dziesięciu korpusów z przedstawionej serii zajmuje się zespół językoznawców z Instytutu Slawistyki PAN w ramach zadań konsorcjum CLARIN-PL 1 .…”
unclassified