The paper presents a comparison of time expressions translations from Slovak to Bulgarian language using existing BulgarianSlovak/Slovak-Bulgarian electronic text corpora. It uses techniques of concordances and collocations generation from sentence aligned parallel bilingual text corpora to compare semantic content and related translations. The approach is applicable in language teaching and is useful for teaching less resourced languages.
The paper presents results of the application of a statistical approach for Slovak to Bulgarian language machine translation. It uses Information Retrieval inspired search techniques and employs sever alalgorithmic steps of parallel statistical search with query expansion in Slovak-Bulgarian EUROPARL 7 Corpus using the Sketch Engine software and its scoring. The search includes the generation of concordances,collocations, word sketch differences, word sketches, and thesauri of the studied keyword (query) by using a statistical scoring, which is regarded as intermediate (inter-lingual) semantic standard presentation by means of which the studied keyword (from the source language) is mapped together with its possible translation equivalents (onto the target language. The results present the study of adjectival collocabillity in both Slovak and Bulgarian language from the corpus of political speech texts outlining the standard semantic relations based on the evaluation of statistical scoring. Finally, the advantages and shortcomings of the approach are discussed.
Prednesené príspevky v rámci vymedzených tém zahŕňali viaceré oblasti. Zastúpené boli analýzy hovorených a paralelných korpusov, počítačová lexikografia, terminológia, tvorba korpusových nástrojov, databáz, ale aj sémantický, gramatický a štatistický výskum na korpusovej báze.Výsledky výskumu na hovorených korpusoch prezentoval Václav B ř e z i n a ( Filozofická fakulta Aucklandskej univerzity na Novom Zélande) v príspevku "We Only Say We Are Certain When We Are Not": A Corpus-Based Study of Epistemic Stance. Modálne postoje v reči skúmal na materiáli dvoch korpusov hovorenej angličtiny -na hovorenej časti BNC (British National Corpus) a MICASE (Michigan Corpus of Academic Spoken English). Podľa autora je pri medziľudskej komunikácii paradoxom, že o našej istote hovoríme len vtedy, keď si istí nie sme. Jeho analýza štyroch slov must, certain, sure, certainly potvrdzuje toto tvrdenie, to však platí pravdepodobne len vtedy, ak ide o neistotu v intersubjektívnom rozhraní.Svetlana S a v č u k (Vinogradovov inštitút ruského jazyka Ruskej akadémie vied v Moskve) informovala v príspevku Spoken Texts Representation in the Russian National Corpus: Spoken and Accentologic Sub-Corpora o dvoch ruských hovorených subkorpusoch. Vysvetlila spôsob značkovania, štruktúru ruských hovorených korpusov, prepis zvukových záznamov a lingvistické anotácie zozbieraných dát (metatextová, morfologická a sociologická anotácia). Pozornosť venovala aj problémom spojeným s jednotlivými výstavbovými prvkami hovorených korpusov. Pri jazyku s nefixným prízvukom, akým je ruština, zohráva dôle-žitú úlohu práve korpus s označenými prízvukmi, aby mohol používateľ pracovať s rozsiahlym materiálom potrebným na rôzne výskumy akcentologických špecifikácií v ruštine. Jelena G r i š i n a (Inštitút ruského jazyka Ruskej akadémie vied v Moskve; Multimodal Russian Corpus (MURCO): General Structure and User Interface) predstavila časť databázy Ruského národného korpusu -MURCO. Ide o špecifickú databázu zvukových a filmových záznamov a ich prepisov, ktorá zahŕňa najmä filmové dáta z ruského hovoreného korpusu. Ruské hovorené korpusy sú sociolingvisticky, morfologicky, sémanticky, foneticky a akcento-90 versita.com:
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
hi@scite.ai
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.