Proceedings of the 32nd Annual Meeting on Association for Computational Linguistics - 1994
DOI: 10.3115/981732.981784
|View full text |Cite
|
Sign up to set email alerts
|

Automatic alignment in parallel corpora

Abstract: This paper addresses the alignment issue in the framework of exploitation of large bimultilingual corpora for translation purposes. A generic alignment scheme is proposed that can meet varying requirements of different applications. Depending on the level at which alignment is sought, appropriate surface linguistic information is invoked coupled with information about possible unit delimiters. Each text unit (sentence, clause or phrase) is represented by the sum of its content tags. The results are then fed in… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
2
1
1

Citation Types

0
8
0
7

Year Published

1995
1995
2014
2014

Publication Types

Select...
3
2
2

Relationship

1
6

Authors

Journals

citations
Cited by 21 publications
(15 citation statements)
references
References 5 publications
0
8
0
7
Order By: Relevance
“…Nela, assume-se X AB = {x 1 , x 2 , ..., x m } e Y AB = {y 1 , y 2 , ..., y n }, com x i = (x a,i , x b,i ) e y j = (y a,j , y b,j ), e têm-se X' AB = união i (x a,i X x b,i ) e Y' AB = união j (y a,j X y b,j ), onde "união"é a operação de união utilizada em teoria dos conjuntos. (Papageorgiou et al, 1994;Piperidis et al, 2000 A restrição quanto ao domínio do conhecimento de onde proviria esse corpus foi resultado da opção pela seleção de textos de um domínio específico. De acordo com a literatura consultada, esse é um critério a ser adotado quando a construção do corpus representa um estágio do desenvolvimento de um produto ou da busca de um objetivo de pesquisa, o caso desse trabalho (Renouf, 1987;Sinclair, 1991apud Martins et al, 2001 Tabela 1: Quantidade de palavras e sentenças nos corpora autêntico e pré-editado (Martins et al, 2001).…”
Section: Há Tempos Essa Superação Constitui Objeto De Interesse De Umunclassified
See 3 more Smart Citations
“…Nela, assume-se X AB = {x 1 , x 2 , ..., x m } e Y AB = {y 1 , y 2 , ..., y n }, com x i = (x a,i , x b,i ) e y j = (y a,j , y b,j ), e têm-se X' AB = união i (x a,i X x b,i ) e Y' AB = união j (y a,j X y b,j ), onde "união"é a operação de união utilizada em teoria dos conjuntos. (Papageorgiou et al, 1994;Piperidis et al, 2000 A restrição quanto ao domínio do conhecimento de onde proviria esse corpus foi resultado da opção pela seleção de textos de um domínio específico. De acordo com a literatura consultada, esse é um critério a ser adotado quando a construção do corpus representa um estágio do desenvolvimento de um produto ou da busca de um objetivo de pesquisa, o caso desse trabalho (Renouf, 1987;Sinclair, 1991apud Martins et al, 2001 Tabela 1: Quantidade de palavras e sentenças nos corpora autêntico e pré-editado (Martins et al, 2001).…”
Section: Há Tempos Essa Superação Constitui Objeto De Interesse De Umunclassified
“…Mesmo assim, os métodos lingüísticos são muito importantes para o projeto PESA e por isso um deles foi escolhido como representante desta classe: o método lingüístico apresentado em (Papageorgiou et al, 1994;Piperidis et al, 2000). Este método, referenciado no restante deste texto como simplesmente "método lingüístico", utiliza a etiquetação morfológica das línguas envolvidas como recurso para o alinhamento dos textos paralelos.…”
Section: Métodos Lingüísticos De Alinhamento Sentencialunclassified
See 2 more Smart Citations
“…Tais alinhamentos podem fazer uso de informações como o número de substantivos, verbos, advérbios e adjetivos presentes nas duas unidades textuais. (por exemplo, Papageorgiou et al, 1994;Piperidis et al, 2000). Esses alinhamentos utilizam recursos dependentes de língua, que são de difícil construção, além de requererem muito conhecimento das duas línguas envolvidas.…”
Section: História Do Alinhamentounclassified