2018
DOI: 10.3389/fdigh.2018.00002
|View full text |Cite
|
Sign up to set email alerts
|

Ensemble Named Entity Recognition (NER): Evaluating NER Tools in the Identification of Place Names in Historical Corpora

Abstract: The field of Spatial Humanities has advanced substantially in the past years. The identification and extraction of toponyms and spatial information mentioned in historical text collections has allowed its use in innovative ways, making possible the application of spatial analysis and the mapping of these places with geographic information systems. For instance, automated place name identification is possible with Named Entity Recognition (NER) systems. Statistical NER methods based on supervised learning, in p… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
2
1
1
1

Citation Types

0
20
0
6

Year Published

2019
2019
2024
2024

Publication Types

Select...
4
4
1

Relationship

0
9

Authors

Journals

citations
Cited by 48 publications
(30 citation statements)
references
References 46 publications
0
20
0
6
Order By: Relevance
“…Canosa (2017) comparou o desempenho de ferramentas para um corpus em inglês do século XVII atingindo resultados do 68% na medida-F com uma ferramenta estatística treinada em corpora modernos e do 62% com um sistema de regras provisto duma lista específica. Resultados similares, com a melhor medida-F próxima a 70%, foram de novo obtidos na comparativa de cinco ferramentas NERC contemporâneas sobre córpora históricos também do inglês em Won et al (2018). Estes mesmos autores apresentam um experimento novidoso em que se combinam as anotações das distintas ferramentas NERC para escolher o mais provável em caso de divergência, atingindo um 73,3% na medida-F como melhor resultado.…”
Section: Trabalho Relacionadounclassified
See 1 more Smart Citation
“…Canosa (2017) comparou o desempenho de ferramentas para um corpus em inglês do século XVII atingindo resultados do 68% na medida-F com uma ferramenta estatística treinada em corpora modernos e do 62% com um sistema de regras provisto duma lista específica. Resultados similares, com a melhor medida-F próxima a 70%, foram de novo obtidos na comparativa de cinco ferramentas NERC contemporâneas sobre córpora históricos também do inglês em Won et al (2018). Estes mesmos autores apresentam um experimento novidoso em que se combinam as anotações das distintas ferramentas NERC para escolher o mais provável em caso de divergência, atingindo um 73,3% na medida-F como melhor resultado.…”
Section: Trabalho Relacionadounclassified
“…Dado que as ferramentas NERC foram desenvolvidas a partir de corpora contemporâneos (Won et al, 2018), a aplicação em variedades históricas da língua vê comprometido o desempenho em função da divergência a respeito dos usos linguísticos atuais. No caso galegoportuguês medieval, ainda conservando uma estrutura gramatical e regularidade morfológica próximaàs soluções contemporâneas, a dificuldade vem dada pelo grande número de variantes dos topónimos, limitando a aplicabilidade das listas (ex.…”
Section: Introductionunclassified
“…Desde el punto de vista técnico, y relacionado con los reparos metodológicos, los límites del NER con otras lenguas que no sean el inglés, con un corpus del Siglo de Oro, con lugares de la ficción y con variantes toponímicas son evidentes (Bornet y Kaplan 2017;Won et al 2018). El método de agrupación en las visualizaciones no es directamente controlado por el usuario al generar la visualización y la geocalización automatizada tiene también sus límites, sobre todo con la desambiguación, aunque algunos proyectos como Recogito 17 permiten realizarla manualmente.…”
Section: Visualizacionesunclassified
“…El corpus pertenece al género de la novela bizantina (González 1996) o helenizante (Torres 2009), novelas del siglo xvi y xvii con un cronotopo marcado por travesías marítimas, piratas, exotismo, naufragios, encuentros transculturales, etc. Determinante en sus estrategias narrativas es su dependencia de la cartografía histórica.…”
Section: Corpus: Novela Bizantinaunclassified