2021
DOI: 10.1177/1460458221989392
|View full text |Cite
|
Sign up to set email alerts
|

Building a specialized lexicon for breast cancer clinical trial subject eligibility analysis

Abstract: A natural language processing (NLP) application requires sophisticated lexical resources to support its processing goals. Different solutions, such as dictionary lookup and MetaMap, have been proposed in the healthcare informatics literature to identify disease terms with more than one word (multi-gram disease named entities). Although a lot of work has been done in the identification of protein- and gene-named entities in the biomedical field, not much research has been done on the recognition and resolution … Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
1
1
1
1

Citation Types

0
6
0
3

Year Published

2022
2022
2024
2024

Publication Types

Select...
5
1
1

Relationship

0
7

Authors

Journals

citations
Cited by 7 publications
(9 citation statements)
references
References 41 publications
0
6
0
3
Order By: Relevance
“…Avaliac ¸ão dos l éxicos de sentimento financeiro na classificac ¸ão de tweets no conjunto de dados relacionados ao Mercado Financeiro Brasileiro (em %, melhores valores em negrito). Todas as variac ¸ões do léxico foram comparadas com uma abordagem de préprocessamento dos termos, onde as palavras tanto no dicionário proposto quanto nos tweets a serem classificados foram lematizadas, reduzindo-as ao seu lema raiz [Jung et al 2021]. O melhor resultado foi obtido na proposta S+S/A+PMI (lematizado), com F1-Score de 71,5%, e uma precisão de 71,8%.…”
Section: Resultados E Discussõesunclassified
See 2 more Smart Citations
“…Avaliac ¸ão dos l éxicos de sentimento financeiro na classificac ¸ão de tweets no conjunto de dados relacionados ao Mercado Financeiro Brasileiro (em %, melhores valores em negrito). Todas as variac ¸ões do léxico foram comparadas com uma abordagem de préprocessamento dos termos, onde as palavras tanto no dicionário proposto quanto nos tweets a serem classificados foram lematizadas, reduzindo-as ao seu lema raiz [Jung et al 2021]. O melhor resultado foi obtido na proposta S+S/A+PMI (lematizado), com F1-Score de 71,5%, e uma precisão de 71,8%.…”
Section: Resultados E Discussõesunclassified
“…A abordagem lexical é um recurso presente em várias atividades de processamento de linguagem natural, como análise de sentimentos, classificac ¸ão de textos, recuperac ¸ão de opinião e identificac ¸ão de temas, entre outras. Quando elaborados de forma adequada, os léxicos podem fornecer uma boa capacidade de classificac ¸ão, além de poderem ser utilizados como recursos adicionais aos modelos de aprendizagem de máquina [Oliveira et al 2016] Detectar subjetividades em sentenc ¸as e classificálas em uma classe é um desafio, especialmente em domínios específicos, como o mercado de ac ¸ões [Das et al 2022], doenc ¸as [Jung et al 2021], documentos jurídicos [Smywiński-Pohl et al 2019] e outros que exigem corpora especializado.…”
Section: Trabalhos Relacionadosunclassified
See 1 more Smart Citation
“…Cancer-related terms were extracted from users' Reddit posts using Cancer.org's glossary of 943 words, which is one of the resources used by Jung and collab. 31 to build a breast cancer lexicon. Similarly, the words related to suicide from Sawhney and collab.…”
Section: Reddit Discourse Analysismentioning
confidence: 99%
“…history and physical exam) [25,26] , operative reports [3,27], pathology reports [28][29][30][31][32] and imaging reports [33][34][35][36][37][38][39] to analyze outcomes: response [21,[40][41][42], toxicity [43][44][45]and survival [33,46]. Natural Language Processing (NLP) has grown considerably in medicine to be employed for documentation [47,48], outcome prediction [1,27,43,49], phenotyping [50,51], data extraction [17,28,49,[52][53][54][55][56] and analysis, clinical trial eligibility [41,57,58], exploration of literature [51,59,60], evaluating impact on workload and recruitment with active parallel growth in the seconda...…”
Section: Introductionmentioning
confidence: 99%