2014
DOI: 10.1590/1414-462x201400040017
|View full text |Cite
|
Sign up to set email alerts
|

Determinação de um ponto de corte para a identificação de pares verdadeiros pelo método probabilístico de linkage de base de dados

Abstract: Cad. Saúde Colet., 2014, Rio de Janeiro, 22 (4): 428-36Resumo O objetivo deste estudo foi propor pontos de corte nos escores calculados no processo de linkage probabilístico, para as diversas topografias de câncer. Neste estudo foi utilizada a base de dados do RCBP-SP, composta por 343.306 casos incidentes de câncer do município de São Paulo, registrados no período de 1997 a 2005, com idades que variaram de menos um a 106 anos, de ambos os sexos. Para o linkage probabilístico, realizado no programa Reclink III… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
3
1
1

Citation Types

0
3
0
5

Year Published

2016
2016
2022
2022

Publication Types

Select...
5

Relationship

1
4

Authors

Journals

citations
Cited by 6 publications
(8 citation statements)
references
References 22 publications
(21 reference statements)
0
3
0
5
Order By: Relevance
“…Este estudo demonstrou que é possível automatizar o relacionamento dos bancos de dados em saúde mantendo a acurácia do método, com base na inspeção manual de uma amostra retirada do próprio banco e posterior seleção de um escore de alto poder discriminatório na identificação de pares verdadeiros desta amostra. Alguns trabalhos usaram escores para os limiares superior e inferior 4,5,6 , indicando para a inspeção os pares com escores intermediários, porém isto pode não ser aplicável quando existe um grande números de pares a ser revisados. Desse modo, recomendamos amostragem aleatória com no mínimo 200 registros, inspeção manual, cálculo da sensibilidade (recall), do valor preditivo positivo (precision), da medida F, construção da curva precision-recall dos escores dessa amostra e posterior aplicação desse ponto de corte para a classificação automática dos pares do banco total.…”
Section: Discussionunclassified
See 1 more Smart Citation
“…Este estudo demonstrou que é possível automatizar o relacionamento dos bancos de dados em saúde mantendo a acurácia do método, com base na inspeção manual de uma amostra retirada do próprio banco e posterior seleção de um escore de alto poder discriminatório na identificação de pares verdadeiros desta amostra. Alguns trabalhos usaram escores para os limiares superior e inferior 4,5,6 , indicando para a inspeção os pares com escores intermediários, porém isto pode não ser aplicável quando existe um grande números de pares a ser revisados. Desse modo, recomendamos amostragem aleatória com no mínimo 200 registros, inspeção manual, cálculo da sensibilidade (recall), do valor preditivo positivo (precision), da medida F, construção da curva precision-recall dos escores dessa amostra e posterior aplicação desse ponto de corte para a classificação automática dos pares do banco total.…”
Section: Discussionunclassified
“…Em um estudo sobre relacionamento de dados referentes ao setor de alta complexidade em cardiologia foram despendidas duas horas para conferir todos os pares formados, gerando a recomendação de que nos casos em que exista grande número de pares após o relacionamento seja realizada inspeção seletiva nas faixas de escore de maior interesse 3 . Outros estudos utilizaram escores para os limiares superior e inferior 4,5,6 , indicando para a inspeção os pares com escores intermediários. Camargo Jr. & Coeli 7 sugeriram a definição do ponto de corte para o limiar inferior de forma arbitrária, determinando que registros com escore negativo deveriam ser considerados falsos pares e com escores positivos deveriam ser revistos.…”
Section: Introductionunclassified
“…É notória a proporção de registros com nomes abreviados no SINAN, 1 a cada 14, bem como a diferença em relação ao SIM, 1 a cada 302, que foi encontrada no estudo (Figura 1). Embora as abreviações de nomes fossem descritas em outros estudos como erro de preenchimento que dificulta o processo de relacionamento de dados 27,30,31 , a frequência de nomes com abreviação não foi informada.…”
Section: Discussionunclassified
“…However, it was not used in isolation to identify a related record. To be a real pair, at least two other conditions of the variables of relationship and confirmation were required 14 . One of the main study limitations were the filling out errors in the database of APAC-SIA/SUS.…”
Section: Discussionmentioning
confidence: 99%
“…The third database was APAC-SIA/SUS, which originally contained 31,743,533 records. However, the process of identification of patients who showed up more than once was conducted considering that, for the probabilistic linkage, this database should present a single record per each patient, containing data about the last time a procedure or medication was requested 14 . The probability technique was applied to improve the completeness of variables and to identify the deaths between the databases of PRO-AIM and RCBP-SP, and, for the evaluation, the living status between APAC-SIA/SUS and RCBP-SP.…”
Section: Methodsmentioning
confidence: 99%