ResumenEn este trabajo se propone un sistema de clasificación Bayesiano para la identificación temprana de la diabetes Mellitus con base en el análisis de algunas variables tales como número de embarazos, presión arterial diastólica, espesor cutáneo del tríceps, índice de masa corporal, herencia y edad. La metodología propuesta define y entrena el sistema propuesto con base en muestras tomadas de pacientes diabéticos y no diabéticos. El sistema se validó con pacientes diferentes, manteniendo la misma proporción entre individuos diabéticos y no diabéticos. Finalmente, el número de aciertos y errores en la detección de esta enfermedad fue comparado contra un test especializado. Los resultados indican que, en el 87,69% de los casos, el clasificador bayesiano logra detectar correctamente esta enfermedad con base en las variables antes mencionadas. No obstante, cuando se agregó la variable "insulina en suero", el porcentaje aumentó al 98.46%. Palabras clave: clasificador bayesiano; diabetes; entrenamiento de un sistema; detección automatizada Bayesian System for Diabetes Prediction AbstractThis study presents a Bayesian system for the early identification of diabetes Mellitus based on the analysis of some variables such as number of pregnancies, diastolic blood pressure, triceps skin thickness, body mass index, heredity and age. The proposed methodology establishes and trains a Bayesian classification system, based on samples of diabetic and non-diabetic patients. The system was tested with different patients maintaining the same ratio between diabetics and non-diabetic individuals. Finally, to detect this disease, the number of hits and errors obtained by the Bayesian classifier was compared with a specialized test. The results indicate that, considering the aforementioned variables the disease was correctly detected by the system in 87.69% of the analyzed cases. However, when the variable serum insulin was included, this percentage increased up to 98.46%.
_____________________________________________________________________________________________________________________________________ ResumenSe propone un método predictivo para detectar el cáncer de mama, basado en las siguientes variables: edad, peso, talla, índice de masa corporal, escolaridad, estrato socioeconómico, seguridad social, fumador, cuando dejo de fumar, fumador pasivo, consume licor, cantidad de licor, herencia familiar de cáncer, edad de la menarca, menopausia, embarazos, partos, edad del primer parto, lactancia, consumo de anticonceptivos orales, cuanto años consumió anticonceptivos orales, tiempo de suspensión de anticonceptivos orales, terapia de reemplazo hormonal y presencia del gen GSTM1. Tomando como referencias pacientes de la región central de Colombia (Caldas), se definieron dos bases de datos, una de personas sin cáncer y otra de personas con cáncer. La misma base de datos de entrenamiento fue empleada para prueba. La metodología propuesta, define y entrena un sistema de clasificación bayesiano, con una base de datos de pacientes con cáncer y sin cáncer. Posteriormente, se realiza una validación del sistema con el fin de determinar el número de aciertos y errores en el reconocimiento de esta enfermedad. Como resultado, se logra un porcentaje de aciertos del 100%. Palabras clave: clasificador bayesiano; cáncer de mama; entrenamiento; detección automatizada de enfermedades Bayesian Predictive System for Detection of Breast Cancer AbstractWe propose a predictive method to detect breast cancer, based on the following variables: Age, weight, height, body mass index, schooling, socioeconomic stratum, social security, smoker, when quit smoking, passive smoker, consumption of liquor, quantity of liquor, family inheritance of cancer, age of menarche, menopause, pregnancies, age of first birth, breastfeeding, consumption of oral contraceptives, how many years of oral contraceptive use, oral contraceptive suspension time, hormone replacement therapy, and the presence of the GSTM1 gene. Taking as reference patients from the central region of Colombia (Caldas), two databases were defined, one of people without cancer and another of people with cancer. The same training database was used for testing. The proposed methodology defines and trains a Bayesian classification system, with a database of patients with cancer and without cancer. Subsequently, a system validation is performed in order to determine the number of successes and errors in the recognition of this disease. As a result, a 100% success rate is achieved.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.