ResumenEn este artículo se presenta una nueva metodología basada en la aplicación de algoritmos Máquina de Soporte Vectorial, Naïve Bayes y Algoritmos Genéticos en diagnósticos de evaluaciones psicosociales para la identificación del grado de riesgo psicosocial en docentes de colegios públicos en Colombia. Se realizó un estudio comparativo del modelo de aprendizaje de máquina para la predicción: Máquinas de Soporte Vectorial (SVM) y Naïve Bayes, en dos etapas, primero con todas las variables y segundo, reduciendo la dimensionalidad de los datos aplicando: algoritmos genéticos. Se seleccionaron las cuarenta mejores variables con mejor eficiencia en la precisión de la predicción. La base de datos utilizada se componía de 3000 registros epidemiológicos, que correspondían a docentes de colegios públicos del área metropolitana de una ciudad colombiana. El uso de SVM reconoce fácilmente variables de tipo fisiológico y el mejor desempeño de predicción se obtuvo con una eficiencia en la precisión del 96,3%. Palabras clave: aprendizaje de máquina; máquinas de soporte vectorial; Naïve Bayes; algoritmos genéticosAbstract This paper presents a new methodology based on the application of Support Vector Machine algorithms, Naïve Bayes and Genetic Algorithms in diagnostics of psychosocial evaluations for the identification and prediction of the psychosocial risk level of public-school teachers in Colombia. A comparative study of the model of machine learning for prediction was carried out: Support Vector Machines (SVM) and Naïve Bayes, in two stages, first with all the variables and second, reducing the dimensionality of the database applying genetic algorithms, The best forty variables with the best efficiency in prediction accuracy were selected. The database used consisted of 3000 epidemiological records, which corresponded to teachers from public schools in the metropolitan area of a Colombian city. The use of SVM easily detected variables of physiological type and the best prediction performance was obtained with accuracy of 96.3%.
ResumenEn este artículo se presenta la aplicación de la minería de datos en diagnósticos de evaluaciones psicosociales para la identificación del grado de riesgo psicosocial en docentes de educación básica primaria y media secundaria en Colombia. Se tomó una muestra de datos de 1100 registros, correspondientes a evaluaciones personales. Se realizó la revisión y limpieza de los datos para poder utilizarlos como entradas en la herramienta de minería de datos WEKA. Se comparan los resultados obtenidos al aplicar las técnicas de minería de datos, árboles de clasificación J48 y Naive Bayes. Finalmente se obtiene como resultado las características psicosociales predictivas con una efectividad del 91% comparado con el diagnóstico clínico. Se concluye que la herramienta puede ser usada como un instrumento para la prevención de la aparición de factores de riesgo psicosocial en docentes de colegios públicos colombianos.Palabras clave: clasificación de riesgo psicosocial; J48; Naive Bayes; docentes colombianos; jornada básica primaria y secundaria; minería de datos. Methodology for Predicting the Psychosocial Risk Level on Colombian Teachers using Data Mining Techniques AbstractThis paper proposed the application of data mining to identify the psychosocial risk level in teaching elementary, middle y high school education in Colombia. A sample of 1100 data records corresponding to individual assessments were analyzed and processed. The samples were used as input data to the data mining tool called WEKA. Results were compared to assess the performance when applying data mining techniques and classification trees J48 and Naive Bayes. Finally, the application of this predictive tool allows the accuracy 91% compared to the clinic diagnostic. It is concluded that the method can be used tool for preventing the occurrence of psychosocial risk factors in Colombian public school teachers.
Este artículo presenta una nueva metodología basada en técnicas de aprendizaje de máquina en diagnósticos de evaluaciones psicosociales para la identificación del grado de riesgo en docentes de colegios públicos en Colombia. Se realizó un estudio comparativo de tres importantes modelos de aprendizaje de máquina para la predicción: redes neuronales artificiales, arboles de decisión y Naïve Bayes, reduciendo la dimensionalidad de los datos. Esto se hace aplicando algoritmos genéticos, algoritmo de la cantidad esperada de la información, algoritmo GainRatioAttributeEval, coeficiente de relación de Pearson y análisis principal de componentes. Se utilizó una base de datos con 5340 registros epidemiológicos, correspondientes a evaluaciones psicosociales de docentes de colegios públicos de una ciudad colombiana. El mejor desempeño de predicción se obtuvo con el modelo de redes neuronales artificiales con una efectividad del 93%. Palabras clave: aprendizaje de máquina; redes neurales artificiales; algoritmos genéticos; análisis principal de componentes
En este artículo se propone un sistema de clasificación para la identificación y la prevención de accidentes laborales en las bodegas de almacenamiento de fibra en una empresa de pulpa de papel. Eso se hace con base en el análisis de variables que incluyen la circulación de peatones, bobcat, tractocamiones, acceso, zonas de circulación peatonal y barandas. La metodología propuesta define y entrena el sistema propuesto con datos recopilados en planta respecto a accidentalidad e incidentes laborales. Se compararon los resultados de tres algoritmos: redes bayesianas, naive bayes y árboles de decisión. Los resultados muestran que, en el 90% de los casos, el clasificador de arboles de decisión J48 identifica correctamente los casos posibles de accidentalidad laboral. Se concluye que la identificación de los atributos que generan la ocurrencia de incidentes y accidentes laborales, permite generar un árbol de decisión C4.5 (J48) que sirve de herramienta y soporte para labores de prevención de accidentes laborales.
This research is framed in the area of biomathematics and contributes to the epidemiological surveillance entities in Colombia to clarify how breast cancer mortality rate (BCM) is spatially distributed in relation to the forest area index (FA) and circulating vehicle index (CV). In this regard, the World Health Organization has highlighted the scarce generation of knowledge that relates mortality from tumor diseases to environmental factors. Quantitative methods based on geospatial data science are used with cross-sectional information from the 2018 census; it’s found that the BCM in Colombia is not spatially randomly distributed, but follows cluster aggregation patterns. Under multivariate modeling methods, the research provides sufficient statistical evidence in terms of not rejecting the hypothesis that if a spatial unit has high FA and low CV, then it has significant advantages in terms of lower BCM.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.