El presente trabajo aborda el tema relacionado con el procesamiento estadístico de variables categóricas. Se explican los fundamentos matemáticos del análisis de Componentes Principales y del an´alisis de Regresión para datos categóricos. La unión de estas técnicas puede utilizarse para resolver problemas de clasificación.Debido a que estos son métodos relativamente nuevos, se decide utilizar otra técnica más conocida (´arboles de clasificación siguiendo criterios chi cuadrado) para realizar comparaciones de sus los resultados, con ayuda de la teoría de las curvas ROC. En la aplicación desarrollada se estudiaron pacientes supuestamente sanos del municipio de Santa Clara, Cuba, diagnosticados como hipertensos, prehipertensos y normotensos por un Comité de Expertos Médicos altamente calificados. La regresión categórica unida al análisis de Componentes Principales como m´etodo de selección de variables, resultó ser la mejor técnica ara resolver el problema de clasificación.
En este artículo se propone una modificación a los métodos de detección de conglomerados de enfermos en el tiempo, para que puedan utilizarse en otras ramas del saber. Se muestran especificaciones particulares en los métodos Scan y Grimson. Los datos originales se transforman en una secuencia binaria donde los “unos” representan la categoría de interés y los “ceros” se corresponden con los demás casos. Las transformaciones particulares de los algoritmos se implementaron en el paquete Mathematica. Además se presentan varias aplicaciones interesantes del campo de la bioinformática.
ResumenLa clasificación de un brote con la categoría de epidemia requiere del cumplimiento de determinados parámetros epidemiológicos y estadísticos que necesitan de un estudio simultáneo; la teoría matemática ayuda a los epidemiólogos en la detección de las epidemias en aquellos casos en los que no está clara su evidencia. Actualmente estas situaciones se han comenzado a estudiar mediante las denominadas técnicas de clustering (del inglés cluster que significa aglomeración), apoyados en productos de software especializados en el tema. El presente trabajo está encaminado al estudio actualizado de dichas técnicas y a su mejoramiento mediante la inclusión de factores de riesgos. Se expone una aplicación con datos reales. Palabras-clave: clases de enfermedad, interacción espacio-temporal, estadísticas Scan. AbstractClassification of an outbreak with the category of epidemics requires that some epidemiological and statistical parameters, which have to be studied simultaneously, are satisfied; mathematical theory helps epidemiologists in the detection of epidemics in cases when it is not evident. At the present time, these situations are studied with slutering techniques, with the help of specialized software in these topics. The present work aims to study these techniques and its improvement with including risk factors. It is also presented an application with real data.
Resumen. En este trabajo se exponen las diferentes medidas de diversidad que existen en la literatura para decidir si un conjunto de clasificadores es diverso, aspecto que tiene gran importancia en la creación de los sistemas multi-clasificadores. Se presenta la modelación de la construcción de sistemas multiclasificadores usando la meta-heurística de Algoritmos Genéticos para garantizar la mejor exactitud posible y la mayor diversidad entre los clasificadores. Se enuncian además varias formas de combinación para las medidas de diversidad. Por último se discuten dos experimentos en los que se analiza el comportamiento individual de las medidas de diversidad y los resultados de sus combinaciones. Palabras claves. Medidas de diversidad, multiclasificadores, clasificadores, algoritmos genéticos.
ResumenNo existen métodos estadísticos de detección de conglomerados de enfermos que puedan aplicarse en todas las situaciones, por tanto se hace necesario conocer con exactitud cuando se puede confiar en los resultados que ellos arrojan. En este trabajo se simulan casos de enfermos en el espacio por medio de dos distribuciones uniformes y en tiempo siguiendo el modelo de epidemia simple y se analiza como responden ante ellos los métodos de Knox y Grimson. Se estudia además el comportamiento de ambos tests al incorporarles factores de riesgo. Todos los cálculos fueron hechos con ayuda del paquete Mathematica.Palabras clave: Clases de enfermedades, interacción espacio-tiempo, método de Knox, método de Grimson, simulación. AbstractThere are not infallible disease clusters methods, so it is necessary to know exactly when their results are reliable. In this paper space data were simulated using two uniform distributions and time data, following the pattern of simple epidemic model. Behaviour of both tests: Knox and Grimson were studied. Besides the conduct of both tests with risks factors were analysed. Numerical computing were done with Mathematica software.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
hi@scite.ai
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.