ResumoA análise de agrupamentos agrega vários métodos que visam identificar grupos dentro de um conjunto de dados. Este artigo apresenta novas heurísticas baseadas na metaheurística Busca Local Iterada para resolver o Problema de Agrupamento Automático, qual seja o problema de determinar o número ideal de grupos para uma base dados. Para tal, em uma das fases da aplicação desta heurística, foi utilizado o índice silhueta, que combina conceitos de coesão e separação e é considerado pelas heurísticas propostas para avaliar a qualidade das soluções. De acordo com os experimentos computacionais reportados neste trabalho, verifica-se que a nova heurística ILS-DBSCAN é muito eficiente no que concerne ao tempo de processamento e muito eficaz quanto à qualidade das soluções obtidas, quando comparado com outros métodos da literatura. Em geral, os resultados desta nova heurística foram superiores aos resultados relatados na literatura. Dessa maneira o ILS-DBSCAN apresenta-se como um algoritmo promissor para a resolução do problema abordado.
Palavras-chave:
ResumoO presente trabalho propõe um novo algoritmo de otimização para a resolução do problema dos k-medoids. Um problema de agrupamento, onde dado um conjunto de n objetos com f atributos, e fixado o número de grupos, deve-se selecionar, dentre os n objetos, k objetos denominados medoids. Os demais objetos são alocados ao medoid correspondente mais próximo, segundo uma medida distância. Especificamente, o conjunto dos k medoids é definido de forma que a soma das distâncias dos demais objetos ao seu respectivo medoid seja a menor possível. De forma a resolver este problema, propõe-se no presente trabalho um algoritmo que utiliza os conceitos da metaheurística algoritmo genético de chaves aleatórias viciadas (biased random-key genetic algorithm -BRKGA) e um procedimento de reconexão por caminhos. A última seção traz alguns resultados computacionais para um conjunto de instâncias da literatura, reais e geradas artificialmente, considerando a aplicação do algoritmo proposto, de quatro algoritmos da literatura e de uma formulação exata. Palavras-Chaves: Algoritmos Genéticos; Chaves Aleatórias; Medoids; Análise de Agrupamentos;
Processamento ParaleloAbstract This paper proposes a new Optimization Algorithm for the k-medoid Clustering Problem. In this problem, given a dataset X with n objects and f attributes and a fixed number of clusters (k), it is necessary to select k objects called medoids. Each medoid creates a new cluster and the remaining (n-k) objects should be placed into nearest of these clusters, according a distance measure. The goal is minimize the sum of distances between each object and the medoid of its group. This work presents a new algorithm that considers concepts of Biased Random-key Genetic Algorithm. Besides, an approach of path-relinking procedure is related. The computational experiments results are presented in the last section. It was used thirty instances, among well-known datasets of the literature and new datasets artificially constructed. The proposed heuristics are compared with five approaches (four algorithms and one exact method) and the presented algorithms are a alternative and effective way to solve the problem.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.