Resumo-Recentemente, abordagens baseadas em comitês de classificadores e métodos ensemble têm sido bastante exploradas por serem uma alternativa simples e eficaz para a construção de classificadores mais acurados. A melhoria da capacidade de generalização de um ensemble está diretamente relacionada a acurácia de cada classificador individual, bem como a diversidade dos classificadores que o compõem. Sendo assim, contribuições nesse escopo ainda são relevantes. Nesse trabalho, é apresentada uma extensão de um modelo ensemble baseado em Perceptrons balanceados que permite a inclusão de funções kernel e a solução de problemas não-linearmente separáveis. Visando a melhoria da acurácia do classificador individual, o hiperplano solução é balanceado. Além disso, uma medida de dissimilaridade é introduzida com intuito de maximizar a diversidade do ensemble. Essa estratégia permite a aceitação de um novo componente no comitê se, e somente se, uma distância mínima pré-estabelecida é mantida entre o novo candidato e todos os outros componentes. Um estudo experimental foi conduzido em bases de dados não-linearmente separáveis. Os resultados obtidos mostraram que o método proposto foi capaz de superar outros algoritmos avaliados, como o AdaBoost e o SVM, na maior parte dos casos testados. Além disso, o método proposto superou consistentemente o classificador de base empregado.Keywords-Ensemble; Perceptron kernel; Classificação.
I. INTRODUÇÃORecentemente, abordagens baseadas em métodos ensemble têm sido amplamente difundidas, tornando-se uma área de pesquisa importante e ativa, por serem uma alternativa eficaz para a criação de classificadores mais acurados. De fato, resultados teóricos e empíricos demonstram que métodos ensemble apresentam desempenho superior em relação aos classificadores individuais que os compõemUm ensemble consiste em um comitê de classificadores cujas hipóteses individuais são induzidas separadamente e as decisões referentes a cada hipótese são combinadas através de um método de consenso para a classificação de novas amostras apresentadas. Entre as estratégias mais comuns para combinar decisões destacam-se a média e o voto, ponderado ou não, das soluções. Para a construção de um modelo ensemble, dois aspectos fundamentais devem ser observados, a acurácia individual do classificador de base e a diversidade dos componentes do comitê [1]. Em relação a acurácia individual, um classificador é dito acurado se a taxa de erro fornecida por ele é inferior àquela fornecida por qualquer outra escolha aleatória. Além disso, a diversidade dos componentes é extremamente importante para possibilitar a correção de amostras classificadas incorretamente por um ou mais classificadores individuais.Nesse sentido, a diversidade do comitê implica diretamente na independência de seus componentes.Considerando as duas premissas anteriormente descritas, este trabalho apresenta uma extensão da formulação do método Ensemble of Balanced Perceptrons [4], para possibilitar a utilização de funções kernel e a solução de problemas não-li...
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.