Resumo-Técnicas de aprendizagem de máquina são atrativas para a tarefa de classificação de contatos a partir de sinais de sonar passivo. A obtenção de bases de dados completas, porém, é uma tarefa difícil, senão impossível, tendo em vista a natureza sensível de tal aplicação. Através de métodos desenvolvidos na subárea de detecção de novidades, buscamos viabilizar a geração de coeficientes indicadores da confiabilidade de sistemas de classificação automática de contatos. Esta etapa, realizada após a classificação, tem como objetivo evitar que dados atípicos possam ser classificados de forma similar àqueles típicos por sistemas discriminativos. Avaliamos o uso de tais técnicas através de sinais obtidos em ensaios controlados realizados em raia acústica e que envolveram 8 classes distintas de embarcações. Os resultados exploratórios avaliando a capacidade de diferentes modelos em distinguir sinais de classes conhecidas e de classes desconhecidas são apresentados, assim como são realizadas comparações quanto à complexidade computacional dos algoritmos. Verificou-se que para todas as 8 classes de dados, é possível obter detectores com, em média, um valor de área sob a curva ROC superior à 0, 95.Keywords-Sonar passivo, detecção de novidades, análise de confiabilidade, sistemas de suporte à decisão.
I. IntroduçãoA utilização de técnicas de aprendizagem de máquina para a classificação de contatos em sistemas de sonar passivo é de grande importância prática. Ao automatizar esta tarefa, é possível reduzir a dependência do sistema quanto ao operador de sonar e, portanto, reduzir possíveis erros humanos. Infelizmente, não é concebível que haja disponibilidade de dados contemplando todas as classes de embarcações para o desenvolvimento de sistemas de classificação automática de contatos. Além disso, é possível que a característica da embarcação que leva à definição de sua classe não seja identificável através dos sinais de sonar disponíveis. Claramente, o ideal é que, além de fornecer uma classificação deste sinal, uma estimativa da confiabilidade daquela predição seja fornecida ao operador de sonar, que pode dedicar um tratamento diferenciado caso o sistema indique um alto nível de incerteza a ela associada.Uma forma de se determinar a confiança de uma predição é determinar a distribuição de probabilidade associada a geração dos sinais de sonar para as classes conhecidas. As predições de sinais improváveis, ou mais precisamente, aqueles que ocorrem em regiões de baixa densidade de probabilidade, devem ser identificadas como de baixa confiança. Classificadores generativos buscam estimar diretamente estas distribuições de probabilidade para cada classe, porém esta tarefa é mais difícil do que se determinar um classificador discriminativo que possa simplesmente separar as classes. As evidências para tal questão são discutidas em [1], onde foi verificado que o erro assintótico, isto é, o erro atingido quando se tem uma quantidade de dados para treino tendendo ao infinito, para o classificador discriminativo, no caso uma regres...