This thesis could not have been possible without the help and support of my principal supervisor, Prof. Dr. André L. S. Gradvohl, not to mention his knowledge and advice on space weather. Besides, the advice and support on machine-learning of my co-advisor, Prof. Dr. Guilherme P. Coelho, have been rather valuable, for which I am grateful. Not to mention, the advice also on machine-learning of Profa. Dra. Ana Estela A. da Silva and her support since undergraduation, for which I am grateful too.I would also like to thank Federal Institute of Education, Science, and Technology of Rio Grande do Sul (IFRS) -Campus Feliz, for the financial support and cooperation with this research.This study was financed in part by the Coordenação de Aperfeiçoamento de Pessoal de Nível Superior -Brasil (CAPES) -Finance Code 001.
ResumoO Sol possui uma atmosfera ativa, apresentando diversos fenômenos que afetam diretamente todos os corpos do sistema solar. O clima espacial refere-se aos eventos do Sol, incluindo o vento solar, o espaço próximo à Terra e a atmosfera terrestre. Perturbações no clima espacial podem prejudicar diversas áreas, incluindo aviação e espaço aéreo, satélites, indústrias de óleo e gás e sistemas elétricos, levando a perdas econômicas. Explosões solares -um dos eventos mais significantes -compreendem liberações repentinas de radiação que podem afetar a atmosfera terrestre em poucos minutos após a ocorrência. Deste modo, é de extrema importância a criação de sistemas para predizê-las. Embora diversas abordagens de predição ad hoc foram propostas na literatura nos últimos anos, poucos autores focaram-se em criar um processo de design automatizado para projetar tais sistemas com flexibilidade e desempenho otimizado. Assim, nesta tese, é proposta uma metodologia automatizada para projetar classificadores de explosões solares usando o framework Scikit-learn, baseado em Python. Esta metodologia objetiva oferecer um arranjo compreensivo de processos de aprendizagem de máquina baseados em boas práticas para o clima espacial. Basicamente, tal metodologia compreende: (i) divisão apropriada de dados; (ii) seleção de modelos; (iii) seleção de atributos; (iv) otimização de parâmetros; (v) análise da função de custo dos classificadores; (vi) reamostragem de dados; (vii) ajuste do ponto de corte dos classificadores; (viii) e avaliação sobre conjuntos de dados de validação/teste. Para validar esta metodologia, foram propostos alguns estudos de caso objetivando projetar classificadores de explosões de classe ≥ C e ≥ M (eventos acima ou iguais à classe C e M, respectivamente) para até 3 dias a frente. Resultados destes classificadores mostraram-se estar de acordo com as abordagens de predição da literatura de maiores desempenhos. Assim, para eventos ≥ C, os modelos otimizados pontuaram escores de true skill statistics (TSS) de 0.69 (próximas 24 h), 0.70 (próximas 48 h) e 0.73 (próximas 72 h), em consonância com seus altos escores de true positive rates (TPR) de 0.86 (próximas 24 h) and 0.89 (próximas 48 and 72 h). Por sua vez, para...