Agradeço aos meus pais Pedro e Regina por tudo, pela minha vida, por mostrar o valor das coisas me ensinando a lutar pelos meus objetivos honestamente. Agradeço a minha chefa e professora Adriana Franco Paes Leme, por acreditar em mim e confiar a execução desse projeto. Agradeço a minhas irmãs Regiane e Rimena e minha sobrinha Ingrid, pelo companheirismo e admiração, e ao meu cunhado Samuel por ser sempre tão alegre. Agradeço a minhas companheiras de laboratório Sami, Dani e em especial a Bianca, pela amizade (além do lab), paciência e apoio ao longo do mestrado. Agradeço ao Henry pela grandiosa ajuda, disposição e paciência na execução das análises. Agradeço a Gabriela Meirelles pela boa vontade e carinho desprendido no início do projeto. Agradeço ao Diego Riano pelos esclarecimentos do caminho correto a seguir. Agradeço a todos os amigos do grupo MAS pelo companheirismo e amizade em especial Carol Carneiro e Flávia Zandonadi. Agradeço ao Laboratório de Espectrometria de Massas-LNBio, pela estrutura e suporte na realização desse projeto. Ao LNBio e ao CNPEM pela excelência como centro nacional de pesquisa e à UNICAMP por me acolher como aluna. O presente trabalho foi realizado com apoio da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior -Brasil (CAPES) -Código de Financiamento 001. RESUMO Biomarcadores são essenciais no diagnóstico, prognóstico e desenvolvimento de fármacos. Sua pesquisa deve envolver alta sensibilidade e seletividade, definindo resultados claros de confirmação ou exclusão da doença, bem como alta qualidade na metodologia analítica, em métodos computacionais e estatísticos. O sucesso de biomarcadores em testes clínicos tem sido pequeno e uma das razões é que poucos candidatos à biomarcadores passam por uma validação rigorosa por meio de modelos estatísticos, como também pequenos números de amostras biológicas, variabilidade biológica resultando em falsos positivos. Dessa forma, o objetivo desse estudo é aplicar modelos estatísticos de análise que ajudem a selecionar biomarcadores candidatos na fase de descoberta, classificá-los e validá-los para posterior aplicação em uma nova fase de verificação, como proteômica baseada em alvos. Para isso, foram analisadas amostras de saliva de pacientes com e sem carcinoma de células escamosas (CEC) contendo 4 proteínas recombinantes em concentrações crescentes. Após a identificação e quantificação das proteínas utilizando o algoritmo de busca do Andromeda integrado no MaxQuant, os dados foram analisados pelos métodos de Kruskal-Wallis, Wilcoxon, Nearest Shrunken Centroid (NSC), Random Forest e Support Vector Machine -Recursive Feature Elimination (SVM-RFE), seguidos de métodos de validação como validação cruzada, permutação e Curvas de Características de Operação do Receptor (ROC). Os resultados mostram que as análises de Kruskal-Wallis e Wilcoxon foram capazes de detectar as proteínas marcadoras adicionadas nas amostras de saliva em concentrações crescentes como verdadeiros positivos. Houve melhora na classificação das amostras para as análises ...