Técnicas computacionais podem ser usadas para identificar tendências e padrões musicais, ajudando as pessoas a filtrar e selecionar músicas de acordo com suas preferências. Nesse cenário, pesquisas afirmam que o futuro da música permeia a inteligência artificial, que desempenhará o papel de compor músicas que melhor atendam aos gostos dos consumidores. Portanto, extrair padrões desses dados é fundamental e pode contribuir para o ecossistema da indústria da música. Essas técnicas são bem conhecidas no campo da recuperação de informações musicais. Eles consistem na extração das características de áudio (conteúdo) ou letra (contexto), sendo o último preferível por exigir menor custo computacional e apresentar melhores resultados. No entanto, ao observar o estado da arte, verificou-se a falta de antecedentes que investiguem a extração de padrões musicais brasileiros por meio de letras. Nesse sentido, o objetivo principal deste trabalho é preencher essa lacuna por meio de técnicas de mineração de texto, analisando a classificação das músicas nos subgêneros do sertanejo. Essa análise é baseada em letras e extração de conhecimento para explicar como os subgêneros diferem.