The increase in computer programming courses in distance learning platforms (EAD) has generated a lot of questions and codes. This knowledge base is not always organized in a suitable form to be reused. In order to assist teachers in the generation of the database by grouping programming code by theme, or kind, of the problem, we propose an improvement in the classification code approach for the C language based on similarity measures. The contribution of this classification process is the generation of a base of questions associated to the code solutions that can be used as a source for research and for automatic correction of program issues. Resumo. O aumento de cursos de programação de computadores em plataformas de ensino a distância (EAD) tem gerado uma grande quantidade de questões e códigos. Esta base de conhecimento nem sempre está organizada de forma adequada para ser reaproveitada. Com o objetivo de auxiliar professores na geração dessa base, propomos uma melhoria em uma abordagem de classificação de códigos em linguagem C baseada em medidas de similaridade para agrupar códigos de programação por tema ou tipo de problema. A contribuição desse processo de classificaçãoé a geração de uma base de questões com códigos de soluções associados, que pode ser utilizada como fonte de pesquisa ou para correção automática de questões de programação.