“…Para proceder ao treinamento dos modelos preditores, as informações dos atributos do terreno e das unidades de mapeamento (UM) foram amostradas em 45000 pontos (1 ponto a cada 2 ha), usando três esquemas de amostragem: aleatória simples; aleatória proporcional à área ocupada por cada UM, em que os pontos amostrais foram distribuídos aleatoriamente sobre o mapa obedecendo o critério da proporcionalidade; e aleatória estratificada pelo número de UM, em que a mesma quantidade de pontos amostrais (4500) foi distribuída aleatoriamente dentro da área de cada uma das 10 UMs. Os modelos preditores gerados para cada esquema de amostragem tiveram suas acurácias estimadas pelos seguintes métodos de avaliação: validação aparente, que se utiliza da totalidade do conjunto de dados usados para treinamento; divisão percentual, sendo 66 % dos dados usados para treinamento e 34 % para avaliação; validação cruzada com 10 subconjuntos, sendo nove subconjuntos para treinamento e um para avaliação, sendo intercalados até que todos os conjuntos sejam usados para treino e para teste (Steyerberg, 2009); validação com dados independentes, utilizando sete conjuntos de dados distintos daqueles usados para treinamento, sendo amostrados aleatoriamente sobre a área de estudo, obedecendo, assim, ao critério de amostragem probabilística (Grinand et al, 2008;Brus et al, 2011). Os dados independentes foram amostrados em diferentes proporções (0,75; 1,5; 3,0; 4,5; 6,0; 7,5; e 9,0 %) em relação ao tamanho total da microbacia, resultando em conjuntos de dados com 7500, 15000, 30000, 45000, 60000, 75000 e 90000 pontos amostrais.…”