Missing Value dalam data masih menjadi permasalahan dalam analisis data diberbagai penelitian, terutama di bidang bisnis. Permasalahan tersebut tentu akan mempengaruhi keputusan dalam penentuan keputusan bisnis yang salah atau kurang tepat. Tujuan dari penelitian ini adalah melakukan pre processing data UMKM sehingga didapatkan data yang berkualitas. Diaman data UMKM tersebut dapat digunakan untuk proses pengelompokan dalam rangka pengembangan UMKM di Provinsi Sumatera Selatan. Tahapan penelitian yang dilakukan adalah Collecting Data phase, Data Preprocessing phase, Simulation of Missing Value phase, Modelling phase, Performance Evaluation phase. Pada penelitina ini metode K-Nearest Neighbor (K-NN) digunakan untuk menginputasi data yang hilang. Dengan metode yang sama juga dilakukan pengujian terhadap akurasi dari hasil imputasi yang telah dilakukan. Pada pengujian 798 data UMKM, terdapat 23 pada atribut omzet dan 62 pada atribut asset yang memiliki data tidak lengkap atau missing value. Hasil evaluasi menunjukkan bahwa semakin kecil jumlah k maka akurasi akan semakin baik, yaitu jumlah k = 9 nilai akurasi sebesar 98,12%, jumlah k = 19 nilai akurasi sebesar 97,50% dan jumlah k = 39 nilai akurasi sebesar 96,88%. Tidak adanya aturan terhadap jumlah k merupakan kelemahan dari metode K-NN, diharapkan kedepan dapat digunakan metode untuk menemukan jumlah k yang sesuai.
Kata kunci : K-NN, UMKM, Missing Value, Clustering