Tugas mahasiswa selama KKN adalah membuat dan melaksanakan program kegiatan yang bermanfaat bagi pemberdayaan masyarakat setempat. Setelah menyelesaikan seluruh program kegiatan, mahasiswa diwajibkan membuat laporan pelaksanaan kegiatan KKN-PPM. Laporan ini berisi tentang penjelasan pelaksanaan kegiatan yang telah dilakukan oleh masing-masing mahasiswa.Kegiatan KKN telah dilaksanakan bertahun-tahun sehingga laporan yang terkumpul juga sudah sangat banyak. Laporan ini sebenarnya bisa menjadi sumber infromasi. Salah satu informasi yang bisa digali dari dokumen laporan tersebut adalah informasi tentang potensi daerah lokasi KKN. Potensi adalah sesuatu hal yang dapat dijadikan sebagai bahan atau sumber yang akan dikelola, baik melalui usaha yang dilakukan manusia maupun yang dilakukan melalui tenaga mesin [1]. Ragam program kegiatan yang dilakukan mahasiswa di suatu lokasi KKN-PPM bisa menjadi indikator potensi yang dimiliki daerah tersebut. Sebagai contoh, kegiatan KKN tentang penyuluhan perikanan atau budidaya jahe di suatu lokasi KKN bisa menjadi indikator bahwa daerah tersebut memiliki potensi sumber daya alam jahe atau perikanan.Salah satu metode untuk menambang (mining) informasi dari sebuah data adalah data mining, atau dalam hal ini, text mining karena datanya berbentuk dokumen teks. Menambang data adalah memperoleh informasi lebih dalam dari informasi yang tampak pada sebuah data.Penelitian ini bertujuan untuk menambang informasi tentang potensi daerah dari dokumen laporan pelaksanaan kegiatan KKN-PPM menggunakan salah satu metode pada text mining, yaitu document clustering. Clustering dilakukan dengan dua pendekatan yaitu, STC dan LINGO. Keduanya merupakan algoritma berbasis frasa. Dengan menggunakan dua algortima, hasil klaster yang diperoleh bisa dibandingkan dan dianalisa manakah yang menghasilkan klaster lebih baik dalam penggambaran potensi daerah lokasi KKN-PPM UGM.Gambaran potensi daerah yang dihasilkan dari clustering dokumen laporan KKN ini, diharapkan dapat bermanfaat bagi pengelola KKN-PPM, sebagai pertimbangan kegiatan KKN selanjutnya, serta pihak terkait (pemerintah setempat, kabupaten, dan lain-lain) dalam pengembangan daerah.
II. TEXT MININGText mining merupakan cabang dari data mining, sehingga kadang disebut sebagai text data mining. Text mining secara garis besar dapat dikatakan sebagai analisis data teks, yaitu mendapatkan informasi bermanfaat dari sekumpulan data teks. Informasi ini bukan informasi yang sudah eksplisit tertuang dalam teks, tetapi informasi baru yang dapat disarikan dari kumpulan teks itu melalui pola. Text mining mampu