Jantung merupakan organ yang sangat penting bagi tubuh kita, namun ternyata penyakit jantung merupakan penyakit paling mematikan di dunia. Penyebab penyakit jantung beragam, seperti pola hidup yang tidak sehat, mengkonsumsi makan yang mengandung tinggi kolestrol, merokok, lingkungan serta faktor keturunan atau genetik. Penyakit jantung tidak mengenal jenis kelamin dan usia, baik perempuan, laki-laki, balita, anak-anak bahkan orang dewasa dapat menderita penyakit jantung. Gejala penyakit jantung antara lain sakit dada, tekanan darah tinggi, hasil tes EleKtrodioGram (EKG), denyut jantung, kadar gula dan kandungan kolesterol yang meningkat atau tidak normal. Minimnya data terkait penyakit jantung menyebabkan kesulitan untuk melakukan prediksi terhadap pasien yang menderita atau tidak. Data minim dapat diartikan sebagai data minoritas yang akan menyebabkan missclasifikation pada dataset utaman dan berdampak pada prediksi yang salah. Penelitian ini bertujuan memprediksi gejala penyakit jantung dengan menggunakan K-means clustering untuk mengelompokan kelas berpenyakit jantung atau minoritas dan kelas sehat atau kelas mayoritas. Hasil dari penelitian menunjukkan bahwa K-means memiliki nilai evaluasi clustering 0.5 dengan metode Elbow dan nilai akurasi 89%. Penerapan oversampling teknik pada dataset penyakit jantung memberikan peningkatan pada evaluasi elbow menjadi 0.8 dan 93% akurasi. Pada Penelitian ini dataset yang tidak seimbang memberikan nilai akurasi pada missclasification sebesar 4% dari dataset seimbang.