Abstract-One method of optimization that can be used for clustering is Ant Colony Optimization (ACO). This method is good in data clustering, but has disadvantage in terms of time and quality or solution convergence. In this study, ACO-based Pattern Reduction Enhanced Ant Colony Optimization (PREACO) method with a gaussian kernel function is proposed. First, it sets up initial solution. Second, the magnitude of pheromone is calculated to find the centroid randomly. With the initialized solution, the weight of the solution is calculated and the center of cluster is revised. The solution will be evaluated through a gaussian kernel functions. Function 'pattern enhanced reduction' is useful to ensure maximum value of pheromone update. Those steps will be conducted repeatedly until the best solution is chosen. Tests are performed on multiple datasets, with three test scenarios. The first test is carried out to get the right combination of parameters. Second, the error rate measurement and similarity data using Sum of Squared Errors is done. Third, level of accuracy of the methods ACO, ACO with the kernel, PREACO, and PREACO with the kernel is compared. The test results show that the proposed method has a higher accuracy rate of 99.8% for synthetic data, 93.8% for wine data than other methods. But it has a lower accuracy by 88.7% compared to the ACO.
Intisari-
I. PENDAHULUANCluster merupakan pengelompokan dari banyak data dengan berdasarkan pada kesamaan atau perbedaannya. Kesamaan maupun perbedaan itu dilihat dari ciri yang dipunyai data tersebut. Misalnya saja terdapat sebuah data termasuk ke dalam Cluster tertentu dikarenakan memiliki ciri yang sama dengan Cluster itu. Pengklusteran sebuah data sesuai cluster masing-masing dilakukan dengan metode tertentu. Oleh karena itu melakukan cluster terdapat dua jenis yaitu soft clustering dan hard clustering. Maksudnya, sebuah data bisa termasuk ke dalam beberapa cluster. Hal ini disebut dengan soft clustering. Sebaliknya, sebuah data harus dimasukkan ke dalam satu cluster tertentu saja, disebut dengan hard clustering.adalah satu dari beragam metode clustering. Metode tersebut dapat dengan baik melakukan clustering, tetapi masih memiliki permasalahan yaitu pada penentuan jumlah cluster di awal dan juga masih memasukkan sebuah data ke dalam beberapa cluster yang berbeda. Oleh karena itu akan menjadi masalah ketika sebuah data masuk dalam beberapa cluster yang berbeda. Itu artinya data tersebut tidak terdefinisi dengan baik pengklusterannya. Oleh sebab itu, penentuan jumlah cluster di awal diperlukan. Penelitian tentang permasalahan tersebut masih terbuka untuk diteliti. Salah satu metode yang berusaha menyelesaikan permasalahan itu adalah kernel clustering, untuk mendefinisikan dengan baik jumlah cluster, sehingga pada akhirnya sebuah data akan dimasukkan ke dalam sebuah cluster dengan tepat.Cluster analysis atau kernel clustering saat ini menjadi rujukan dalam melakukan pembelajaran tak terawasi pada proses pencarian cluster. Berangkat dari kelemahan ini, telah dilakukan p...