The increasing number of breast cancer in recent years has attracted numerous researchers' attention. Several techniques of Computer Aided Diagnosis System have been proposed as alternative solutions to diagnose breast cancer. The flaw of simply using the naked eye to see the differences between normal and with cancer mammogram images makes the texture analysis play an important role in classifying breast cancer. In this study, the results of the classification were compared using various methods of texture analysis in extracting a feature of the mammogram image. Some texture analysis methods, including first order, which consist of GLCM, GLRLM, and GLDM, have successfully extracted features based on their characteristics. The statistical features of these methods are used as input for the ECOC SVM classification, which three kernel comparisons; linear, RBF, and polynomial, build the classification. The results show that the best kernel is polynomial kernels with statistical features built by GLRLM with 93.9757% accuracy value.
AbstrakInformation Retrieval (IR) adalah sebuah proses yang digunakan untuk menemukan kembali informasi-informasi yang relevan terhadap kebutuhan pengguna dari suatu kumpulan informasi secara otomatis yang didasarkan pada suatu query (inputan user). Meningkatnya jumlah dokumen teks yang dapat diakses di internet dan diikuti dengan meningkatnya kebutuhan pengguna akan perangkat pencarian informasi yang efektif dan efisien. Efektif berarti pengguna mendapatkan dokumen yang relevan dengan query yang diinputkan. Efisien berarti waktu dalam pencarian yang singkat. Salah satu aplikasi umum dari IR adalah search-engine atau mesin pencarian yang terdapat pada jaringan internet yang dapat digunakan oleh pengguna untuk mencari halaman-halaman Web yang dibutuhkannya. Stemming adalah salah satu cara yang digunakan untuk meningkatkan performa Information Retrieval dengan cara mentransformasi kata-kata dalam sebuah dokumen teks ke bentuk kata dasarnya. Kata dasar tersebut akan disimpan sebagai index. Dalam Bahasa Indonesia banyak metode stemming yang sudah ada, salah satunya yaitu Porter dan Arifin Setiono. Penelitian inimembandingkan dua stemmers Indonesia, yaitu Porter dan Arifin Setiono. Hasil yang dicapai dalam penelitian ini adalah untuk mengetahui stemmer mana yang lebih efektif dalam menentukan kata dasar dari perbandingan algoritma tersebut. Kata Kunci : Stemming Bahasa Indonesia, Algoritma Porter, Algoritma Arifin Setiono, Presisi (%)
PendahuluanInformation Retrieval adalah studi tentang sistem pengindeksan, pencarian, dan mengingat data, khususnya teks atau bentuk tidak teratur lainnya. Information Retrieval merupakan suatu pencarian informasi (biasanya berupa dokumen) yang didasarkan pada suatu query (inputan user) yang diharapkan dapat memenuhi keinginan user dari kumpulan dokumen yang ada. Stemming adalah salah satu cara yang digunakan untuk meningkatkan performa Information Retrieval dengan cara mentransformasi kata-kata dalam sebuah dokumen teks ke bentuk kata dasarnya. Dalam penelitian ini akan dibandingkan dua algoritma stemming yaitu Algoritma Porter dengan Algoritma Arifin Setiono. Tujuan penelitian ini adalah untuk membandingkan tingkat presisi(%) Algoritma Porter dengan Algoritma Arifin Setiono dalam proses stemming pada teks berbahasa Indonesia.
Tinjauan Pustaka
Information RetrievalInformation Retrieval merupakan suatu pencarian informasi (biasanya berupa dokumen) yang didasarkan pada suatu query (inputan user) yang diharapkan dapat memenuhi keinginan user dari kumpulan dokumen yang ada. Tujuan dari sistem IR (Information Retrieval) adalah memenuhi kebutuhan informasi pengguna dengan me-retrieve semua dokumen yang mungkin relevan, pada waktu yang sama me-retrieve sesedikit mungkin dokumen yang tak-relevan. Tahap-tahap yang terjadi pada pada proses indeksing dalam Information Retrieval adalah:
Based on the Alzheimer's Charter, 2-3 million cases of dementia by Alzheimer's disease occur every year. People with Alzheimer's disease experience memory and cognitive disorders progressively for 3 to 9 years. Patients experience confusion in understanding the question and have a chaotic sequence of memory, which can interfere with daily activities and unchecked well, it cause death. The classification system is based on Alzheimer's and non-Alzheimer's disease Magnetic Resonance Imaging (MRI) using Support Vector Machine (SVM). The feature data segmentation using Fuzzy C-Means (FCM) and feature extraction using Gray Level Co-Occurrence Matrix (GLCM) and give accuracy result of 93.33%.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.