Abstract-News as one kind of information that is needed in daily life has been available on the internet. News website often categorizes their articles to each topic to help users access the news more easily. Document classification has widely used to do this automatically. The current availability of labeled training data is insufficient for the machine to create a good model. The problem in data annotation is that it requires a considerable cost and time to get sufficient quantity of labeled training data. A semi-supervised algorithm is proposed to solve this problem by using labeled and unlabeled data to create classification model. This paper proposes semi-supervised learning news classification system using Self-Training Naive Bayes algorithm. The feature that is used in text classification is Word2Vec Skip-Gram Model. This model is widely used in computational linguistics or text mining research as one of the methods in word representation. Word2Vec is used as a feature because it can bring the semantic meaning of the word in this classification task. The data used in this paper consists of 29,587 news documents from Indonesian online news websites. The Self-Training Naive Bayes algorithm achieved the highest F1-Score of 94.17%.Intisari-Berita sebagai salah satu jenis informasi yang dibutuhkan dalam kehidupan sehari-hari telah tersedia secara bebas di internet. Situs berita telah melakukan pengelompokan berita berdasarkan topiknya untuk mempermudah pengguna mencari berita yang dibutuhkan. Klasifikasi dokumen telah banyak digunakan untuk membantu pengelompokan berita secara otomatis. Kurang tersedianya data pelatihan yang cukup untuk digunakan komputer membentuk model klasifikasi yang baik sering menjadi kendala dalam implementasi di kasus nyata. Masalah utama dalam pelabelan data pelatihan agar diperoleh jumlah data yang cukup adalah perlunya biaya yang besar dan waktu yang cukup lama. Algoritme semi-supervised telah ditawarkan untuk menjawab permasalahan tersebut dengan menggunakan data berlabel dan tak berlabel dalam membentuk model klasifikasi yang dibutuhkan. Makalah ini mengusulkan sistem klasifikasi berita menggunakan semi-supervised learning dengan algoritme Self-Training Naive Bayes.
-The object of the inscription has a feature that is difficult to recognize because it is generally eroded and faded. This study analyzed the performance of CNN using LeNet model to recognize the object of year digit found on the relic inscriptions of Majapahit Kingdom.
Augmented Reality (AR) memungkinkan pengguna dapat melihat objek virtual pada lingkungan nyata. Berbeda dengan Virtual Reality (VR) yang membawa pengguna masuk pada lingkungan virtual sepenuhnya tanpa melihat dunia nyata. Teknologi AR menggunakan marker sebagai target untuk memunculkan objek virtual. Penelitian ini menggunakan Drawing 2D sebagai Marker Based Tracking dalam mendeteksi target untuk memunculkan objek 3D virtual. Gambar 2D atau Drawing 2D merupakan alat untuk menyampaikan maksud dan informasi dari drafter kepada teknisi. Lulusan siswa Sekolah Menengah Kejuruan (SMK) harus mampu memahami Drawing 2D dan memvisualisasikan kedalam bentuk 3D. Kemampuan spasial dalam memvisualisasi ini yang harus dimiliki karena menyangkut masa depan setiap siswa. Pembelajaran materi proyeksi Drawing 2D memerlukan teknis khusus agar mampu di pahami oleh siswa. Aplikasi AR ini menggunakan metode Features from Accelerated Segment Test Corner Detection (FCD) dalam proses tracking. Uji coba penelitian menggunakan 50 marker. Kriteria uji coba deteksi marker dengan posisi tegak lurus, miring 30°, 45°, 60° dan 75° terhadap kamera serta dengan jarak deteksi 20 cm, 30 cm,40 cm,50 cm,dan 60 cm. Dari hasil uji coba untuk deteksi 50 marker disimpulkan bahwa marker dapat terdeteksi pada jarak 50 cm dengan posisi marker tegak lurus, kemiringan 30° maksimum pada jarak 40 cm, dan kemiringan 45° maksimum pada jarak 30 cm. Proses deteksi marker dipengaruhi oleh tingginya spesifikasi perangkat yang digunakan dalam ujicoba, pencahayaan serta besarnya marker yang digunakan.
Abstrak — Kebutuhan protein tubuh manusia salah satunya didapatkan dari daging. Banyak jenis daging yang bisa dikonsumsi untuk kebutuhan protein, diantaranya ayam, babi, bebek, kambing, sapi dan jenis lainnya. Pada kondisi daging mentah, tidak semua orang memahami karakteristik / identitas jenis daging karena ada beberapa jenis daging mentah yang hampir sama dari tampilan visual. Untuk menghindari kesalahan saat pemilihan jenis daging yang diinginkan perlu dilakukan identifikasi jenis daging. Pengenalan jenis daging dapat dilakukan dengan pengambilan gambar / citra secara digital. Citra digital yang didapatkan dapat dilakukan identifikasi dengan Convolution Neural Network. Salah satu kemampuan Convolution Neural Network (CNN) dapat melakukan proses identifikasi dan klasifikasi pada Computer Vision. Pada penelitian ini identifikasi jenis daging yang digunakan berupa adalah daging mentah tanpa lemak, kulit dan tulang. Jenis daging mentah yang digunakan sebanyak 5 buah berupa ayam, babi, bebek, kambing dan sapi. Melalui ekstraksi warna dan deteksi tepi beserta CNN didapatkan identitas jenis daging tersebut berupa tulisan / text sesuai jenis daging input citra. Dataset yang digunakan sebanyak 2,250 citra pada masing-masing jenis daging sehingga total 11,250 dataset citra. Penelitian dilakukan dalam 2 bagian sistem arsitektur. Bagian penelitian berupa Training dan Validation beserta testing. Pada bagian training dan validation dilakukan preprocessing . citra resize dari ukuran 300 × 300 piksel menjadi 50 × 50 piksel. Dataset dari masing-masing jenis citra daging mentah yang digunakan 2,250 citra terdiri dari citra jpeg dengan beberapa model citra , diantaranya citra asli, citra cropping, citra flip horisontal RGB, citra flip vertikal RGB, citra RGB, citra channel Red, citra channel Green, citra channel Blue, citra channel Magenta (greyscale), citra flip vertikal dan citra flip horisontal. Output training dan validasi berupa penyimpanan konfigurasi CNN yang dihasilkan untuk pemodelan saat testing beserta grafik cross entropy. Pembagian dataset citra model training dan validasi sebesar 70% training dan 30% validasi. Sistem testing digunakan uji coba menentukan jenis daging untuk mendapatkan output tulisan / text dari nama daging yang sesuai. Bahasa program yang digunakan penelitian berupa Python 3.8 beserta Tensorflow dan Keras dengan aplikasi PyCharm 2020.3.2 community edition. Untuk training dan validasi dilakukan uji coba pertama pada dataset dengan resize citra pada ukuran 50 X 50 pixel didapatkan hasil : training loss= 43.89% ; training accuracy= 82.82% ; validation loss= 87.44% ; validation juga dilakukan pada ukuran accuracy: 72.27%. Uji coba training dan validasi ke dua dilakukan resize citra pada ukuran 100 X 100 pixel dengan hasil : training loss= 35.74% ; training accuracy= 85.75% ; validation loss: 81.08% ; validation accuracy: 71.65%. Uji coba testing didapatkan nilai tertinggi dari angka array hasil pembandaingan dengan penyimpanan konfigurasi training dan validasi. Penelitian identifikasi jenis daging bisa ditingkatkan lebih baik bila dilengkapi dengan dataset citra yang lebih memadai.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.