Implementasi Metode Forensik dengan Menggunakan Pitch, Formant, dan Spectrogram untuk Analisis Kemiripan Suara Melalui Perekam Suara Telepon Genggam Pada Lingkungan yang Bervariasi
Abstract:Kejahatan digital saat ini makin lama makin marak. Perkiraan pada periode tahun 2008-2014, kejahatan digital meningkat >85%. Untuk itulah diperlukan penyidikan terhadap barang bukti yang ditemukan, berupa barang bukti digital, dengan melakukan forensika digital. Barang bukti yang saat ini dapat menguatkan persidangan adalah suara. Untuk itu perlu dilakukan forensik suara. Pada barang bukti suara, masalah dalam melakukan forensik adalah bagaimana menciptakan lingkungan senatural mungkin, kondisi pengambilan, da… Show more
“…[10] Dalam bidang ilmu forensik, PRAAT juga dijadikan sebagai alat ukur kemiripan dan keakurasian suara untuk memperoleh informasi terkait barang bukti berupa suara. [1] PRAAT dapat diaplikasikan sebagai penelitian dalam pengajaran (kelas) dengan konsep CALL (computer assisted language learning) sebagai medianya.…”
Penelitian ini menitikberatkan pada studi kasus sederhana yang melibatkan dua orang pengujar, native dan non-native dalam mengucapkan kata-kata yang mengandung diftong. Bidang linguistik yang terkait adalah fonetik dan fonologi, dengan bantuan sebuah aplikasi PRAAT untuk menghitung frekuensi dan intensitas ujaran. Subjek pembahasan dalam penelitian ini adalah vokal rangkap/diftong (diphthong) yang terdapat dalam beberapa kata berbahasa Inggris. Yang difokuskan hanyalah unsur pitch dan intensity dari dua orang pengujar dalam mengujarkan kata-kata bervokal rangkap tersebut. Metode penelitian yang digunakan dalam mendapatkan perbandingan pitch dan intensity dari dua pengujar ini adalah deskriptif-analisis dengan penyuguhan data berupa tabel angka serta grafik. Penelitian ini melibatkan satu pengujar native dan satu pengujar non-native untuk mendapatkan hasil yang bisa diperbandingkan. Metode pengambilan data menggunakan PRAAT dengan file audio sebagai sumber data utama. Hasil dari penelitian ini menunjukkan bahwa pengujaran diftong dengan nilai pitch tertinggi baik dari pengujar native maupun non-native terlihat pada saat pengujaran kata dengan diftong /ɔɪ/; frekuensinya adalah 216.8 Hz untuk native dan 301.1 Hz untuk pengujar non-native. Sedangkan untuk intensity, diftong /ɪə/ memiliki angka intensitas terbesar yaitu 78.36 untuk pengujar native dan 80.52 untuk pengujar non-native. Berdasarkan pengambilan sampel data suara dari dua orang pengujar, maka dapat disimpulkan bahwa diftong /ɔɪ/ memiliki frekuensi yang tertinggi dibandingkan lainnya. Dan, diftongp /ɪə/ memiliki angka intensitas tertinggi dibandingkan dengan diftong lainnya. Penelitian menggunakan PRAAT dengan memperbandingkan pengujar native dan non-native secara fonetis memberikan ruang penelitian baru di ranah Bahasa dan teknologi.
“…[10] Dalam bidang ilmu forensik, PRAAT juga dijadikan sebagai alat ukur kemiripan dan keakurasian suara untuk memperoleh informasi terkait barang bukti berupa suara. [1] PRAAT dapat diaplikasikan sebagai penelitian dalam pengajaran (kelas) dengan konsep CALL (computer assisted language learning) sebagai medianya.…”
Penelitian ini menitikberatkan pada studi kasus sederhana yang melibatkan dua orang pengujar, native dan non-native dalam mengucapkan kata-kata yang mengandung diftong. Bidang linguistik yang terkait adalah fonetik dan fonologi, dengan bantuan sebuah aplikasi PRAAT untuk menghitung frekuensi dan intensitas ujaran. Subjek pembahasan dalam penelitian ini adalah vokal rangkap/diftong (diphthong) yang terdapat dalam beberapa kata berbahasa Inggris. Yang difokuskan hanyalah unsur pitch dan intensity dari dua orang pengujar dalam mengujarkan kata-kata bervokal rangkap tersebut. Metode penelitian yang digunakan dalam mendapatkan perbandingan pitch dan intensity dari dua pengujar ini adalah deskriptif-analisis dengan penyuguhan data berupa tabel angka serta grafik. Penelitian ini melibatkan satu pengujar native dan satu pengujar non-native untuk mendapatkan hasil yang bisa diperbandingkan. Metode pengambilan data menggunakan PRAAT dengan file audio sebagai sumber data utama. Hasil dari penelitian ini menunjukkan bahwa pengujaran diftong dengan nilai pitch tertinggi baik dari pengujar native maupun non-native terlihat pada saat pengujaran kata dengan diftong /ɔɪ/; frekuensinya adalah 216.8 Hz untuk native dan 301.1 Hz untuk pengujar non-native. Sedangkan untuk intensity, diftong /ɪə/ memiliki angka intensitas terbesar yaitu 78.36 untuk pengujar native dan 80.52 untuk pengujar non-native. Berdasarkan pengambilan sampel data suara dari dua orang pengujar, maka dapat disimpulkan bahwa diftong /ɔɪ/ memiliki frekuensi yang tertinggi dibandingkan lainnya. Dan, diftongp /ɪə/ memiliki angka intensitas tertinggi dibandingkan dengan diftong lainnya. Penelitian menggunakan PRAAT dengan memperbandingkan pengujar native dan non-native secara fonetis memberikan ruang penelitian baru di ranah Bahasa dan teknologi.
“…Dengan menggunakan standar kecocokan 20 kata yang diacu oleh FBI maka hasil analisis menunjukkan bahwa barang bukti digital audio memiliki kesamaan dengan sampling audio yang direkam. (Aligarh, Hidayanto, Si, 2016) melakukan pemeriksaan forensika audio untuk voice recognition dengan metode komparasi, yaitu membandingkan suara barang bukti (unknown samples) dengan suara yang direkam sebagai pembanding (known samples). Teori voice recognition tersebut menganalisis statistik pitch, formant, bandwith dan spectogram.…”
Rekaman suara merupakan alat bukti yang dapat digunakan untuk mengungkapkan suatu tindak pidana, akan tetapi dengan perkembangan teknologi terdapat banyak macam fitur terbaru dari aplikasi perekam suara itu sendiri. Salah satunya adalah dengan aplikasi voice changer yang dapat merubah pitch pada rekaman suara. Penelitian ini dilakukan untuk mengetahui tingkat pengaruh dari perubahan nilai pitch pada rekaman suara. Dari hasil penelitian ini diperoleh bahwa rekaman suara yang telah dirubah nilai pitchnya menggunakan aplikasi voice changer masih memiliki tingkat identik yang cukup tinggi. Akan tetapi untuk analisis pitch pada rekaman suara tidak satupun yang memiliki keidentikan, sehingga untuk kasus rekaman suara yang telah dirubah nilai pitchnya analisis pitch pada rekaman suara tidak dapat digunakan. Sedangkan untuk analisis formant dan spectogram masih dapat digunakan untuk menentukan keidentikan rekaman suara.
“…However, so far, previous research related to audio or voice has mainly analysed the human voice. These studies include research that discusses the comparison of voice recording similarity signal [12], voice changer [13], voice verification [14] [15], voice identification [16] [17] [18], a comparison of methods, and improved sound accuracy [19] [20] to determine the characteristics of a sound. Meanwhile, this research focuses more on making comparisons between live voice (human voice) and artificial voice (google voice) to determine the similarities between the two using audio forensic techniques and several other methods.…”
Audio forensics is the application of science and scientific methods in handling digital evidence in the form of audio. In this regard, the audio supports the disclosure of various criminal cases and reveals the necessary information needed in the trial process. So far, research related to audio forensics is more on human voices that are recorded directly, either by using a voice recorder or voice recordings on smartphones, which are available on Google Play services or iOS Store. This study compares the analysis of live voices (human voices) with artificial voices on Google Voice and other artificial voices. This study implements the audio forensic analysis, which involves pitch, formant, and spectrogram as the parameters. Besides, it also analyses the data by using feature extraction using the Mel Frequency Cepstral Coefficient (MFCC) method, the Dynamic Time Warping (DTW) method, and applying the K-Nearest Neighbor (KNN) algorithm. The previously made live voice recording and artificial voice are then cut into words. Then, it tests the chunk from the voice recording. The testing of audio forensic techniques with the Praat application obtained similar words between live and artificial voices and provided 40,74% accuracy of information. While the testing by using the MFCC, DTW, KNN methods with the built systems by using Matlab, obtained similar word information between live voice and artificial voice with an accuracy of 33.33%.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.