2020
DOI: 10.24002/ijis.v2i2.3029
|View full text |Cite
|
Sign up to set email alerts
|

Web Scraping with HTML DOM Method for Data Collection of Scientific Articles from Google Scholar

Abstract: Abstrak. Google Scholar adalah layanan berbasis web untuk mencari literatur akademik. Berbagai jenis referensi yang dapat diakses contohnya adalah: makalah peer-review, tesis, buku, abstrak dan artikel dari penerbit akademik, komunitas profesional, pusat data pra-cetak, universitas dan organisasi akademik lainnya. Google Scholar menyediakan fitur pembuatan profil untuk setiap peneliti, pakar, dan dosen. Jumlah publikasi dari lembaga akademis bersama dengan data yang detail tentang publikasi artikel ilmiah dapa… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
1
1
1
1

Citation Types

0
6
0
6

Year Published

2021
2021
2023
2023

Publication Types

Select...
6
2
2

Relationship

0
10

Authors

Journals

citations
Cited by 17 publications
(12 citation statements)
references
References 7 publications
0
6
0
6
Order By: Relevance
“…Teknik mendapatkan informasi dari website secara otomatis tanpa harus menyalinnya secara manual. Web scraping berfokus dalam mendapatkan data dan informasi dapat berupa, teks, tautan dengan cara pengambilan dan ekstraksi untuk diambil data tertentu dari halaman tersebut agar bisa digunakan kembali oleh sistem lain maupun di analisis lebih lanjut (Arisandi et al, 2021;Flores et al, 2020;Rahmatulloh & Gunawan, 2020). Umumnya data yang diperoleh berupa laman web dokumen HTML dengan memilih bagian tertentu, kemudian di transformasi dari bentuk yang tidak terstruktur dalam format HTML menjadi format data terstruktur dan disimpan dalam format data tertentu (Priyanto & Ma'arif, 2018;Satriajati et al, 2021).…”
Section: Web Scraperunclassified
“…Teknik mendapatkan informasi dari website secara otomatis tanpa harus menyalinnya secara manual. Web scraping berfokus dalam mendapatkan data dan informasi dapat berupa, teks, tautan dengan cara pengambilan dan ekstraksi untuk diambil data tertentu dari halaman tersebut agar bisa digunakan kembali oleh sistem lain maupun di analisis lebih lanjut (Arisandi et al, 2021;Flores et al, 2020;Rahmatulloh & Gunawan, 2020). Umumnya data yang diperoleh berupa laman web dokumen HTML dengan memilih bagian tertentu, kemudian di transformasi dari bentuk yang tidak terstruktur dalam format HTML menjadi format data terstruktur dan disimpan dalam format data tertentu (Priyanto & Ma'arif, 2018;Satriajati et al, 2021).…”
Section: Web Scraperunclassified
“…Tidak seperti kegiatan web crawling yang mengunjungi seluruh situs yang berhubungan dengan situs utamanya, kegiatan web scraping hanya melakukan ekstraksi data tertentu saja dari situs yang dituju sesuai dengan kebutuhan (Setiawan et al, 2020). Hasil dari web scraping sendiri dapat dimanfaatkan kembali oleh sistem lain maupun dianalisis lebih lanjut (Rahmatulloh & Gunawan, 2020).…”
Section: Pendahuluanunclassified
“…Web Scraping adalah proses pengambilan sebuah dokumen semi-terstruktur dari internet, umumnya berupa halaman-halaman web dalam bahasa markup seperti HTML atau XHTML, dan menganalisis dokumen tersebut untuk diambil data tertentu dari halaman tersebut untuk digunakan bagi kepentingan lain [4]. Hasil dari web scraping dapat dimanfaatkan kembali oleh sistem lain dan dianalisis lebih lanjut [16].…”
Section: Definisi 221 Web Scrapingunclassified