2019
DOI: 10.1016/j.procs.2019.12.124
|View full text |Cite
|
Sign up to set email alerts
|

Web Data Extraction Approach for Deep Web using WEIDJ

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
2
2
1

Citation Types

0
1
0
3

Year Published

2020
2020
2024
2024

Publication Types

Select...
4
3
1

Relationship

0
8

Authors

Journals

citations
Cited by 12 publications
(7 citation statements)
references
References 25 publications
0
1
0
3
Order By: Relevance
“…Additionally, it should be mentioned that the Internet comprises of numerous superfluous components. Such redundant material on webpages (the so-called "noisy information") can greatly degrade the performance of the data extraction process (Ahmad Sabri et al, 2019). The key is to isolate and divest unnecessary information so that the collected data is as full as feasible in quality (Bartuś et al, 2017;Olszak & Zurada, 2020).…”
Section: Properties Of Data Acquisition Toolsmentioning
confidence: 99%
“…Additionally, it should be mentioned that the Internet comprises of numerous superfluous components. Such redundant material on webpages (the so-called "noisy information") can greatly degrade the performance of the data extraction process (Ahmad Sabri et al, 2019). The key is to isolate and divest unnecessary information so that the collected data is as full as feasible in quality (Bartuś et al, 2017;Olszak & Zurada, 2020).…”
Section: Properties Of Data Acquisition Toolsmentioning
confidence: 99%
“…Merujuk Kamus Besar Bahasa Indonesia, istilah "web" sudah diserap ke dalam bahasa Indonesia yang artinya adalah "sistem untuk mengakses, memanipulasi, dan mengunduh dokumen hipertaut yang terdapat dalam komputer yang dihubungkan melalui internet" [23]. Web data extraction adalah penggunaan perangkat teknologi untuk secara otomatis mengekstrasi dan mengorganisasikan data yang berasal dari web sehingga kemudian data tersebut dapat dianalisis lebih lanjut [24]. Beberapa istilah lain yang sering dipertukarkan dengan istilah ini adalah web scraping, web crawling ataupun web harvesting.…”
Section: Web Data Extractionunclassified
“…Aspek ini perlu mendapatkan perhatian dan pertimbangan dalam melakukan web data extraction. Beberapa pendapat terkait ini (lihat misalnya: [16,41,42,43]) web data extraction harus dilakukan dengan membaca syarat dan ketentuan yang dinyatakan oleh pemilik situs atau laman web. Hal ini untuk menjaga munculnya risiko tuntutan hukum dari pengelola situs atau laman web yang datanya diekstraksi.…”
Section: B Web Data Extractionunclassified
“…Teknik ini jika dibandingkan metode pertama akan lebih mudah jika auditor melakukan ekstraksi data terhadap banyak laman web karena teknik ini memungkinkan ada iterasi atas perhatian pengambilan data dengan URL yang berubah-ubah sesuai dengan parameter yang dimasukkan ke dalam URL. Dengan catatan, teknik ini tidak bisa digunakan terhadap situs web yang menyimpan parameter pencarian dalam URL-nya dengan metode POST atau laman web yang mengandung CSS maupun JavaScript (lihat misalnya: [41,42]). Secara teknis, cara ini memerlukan beberapa langkah untuk mengubah script yang telah dibuatkan secara otomatis oleh Power Query dengan cara menambahkan Invoke Custom Function dan membuat sebuah Table yang isinya adalah parameter tanggal kurs pajak sesuai dengan rentang waktu yang diinginkan.…”
Section: Eksperimen Dan Analisisunclassified
See 1 more Smart Citation