Proceedings of the 51st Hawaii International Conference on System Sciences 2018
DOI: 10.24251/hicss.2018.224
|View full text |Cite
|
Sign up to set email alerts
|

Fine Grained Approach for Domain Specific Seed URL Extraction

Abstract: Domain Specific Search Engines are expected to provide relevant search results. Availability of enormous number of URLs across subdomains improves relevance of domain specific search engines. The current methods for seed URLs can be systematic ensuring representation of subdomains. We propose a fine grained approach for automatic extraction of seed URLs at subdomain level using Wikipedia and Twitter as repositories. A SeedRel metric and a Diversity Index for seed URL relevance are proposed to measure subdomain… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
2

Citation Types

0
0
0
2

Year Published

2018
2018
2023
2023

Publication Types

Select...
2
2

Relationship

0
4

Authors

Journals

citations
Cited by 4 publications
(2 citation statements)
references
References 20 publications
(31 reference statements)
0
0
0
2
Order By: Relevance
“…Önerilen tarayıcı taramaya köşe noktalarını oluşturan ve benzersiz olan URL' ler ile başlamıştır. Sanagavarapu ve arkadaşları [19], Wikipedia ve Twitter' ı kullanarak tohum URL' lerin otomatik olarak çıkarılması için puanlama (SeedRel) metriği ve URL' lerin alaka düzeyini belirlemek için çeşitlilik indeksi kullanan bir yaklaşım önermişlerdir. Buna ek olarak Sanagavarapu ve ark.…”
Section: Tohum Url Seçimiunclassified
“…Önerilen tarayıcı taramaya köşe noktalarını oluşturan ve benzersiz olan URL' ler ile başlamıştır. Sanagavarapu ve arkadaşları [19], Wikipedia ve Twitter' ı kullanarak tohum URL' lerin otomatik olarak çıkarılması için puanlama (SeedRel) metriği ve URL' lerin alaka düzeyini belirlemek için çeşitlilik indeksi kullanan bir yaklaşım önermişlerdir. Buna ek olarak Sanagavarapu ve ark.…”
Section: Tohum Url Seçimiunclassified
“…Ayrıca tohum URL seçiminde en çok kullanılan yöntemler; manuel seçim [7][8][9], DMOZ ve curlie.org [10,11] gibi açık kaynak dizinlerinden yapılan seçim ve Twitter [12,13] gibi sosyal medyadaki kullanıcıların paylaştıkları URL'ler üzerinden seçimlerdir. Bunlara ek özellikle odaklı tarayıcılarda Google ve Yahoo gibi arama motorları ile yapılan aramalarda, ortaya çıkan URL'leri, tohum URL olarak seçen çalışmalarda mevcuttur [14][15][16][17].…”
Section: Tohum Url Seçi̇mi̇unclassified