2016
DOI: 10.1007/978-3-662-49534-6_2
|View full text |Cite
|
Sign up to set email alerts
|

A Theoretical and Experimental Comparison of Filter-Based Equijoins in MapReduce

Abstract: Abstract. MapReduce has become an increasingly popular framework for large-scale data processing. However, complex operations such as joins are quite expensive and require sophisticated techniques. In this paper, we review state-of-the-art strategies for joining several relations in a MapReduce environment and study their extension with filter-based approaches. The general objective of filters is to eliminate non-matching data as early as possible in order to reduce the I/O, communication and CPU costs. We exa… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
1
1
1
1

Citation Types

0
16
0
7

Year Published

2017
2017
2021
2021

Publication Types

Select...
3
2
1

Relationship

1
5

Authors

Journals

citations
Cited by 13 publications
(23 citation statements)
references
References 28 publications
0
16
0
7
Order By: Relevance
“…Join thường được sử dụng trong các câu truy vấn dữ liệu tiêu biểu với chi phí và độ phức tạp lớn. Các dạng Join có thể là Join hai chiều (two-way join), Join đa chiều (multi-way join) [13], Join chuỗi (chain join) [14] và Join đệ quy (recursive join) [15][16][17]. Các truy vấn Join trên các tập dữ liệu càng trở nên phức tạp trong ngữ cảnh Big Data.…”
Section: Giới Thiệuunclassified
See 4 more Smart Citations
“…Join thường được sử dụng trong các câu truy vấn dữ liệu tiêu biểu với chi phí và độ phức tạp lớn. Các dạng Join có thể là Join hai chiều (two-way join), Join đa chiều (multi-way join) [13], Join chuỗi (chain join) [14] và Join đệ quy (recursive join) [15][16][17]. Các truy vấn Join trên các tập dữ liệu càng trở nên phức tạp trong ngữ cảnh Big Data.…”
Section: Giới Thiệuunclassified
“…Câu truy vấn Join đệ quy của một quan hệ cũng được xem như là một câu truy vấn bao đóng bắc cầu của quan hệ đó [17]. Trên thực tế, đã có rất nhiều thuật toán được thiết kế để tính bao đóng bắc cầu của một quan hệ trong cơ sở dữ liệu truyền thống như Naive [24], Semi-naive [1][2][3], Smart [27,28], Minimal evaluations [28], Warshall [30] và Warren [31].…”
Section: A Join đệ Quy Trong Môi Trường Mapreduceunclassified
See 3 more Smart Citations