Performance evaluation of association mining in Hadoop single node cluster with Big Data

Asbern, A.; Asha, P.

doi:10.1109/iccpct.2015.7159257

Cited by 7 publications

(3 citation statements)

References 13 publications

(8 reference statements)

Supporting

Mentioning

Contrasting

Unclassified

Order By: Relevance

“…Asbern and Asha [16] explored different algorithms for FIM that operate on big data using the MapReduce paradigm. Kumar and Mohbey [17] investigated different parallel FIM algorithms that are executed in distributed environments.…”

Section: Fig 2 Map Reduce Frame Work In Hadoopmentioning

confidence: 99%

A Novel Nodesets-Based Frequent Itemset Mining Algorithm for Big Data using MapReduce

Sivaiah,

Rajeswara Rao

2023

Int. j. electr. comput. eng. syst. (Online)

View full text Add to dashboard Cite

Due to the rapid growth of data from different sources in organizations, the traditional tools and techniques that cannot handle such huge data are known as big data which is in a scalable fashion. Similarly, many existing frequent itemset mining algorithms have good performance but scalability problems as they cannot exploit parallel processing power available locally or in cloud infrastructure. Since big data and cloud ecosystem overcomes the barriers or limitations in computing resources, it is a natural choice to use distributed programming paradigms such as Map Reduce. In this paper, we propose a novel algorithm known as A Nodesets-based Fast and Scalable Frequent Itemset Mining (FSFIM) to extract frequent itemsets from Big Data. Here, Pre-Order Coding (POC) tree is used to represent data and improve speed in processing. Nodeset is the underlying data structure that is efficient in discovering frequent itemsets. FSFIM is found to be faster and more scalable in mining frequent itemsets. When compared with its predecessors such as Node-lists and N-lists, the Nodesets save half of the memory as they need only either pre-order or post-order coding. Cloudera's Distribution of Hadoop (CDH), a MapReduce framework, is used for empirical study. A prototype application is built to evaluate the performance of the FSFIM. Experimental results revealed that FSFIM outperforms existing algorithms such as Mahout PFP, Mlib PFP, and Big FIM. FSFIM is more scalable and found to be an ideal candidate for real-time applications that mine frequent itemsets from Big Data.

show abstract

Section: Fig 2 Map Reduce Frame Work In Hadoopmentioning

confidence: 99%

A Novel Nodesets-Based Frequent Itemset Mining Algorithm for Big Data using MapReduce

Sivaiah,

Rajeswara Rao

2023

Int. j. electr. comput. eng. syst. (Online)

View full text Add to dashboard Cite

show abstract

“…Dentre outros benefícios à comunidade científica, algumas bases de dados para realizar a tarefa de agrupamento são disponibilizadas, http://cs.joensuu.fi/sipu/datasets/. 7 Weka é uma coleção de algoritmos de aprendizado de máquina utilizados em tarefas de mineração de dados. Os algoritmos aplicados diretamente em um conjunto de dados (dataset) ou ser chamado de um código Java [20].…”

Section: Mineração Em Grandes Massas De Dados Utilizando Hadoop Mapreunclassified

“…Ferramentas convencionais como Sistemas de Gerenciamento de Banco de Dados Relacional não conseguem gerenciar Big Data com disponibilidade e desempenho eficientes [48] [19]. Hadoop é um projeto open source criado pela Apache Software Fundation que vem sendo utilizado como ferramenta no contexto Big Data [7]. A utilização dessa ferramenta no contexto Big Data é justificada pelo fornecimento de um framework de processamento em paralelo com tolerância a falhas, fácil escalabilidade e utilização (Hadoop MapReduce) [34] [52], além de um poderoso sistema de arquivos robusto e distribuído (Hadoop Distributed File System (HDFS)).…”

Section: Introductionunclassified

Mineração em Grandes Massas de Dados Utilizando Hadoop MapReduce e Algoritmos Bio-inspirados: Uma Revisão Sistemática

Menezes

Freitas

Parpinelli

2016

RITA

View full text Add to dashboard Cite

Resumo: A Área de Mineração de Dados tem sido utilizada em diversas áreasde aplicação e visa extrair conhecimento através da análise de dados. Nas últimas décadas, inúmeras bases de dados estão tendenciando a possuir grande volume, alta velocidade de crescimento e grande variedade. Esse fenômeno é conhecido como Big Data e corresponde a novos desafios para tecnologias clássicas como Sistema de Gestão de Banco de Dados Relacional pois não tem oferecido desempenho satisfatório e escalabilidade para aplicações do tipo Big Data. Ao contrário dessas tecnologias, Hadoop MapReduce é um framework que, além de provêr processamento paralelo, também fornece tolerância a falhas e fácil escalabilidade sobre um sistema de armazenamento distribuído compatível com cenário Big Data. Uma das técnicas que vem sendo utilizada no contexto Big Data são algoritmos bio-inspirados. Esses algoritmos são boas opções de solução em problemas complexos multidimensionais, multiobjetivos e de grande escala. A combinação de sistemas baseados em Hadoop MapReduce e algoritmos bio-inspirados tem se mostrado vantajoso em aplicações Big Data. Esse artigo apresenta uma revisão sistemática de trabalhos nesse contexto, visando analisar critérios como: tarefas de mineração de dados abordadas, algoritmos bio-inspirados utilizados, disponibilidade das bases utilizadas e quais características Big Data são tratadas nos trabalhos. Como resultado, esse artigo discute os critérios analisados e identifica alguns modelos de paralelização, além de sugerir uma direção para trabalhos futuros.

show abstract

Mining the Associated Patterns in Big Data Using Hadoop Cluster

Asha

Jacob

Pravin

et al. 2018

International Conference on Intelligent Data Communication Technologies and Internet of Things (ICICI) 2018

View full text Add to dashboard Cite

Performance evaluation of association mining in Hadoop single node cluster with Big Data

Cited by 7 publications

References 13 publications

A Novel Nodesets-Based Frequent Itemset Mining Algorithm for Big Data using MapReduce

A Novel Nodesets-Based Frequent Itemset Mining Algorithm for Big Data using MapReduce

Mineração em Grandes Massas de Dados Utilizando Hadoop MapReduce e Algoritmos Bio-inspirados: Uma Revisão Sistemática

Mining the Associated Patterns in Big Data Using Hadoop Cluster

Contact Info

Product

Resources

About