2015 International Conference on Circuits, Power and Computing Technologies [ICCPCT-2015] 2015
DOI: 10.1109/iccpct.2015.7159257
|View full text |Cite
|
Sign up to set email alerts
|

Performance evaluation of association mining in Hadoop single node cluster with Big Data

Abstract: Data Mining means extracting unique information from pre-existing large data sets. Data Mining techniques have been applied to almost all areas such as Education, health care, Stock market, etc. Since the data size is getting increased exponentially, maintaining high performance plays a major challenge in the field of data mining. The data may be in structured format or unstructured format and hence the research on extracting the frequent pattern which is repeated in an iterative fashion seems to be really dif… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
1
1
1

Citation Types

0
1
0
2

Year Published

2016
2016
2023
2023

Publication Types

Select...
3
2
2

Relationship

0
7

Authors

Journals

citations
Cited by 7 publications
(3 citation statements)
references
References 13 publications
(8 reference statements)
0
1
0
2
Order By: Relevance
“…Asbern and Asha [16] explored different algorithms for FIM that operate on big data using the MapReduce paradigm. Kumar and Mohbey [17] investigated different parallel FIM algorithms that are executed in distributed environments.…”
Section: Fig 2 Map Reduce Frame Work In Hadoopmentioning
confidence: 99%
“…Asbern and Asha [16] explored different algorithms for FIM that operate on big data using the MapReduce paradigm. Kumar and Mohbey [17] investigated different parallel FIM algorithms that are executed in distributed environments.…”
Section: Fig 2 Map Reduce Frame Work In Hadoopmentioning
confidence: 99%
“…Dentre outros benefícios à comunidade científica, algumas bases de dados para realizar a tarefa de agrupamento são disponibilizadas, http://cs.joensuu.fi/sipu/datasets/. 7 Weka é uma coleção de algoritmos de aprendizado de máquina utilizados em tarefas de mineração de dados. Os algoritmos aplicados diretamente em um conjunto de dados (dataset) ou ser chamado de um código Java [20].…”
Section: Mineração Em Grandes Massas De Dados Utilizando Hadoop Mapreunclassified
“…Ferramentas convencionais como Sistemas de Gerenciamento de Banco de Dados Relacional não conseguem gerenciar Big Data com disponibilidade e desempenho eficientes [48] [19]. Hadoop é um projeto open source criado pela Apache Software Fundation que vem sendo utilizado como ferramenta no contexto Big Data [7]. A utilização dessa ferramenta no contexto Big Data é justificada pelo fornecimento de um framework de processamento em paralelo com tolerância a falhas, fácil escalabilidade e utilização (Hadoop MapReduce) [34] [52], além de um poderoso sistema de arquivos robusto e distribuído (Hadoop Distributed File System (HDFS)).…”
Section: Introductionunclassified