Anais Estendidos Do XXI Simpósio Em Sistemas Computacionais De Alto Desempenho (SSCAD Estendido 2020) 2020
DOI: 10.5753/wscad_estendido.2020.14093
|View full text |Cite
|
Sign up to set email alerts
|

Avaliação de Desempenho de um Workflow Científico para Experimentos de RNA-Seq no Supercomputador Santos Dumont

Abstract: Experimentos científicos em larga escala são considerados complexos devido à modelagem de suas atividades, execução e análises de grandes volumes de dados. Na bioinformática esses experimentos são modelados como workflows científicos utilizando conceitos de computação de alto desempenho e ciência de dados. Neste artigo apresentamos o workflow ParslRNA-Seq para experimentos de RNA-Seq e análises de desempenho das execuções realizadas no supercomputador Santos Dumont usando dados reais. Os resultados mostram uma mel… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
1

Citation Types

0
0
0

Year Published

2022
2022
2023
2023

Publication Types

Select...
1
1

Relationship

0
2

Authors

Journals

citations
Cited by 2 publications
(1 citation statement)
references
References 8 publications
(8 reference statements)
0
0
0
Order By: Relevance
“…As estimativas sugerem um ganho de tempo de processamento para cada pipeline de tarefas do workflow em cerca de 2 minutos, o que para um ambiente paralelo e distribuído com múltiplos usuários pode ser bastante significativo. [Cruz et al 2021] levou as execuc ¸ões do workflow científico ParslRNA-Seq a alcanc ¸arem um ganho em tempo computacional maior do que 65% em relac ¸ão a versão apresentada em [Cruz et al 2020], com três atividades (bowtie, htseq e deseq). No novo trabalho foram adicionadas 3 atividades (sort, split e merge) de forma estratégica sugerindo o uso da técnica de divisão e conquista: com o particionamento do dado, processamento paralelo de dados e combinac ¸ão de resultados gerando a diminuic ¸ão de um Tempo Total de Execuc ¸ão (TTE) de cerca de 3 dias para cerca de 24 minutos.…”
Section: Introduc ¸ãOunclassified
“…As estimativas sugerem um ganho de tempo de processamento para cada pipeline de tarefas do workflow em cerca de 2 minutos, o que para um ambiente paralelo e distribuído com múltiplos usuários pode ser bastante significativo. [Cruz et al 2021] levou as execuc ¸ões do workflow científico ParslRNA-Seq a alcanc ¸arem um ganho em tempo computacional maior do que 65% em relac ¸ão a versão apresentada em [Cruz et al 2020], com três atividades (bowtie, htseq e deseq). No novo trabalho foram adicionadas 3 atividades (sort, split e merge) de forma estratégica sugerindo o uso da técnica de divisão e conquista: com o particionamento do dado, processamento paralelo de dados e combinac ¸ão de resultados gerando a diminuic ¸ão de um Tempo Total de Execuc ¸ão (TTE) de cerca de 3 dias para cerca de 24 minutos.…”
Section: Introduc ¸ãOunclassified