Anais Do XV Brazilian E-Science Workshop (BRESCI 2021) 2021
DOI: 10.5753/bresci.2021.15789
|View full text |Cite
|
Sign up to set email alerts
|

Workflows Científicos de RNA-Seq em Ambientes Distribuídos de Alto Desempenho: Otimização de Desempenho e Análises de Dados de Expressão Diferencial de Genes

Abstract: Apresentamos uma versão do workflow científico ParslRNA-Seq para análises de experimentos de Expressão Diferencial de Genes, acoplada a ambientes de Computação de Alto Desempenho, que mostrou melhoras no tempo total de execução de até 70%. O desempenho ParslRNA-Seq foi validado por meio de uma análise comparativa de dados da EDG em cardiomiócitos de um experimento real de RNA-Seq. Finalmente, o artigo traz discussões sobre a eleição de quais modificações na modelagem do workflow levam à melhora do desempenho e… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
2
1
1
1

Citation Types

0
0
0
5

Year Published

2023
2023
2023
2023

Publication Types

Select...
1

Relationship

0
1

Authors

Journals

citations
Cited by 1 publication
(5 citation statements)
references
References 4 publications
(4 reference statements)
0
0
0
5
Order By: Relevance
“…Já usando o SSD, a execuc ¸ão dura em média cerca de 15 minutos. O tempo médio da atividade deseq é de cerca 1,4 minutos [Cruz et al 2021]. Ou seja, usando o Lustre o workflow leva cerca de 19 minutos para finalizar a execuc ¸ão e usando o SSD ele leva cerca de 17 minutos.…”
Section: Resultados E Análiseunclassified
See 4 more Smart Citations
“…Já usando o SSD, a execuc ¸ão dura em média cerca de 15 minutos. O tempo médio da atividade deseq é de cerca 1,4 minutos [Cruz et al 2021]. Ou seja, usando o Lustre o workflow leva cerca de 19 minutos para finalizar a execuc ¸ão e usando o SSD ele leva cerca de 17 minutos.…”
Section: Resultados E Análiseunclassified
“…O workflow passa então, a ser dividido em duas partes: a primeira, descrita na Figura 1(a); e, a segunda, descrita na Figura 1(b). O conjunto de dados de entrada utilizados são os mesmo de [Cruz et al 2021] e contém ao todo seis arquivos, pertencentes a um experimento real de sequenciamento RNA, com tamanhos variando entre 1.8 GB e 3.0 GB. O ambiente computacional utilizado foi o SDumont e foram alocados seis nós computacionais para execuc ¸ão do workflow, dos quais se compõem por duas CPUs Ivy Bridge Intel Xeon E5-2695v2 (12c @2.4GHz) e 64 GB de memória RAM e um SSD de 128 GB.…”
Section: Metodologiaunclassified
See 3 more Smart Citations