2020 International Conference on Field-Programmable Technology (ICFPT) 2020
DOI: 10.1109/icfpt51103.2020.00040
|View full text |Cite
|
Sign up to set email alerts
|

A Design Exploration of Scalable Mesh-based Fully Pipelined Accelerators

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
2
1
1
1

Citation Types

0
3
0
15

Year Published

2021
2021
2022
2022

Publication Types

Select...
4
2

Relationship

2
4

Authors

Journals

citations
Cited by 8 publications
(21 citation statements)
references
References 8 publications
0
3
0
15
Order By: Relevance
“…O algoritmo de dupla travessia (YOTT) mostrou ser possível melhorar a qualidade sem degradar o tempo de execuc ¸ão. A Tabela 3 apresenta os resultados médios para o conjunto de benchmarks 1 do YOTT100 (100 -instâncias de soluc ¸ões) comparado com o algoritmo de SA [Carvalho et al 2020] de 10, 100 e 1000 instâncias de soluc ¸ões. Os resultados mostram que o YOTT foi melhor do que SA10 e SA100.…”
Section: Resultsunclassified
See 2 more Smart Citations
“…O algoritmo de dupla travessia (YOTT) mostrou ser possível melhorar a qualidade sem degradar o tempo de execuc ¸ão. A Tabela 3 apresenta os resultados médios para o conjunto de benchmarks 1 do YOTT100 (100 -instâncias de soluc ¸ões) comparado com o algoritmo de SA [Carvalho et al 2020] de 10, 100 e 1000 instâncias de soluc ¸ões. Os resultados mostram que o YOTT foi melhor do que SA10 e SA100.…”
Section: Resultsunclassified
“…Estes algoritmos foram utilizados para validar às duas abordagens de posicionamento propostas [Canesche et al 2020. Além disso, foram utilizados para validar uma nova versão de posicionamento com SA do nosso grupo de pesquisa [Carvalho et al 2020, Oliveira et al 2020. A sétima contribuic ¸ão foi a validac ¸ão dos algoritmos de travessia com uma implementac ¸ão em hardware [Vieira et al 2021].…”
Section: Contribuic ¸õEsunclassified
See 1 more Smart Citation
“…Considerando uma frequência de relógio de 300 Mhz dos FPGAs atuais, isto equivale a 500 ns. Entretanto, uma implementac ¸ão de SA [Carvalho et al 2020] em um processador com 16 núcleos requer apenas 50ns, ou seja, é um grande desafio criar uma nova soluc ¸ão em hardware mais rápida que as soluc ¸ões em software. Os resultados mostraram acelerac ¸ão na execuc ¸ão mas com perda de qualidade em comparac ¸ão com o VPR [Murray et al 2020] na opc ¸ão fast.…”
Section: Trabalhos Relacionadosunclassified
“…As abordagens com o SA geram resultados com qualidade, mas requerem um tempo de execuc ¸ão maior para uma melhor explorac ¸ão do espac ¸o de soluc ¸ões. Este artigo apresenta uma implementac ¸ão em hardware para o algoritmo SA, desenvolvido em FPGA, que reduz de 7 a 30 vezes o tempo do posicionamento em comparac ¸ão ao estado da arte [Carvalho et al 2020, Murray et al 2020]. As principais contribuic ¸ões são: (a) modelagem em pipeline do algoritmo SA; (b) Execuc ¸ão de uma iterac ¸ão completa do algoritmo com uma operac ¸ão de troca (swap) em apenas dois ciclos de relógio; (c) Uso de múltiplas threads para esconder a latência do pipeline; (d) Um simulador e um gerador de código para desenvolvimento de implementac ¸ões de SA em hardware; (e) Execuc ¸ão com múltiplas unidades de SA que pode reduzir o tempo de execuc ¸ão de 70 a 300 vezes em comparac ¸ão com a soluc ¸ão em software.…”
Section: Introduc ¸ãOunclassified