Alterando número máximo de acessos in-flight na memória da GPU, avaliando desempenho e consumo energético em ambiente simulado
PDF (Português (Brasil))

How to Cite

Zuquello, A. G., Beninca, R. de A., & Massago, Y. (2017). Alterando número máximo de acessos in-flight na memória da GPU, avaliando desempenho e consumo energético em ambiente simulado. ForScience, 5(3). https://doi.org/10.29069/forscience.2017v5n3.e261

Abstract

Este artigo descreve um experimento de desempenho e consumo energético de Graphics Processing Unit (GPU), Central Processing Unit (CPU) Memória Principal e Cache em ambiente simulado. Utilizou-se um conjunto de benchmarks para esta tarefa. Os resultados são baseados na alteração da configuração do parâmetro MaxInFlightMen da GPU. Esse parâmetro é responsável pelo número máximo de acesso simultâneo ao vetor de memória da GPU. Essas modificações refletiram diretamente na desempenho e consumo energético dos dispositivos, portanto é claro que houve uma redução no consumo de energia da CPU próximo de 1%, em contrapartida, perda de 2% no desempenho, na GPU obteve-se uma redução de 6% no consumo energético e 12% de redução no desempenho porque as memórias caches e principais não tiveram reduções significativas. Este experimento é relevante para provar como as arquiteturas atuais são otimizadas e como qualquer simples mudança paramétrica reflete no desequilíbrio dos dispositivos arquitetônicos.

Palavras-chave: Simulação. Consumo energético. Análise de desempenho. GPU. CPU. Memória. Cache. Arquiteturas.

Changing maximum number of in-flight accesses in the memory of the gpu, evaluating performance and energy consumption in a simulated environment 

Abstract

This article describes an experiment in performance and energy consumption of the GPU, CPU, Main Memory and Cache in a simulated environment. It was used a set of benchmarks for this task. The results are based on the changing the GPU MaxInFlightMem parameter setting. This parameter is responsible for the maximum number of simultaneous accesses to the memory of GPU vector. These changes directly reflected the performance and energy consumption of the devices, thus it is clear that there was a reduction in CPU power consumption close to 1%, in contrast, 2% loss in performance. GPU obtained a reduction  of 6% in energy consumption and 12% reduction in performance because the main and caches memories have not had significant reductions. This experience is relevant to prove how current architectures are optimized and as any simple parametric change reflects the imbalance of architectural devices.

Keywords: Simulation. Energy consumption. Performance analysis. GPU. CPU. Memory. Cache. Architectures.

https://doi.org/10.29069/forscience.2017v5n3.e261
PDF (Português (Brasil))

References

ADVANCED MICRO DEVICES (AMD). AMD RadeonTM HD 7970 Graphics. [©2013] Disponível em: <http://www.amd.com/enus/products/graphics/desktop/7000/7900>. Acesso em: 13 maio 2013.

GRAUER-GRAY, S.; POUCHET, L.-N. PolyBench/C: the polyhedral benchmark suite. Version 3.2. [Columbus, OH, 2012]. Disponível em: <http://web.cse.ohio-state.edu/~pouchet.2/software/polybench/>. Acesso em: 17 maio 2013.

GUPTA, S.; BABU, M. R. Performance analysis of GPU compared to singlecore and multicore CPU for natural language applications. International Journal of Advanced Computer Science andApplications (IJACSA), v. 2, n. 5, p. 50-53, 2011. Disponível em: <https://scholar.google.com/citations?view_op=view_citation&hl=en&user=pfSSNyMAAAAJ&citation_for_view=pfSSNyMAAAAJ:D_sINldO8mEC>. Acesso em: 17 maio 2013.

INTEL. IntelRCoreTM i7-3820 Processor (10MB cache, UP to 3.80 GHZ). [Santa Clara, CA, USA: Intel Corporation, 2013]. Disponível em: <http://ark.intel.com/products/63698/Intel-Core-i7-3820-Processor-10M-Cache-up-to-3_80-GHz>. Acesso em: 29 abr. 2013.

MULTI2SIM. The Multi2Sim simulation framework: a CPU-GPU Model for heterogeneous computing (For Multi2Sim v. 4.2). [2013]. 210 p. Disponível em: <http://www.multi2sim.org/downloads/m2s-guide-4.2.pdf>. Acesso em: 10 abr. 2013.

NVIDIA. Parallel programming and computing platform | CUDA | NVIDIA. 2013. Disponível em: <http://www.nvidia.com/object/cuda_home_new.html>. Acesso em: 5 de maio de 2013.

SHYAMKUMAR, T. et al. CACTI 5.1. HP Labs, Palo Alto, p. 1-74, Abr. 2008. Disponível em: <http://www.hpl.hp.com/techreports/2008/HPL-2008-20.html>. Acesso em: 28 abr. 2013.

STONE, J. E.; GOHARA, D.; SHI, G. OpenCL: a parallelProgramming Standard for heterogeneous computing systems. Computing in Science & Engineering, v. 12, n. 3, p. 66–73, Maio 2010. Disponível em: <http://dx.doi.org/10.1109/MCSE.2010.69>. Acesso em: 28 abr. 2013.