Navegando por Assunto "CUDA"
Agora exibindo 1 - 2 de 2
Resultados por página
Opções de Ordenação
Trabalho de Curso - Graduação - Monografia Acesso aberto (Open Access) Implementação do algoritmo PSO em CUDA utilizando técnicas da capacidade de computabilidade 6.1 para otimização de problemas de engenharia com restrições(2018-12-12) ALVARES, PauloVictor de Lima Sfair; MONTEIRO, Dionne Cavalcante; http://lattes.cnpq.br/4423219093583221O presente trabalho trata da implementação e análise do algoritmo de PSO (Otimização por Enxame de Partículas), algoritmo que abre possibilidade para a paralelização, em CUDA, utilizando um dos recursos da capacidade de computabilidade 6.1, a shared memory permitindo a diminuição da latência de comunicação entre o core CUDA e a memória. Com este trabalho, objetivou-se implementar o algoritmo de PSO de forma que o resultado obtido após a execução deste, fosse mais preciso, obtendo-se mais casas decimais de precisão no resultado, permitindo que aplicações que necessitem de uma precisão maior possam ser executadas com este algoritmo, além de melhorar o tempo de execução, utilizando a nova arquitetura das placas de vídeo NVidia GTX série 10, Pascal. Para a análise e comparação de resultados, foram utilizados resultados do trabalho produzido por Daniel Souza em 2014, e nos resultados obtidos, foi alcançada uma melhora, tanto na precisão, onde foi aumentado de 6 casas decimais confiáveis para 16 casas decimais confiáveis, quanto no tempo de execução do algoritmo, o que abre a possibilidade para que aplicações que necessitam de precisão extrema, como aplicações médicas e da biomedicina, possam ser executadas sem que o tempo de execução seja afetado.Trabalho de Curso - Graduação - Artigo Acesso aberto (Open Access) Predição de desempenho de aplicações CUDA utilizando aprendizado de máquina e características de pré-execução(2024-07-11) SIQUEIRA, Luan Ribeiro; GONZÁLEZ, Marcos Tulio Amaris; http://lattes.cnpq.br/9970287865377659Com a evolução das unidades de processamento gráfico (GPU), as aplicações de computação paralela estão se tornando cada vez mais complexas. Predizer o desempenho dessas aplicações ajuda desenvolvedores a otimizar seus algoritmos escalonadores na distribuição de seus trabalhos. Neste trabalho, foram desenvolvidos e avaliados modelos de aprendizado de maquina para predizer o desempenho de aplicações CUDA utilizando características de pre-execução. Foram comparados os modelos Ridge Regression, Random Forest e Decision Tree em nove aplicações CUDA, utilizando a métrica MAPE. Os resultados mostram que o Decision Tree obteve os menores valores de MAPE, enquanto o Random Forest apresentou um desempenho consistente. Já o Ridge Regression teve desempenho variável devido a sua limitação em lidar com multicolinearidade. O estudo enfatiza a importância considerar as características específicas da aplicação e da GPU ao fazer predições de desempenho