Navegando por Assunto "Aprendizado de máquina"
Agora exibindo 1 - 8 de 8
Resultados por página
Opções de Ordenação
Trabalho de Curso - Graduação - Artigo Acesso aberto (Open Access) Análise preditiva e interpretação da classificação de malwares em sistemas android usando aprendizado de máquina(2024-10-15) AMARAL, Geovani da Silva do; MOREIRA, Caio Carvalho; http://lattes.cnpq.br/1370619943470585Este trabalho apresenta uma análise preditiva para a detecção de malwares em dispositivos Android usando Aprendizado de Máquina e métodos de explicabilidade para interpretar os resultados. Apos os pre-processamento, o conjunto de dados foi reduzido para 34.076 amostras e 179 características de chamadas de sistema e permissões. Entre 13 classificadores avaliados, o eXtreme Gradient Boosting (XGBoost) mostrou-se o mais eficiente, com métricas de acurácia, precisão, recall e F1-Score de aproximadamente 94%, e Tempo de Treinamento de 1,48s. O método SHapley Additive exPlanations (SHAP) foi utilizado para explicar as decisões do modelo, o que revelou chamadas de sistema e permissões sensíveis, como READ PHONE STATE, SYSTEM ALERT WINDOW, SEND SMS, ACCESS WIFI STATE, getpriority e getrlimit, fortemente associados a malwares.Trabalho de Curso - Graduação - Monografia Acesso aberto (Open Access) Analyzing the impact of dimensionality reduction over human intestinal absorption prediction through machine learning(2022-02) CARDOSO, Eduardo Gil Serrão; RODRIGUES, Caio Marcos Flexa; http://lattes.cnpq.br/7685787461835870; SALES JÚNIOR, Claudomiro de Souza de; http://lattes.cnpq.br/4742268936279649Uma propriedade desejável no desenvolvimento de drogas é entrega oral. A triagem virtual de compostos químicos de acordo com sua biodisponibilidade oral com inteligência computacional pode acelerar a predição de sua absorção intestinal humana (HIA). A despeito da existência de vários estudos almejando predizer a permeabilidade intestinal de compostos químicos, nenhum tentou avaliar o impacto do uso de propriedades fisicoquímicas e estruturais relacionadas à biodisponibilidade oral com técnicas de redução de dimensionalidade (DR) e aprendizado de máquina (ML). Este estudo de caso apresenta uma análise sobre o impacto da aplicação de técnicas de redução de dimensionalidade tais como Análise de Componentes Principais (PCA), PCA baseado em Kernel (KPCA), Ivis, Aproximação e Projeção de Manifold Uniforme (UMAP) e Decomposição de Valor Singular Truncado(TSVD), conjuntamente com preditores de ML tais como Redes Neurais Artificiais (ANN), K-Vizinhos mais Próximos (KNN), Máquina de Vetores de Suporte (SVM) e Floresta Aleatória (RF) na predição de HIA de pequenas moléculas, dando foco ao comportamento dos modelos conforme a dimensionalidade varia. Os resultados demonstram que, apesar de reduzir a dimensionalidade em mais de 90%, os modelos de menor dimensionalidade para o KNN, RF e SVM ainda apresentaram resultados competitivos, demonstrando a viabilidade e o potencial de técnicas de DR enquanto etapa de pré-processamento.Trabalho de Curso - Graduação - Monografia Acesso aberto (Open Access) Aprendizado federado baseado em múltiplas árvores de decisão para aplicações iot com computação de borda cooperativa(2024) BARBOSA, Lucas Nobre; RIKER, André Figueira; http://lattes.cnpq.br/2949449810540513A Internet das Coisas (IoT) tem dependido de nós de computação em borda para descentralizar a computação e trazer mais poder de processamento próximo aos dispositivos IoT, como sensores e atuadores. Os nós de compu tação de borda da IoT têm mais poder de processamento de dados e recursos energéticos do que os dispositivos IoT regulares que visam monitorar e atuar no ambiente. No entanto, em geral, os nós de computação de borda não são pro jetados para treinamento intensivo de Aprendizado de Máquina (ML) ou para hospedar grandes modelos de ML. Nas arquiteturas de rede IoT atuais, existem múltiplos nós de computação de borda estrategicamente localizados perto de um grande número de dispositivos, onde cada um dos nós de computação de borda tem acesso a parte dos dados produzidos por toda a rede IoT. Neste cená rio, cada nó de computação de borda executa modelos de ML leves em seu con junto de dados local. Neste artigo, propomos uma solução, chamada FEderated Decison Tree (FEDT), Árvore de Decisão Federada, que agrega o aprendizado produzido por múltiplas árvores de decisão de nós de borda cooperativos, se guindo os princípios de aprendizado federado. Apresentamos quatro estratégias de aprendizado federado diferentes e demonstramos que o FEDT pode alcançar cerca de 80% de um modelo de ML centralizado em termos de correlação de Pearson.Trabalho de Curso - Graduação - Monografia Acesso aberto (Open Access) Um classificador supervisionado para relatos policiais no Estado do Pará(2022-12-16) MATOS, Helder Mateus dos Reis; SANTOS FILHO, Reginaldo Cordeiro dos; http://lattes.cnpq.br/9157422386900321Os diversos setores públicos estão se voltando para as tendências de aplicações de ciência e mineração de dados, muito em razão do aumento exponencial do volume de seus dados ao longo dos últimos anos, da consequente demanda cada vez mais frequente por informações escondidas na massa de dados gerados a cada dia, e das soluções oferecidas por estas áreas do conhecimento na automação e melhoria de processos internos. A segurança pública tem um grande potencial de adquirir benefícios gerados por ferramentas de automação de extração de conhecimento em bases de dados, incluindo a classificação de textos inclusos em relatos policiais. Este trabalho descreve o desenvolvimento de um classificador supervisionado de relatos policiais, construído a partir do conhecimento extraído de bases de dados públicas de relatos policiais, para os anos entre 2019 e 2021, no estado do Pará, Brasil. Dentre as técnicas utilizadas, destacam-se o uso de da metodologia de mineração de dados CRISP-DM, Processamento de Linguagem Natural, vetorização de sequências de texto através de word embeddings e um modelo de aprendizado profundo baseado em Redes Neurais Convolucionais. Este modelo alcançou uma acurácia geral de aproximadamente 78% para a predição de 463 classes únicas relacionadas com segurança pública. Tais classes incluem categorias derivadas da legislação brasileira, como homicídio, furto, roubo, estupro e ameaça, com a inclusão de classes específicas ao ambiente policial, como a comunicação de óbito, a morte por intervenção de agente do estado e o tráfico de drogas. O modelo resultante também foi usado para melhoria de processos estatísticos de analistas criminais, tanto em termos quantitativos, quanto qualitativos, através da implantação de uma ferramenta de classificação de relatos policiais diários do estado do Pará, reduzindo os esforços diários de processamento e consolidação dos dados em até 5 horas.Trabalho de Curso - Graduação - Monografia Acesso aberto (Open Access) Minha casa, mas e meu emprego? A relação entre a localização dos empreendimentos do PMCMV e as oportunidades de trabalho disponíveis no entorno(2024-10-29) SILVA, Lucas Eduardo da Conceição; SANTOS, Victor Igor Monteiro dos; MOREIRA, Frederico Guilherme Pamplona; http://lattes.cnpq.br/3186899504227811Nos países em desenvolvimento, programas de habitação social, como o Programa Minha Casa, Minha Vida (PMCMV), têm sido centrais para transformar o ambiente urbano e oferecer moradias acessíveis a populações de baixa renda. Embora contribuam para reduzir o déficit habitacional, muitos empreendimentos estão sendo inseridos em áreas periféricas com baixa oferta de empregos e serviços públicos, o que pode acentuar a segregação socioespacial e limitar as oportunidades econômicas dos moradores, colocando em questão a real efetividade deste programa. Assim, este estudo tem como objetivo analisar a relação entre o número de unidades habitacionais contratadas (UHC) do PMCMV e a disponibilidade de empregos nas proximidades dos empreendimentos na região metropolitana de Belém. Para isso, foram utilizadas abordagens de aprendizado de máquina e modelos de regressão linear pelo método de mínimos quadrados ordinários (MQO), que incluíram variáveis de controle e efeitos fixos para município e ano, além de especificações espaciais, como os modelos Spatial Autoregressive Model (SAR) e Spatial Error Model (SEM), para capturar influências socioeconômicas e geográficas compartilhadas. Nesse contexto, serão investigados os padrões de inserção desses empreendimentos em relação à oferta de empregos no entorno e como essa dinâmica varia conforme as faixas de renda dos beneficiários. Os resultados mostraram que a Faixa 1 do PMCMV requer mais área de empreendimento quando comparado com as faixas 2 e 3, e a área do empreendimento modera positivamente a relação entre os vínculos de empregos ativos as unidades habitacionais contratadas.Trabalho de Curso - Graduação - Monografia Acesso aberto (Open Access) On reducing the dimensionality of small molecule data for visual-exploratory analysis in human intestinal absorption prediction(2022-02-21) MOREIRA, Igor Matheus Souza; OLIVEIRA, Ewerton Cristhian Lima de; http://lattes.cnpq.br/8998575507999079; SALES JÚNIOR, Claudomiro de Souza de; http://lattes.cnpq.br/4742268936279649Biodisponibilidade oral é uma propriedade desejável no desenvolvimento de drogas. A triagem virtual de compostos de acordo com suas propriedades com inteligência computacional pode acelerar a predição de sua absorção intestinal humana (HIA). A despeito da existência de estudos almejando predizer a HIA de compostos, técnicas de redução de dimensionalidade (DR) que extraem características são raramente empregadas para possibilitar análises visual-exploratórias e pré-processar dados para algoritmos de aprendizado de máquina (ML). Este trabalho aplica seis projetores de DR (ivis, KPCA, PCA, PCS, TSVD e UMAP) para produzir projeções bi e tridimensionais conjuntamente com quatro classificadores de ML (KNN, MLP, RF e SVM) na predição de HIA de pequenas moléculas, um esforço que englobou a análise de cinquenta e dois pipelines. Os resultados demonstram que, a despeito de reduzir a dimensionalidade em mais de 98%, os pipelines envolvendo DR ainda apresentaram resultados competitivos enquanto também facilitaram a visualização, demonstrando a viabilidade e o potencial de técnicas de DR via extração de características como uma etapa automatizada de pré-processamento.Trabalho de Curso - Graduação - Artigo Acesso aberto (Open Access) Predição de desempenho de aplicações CUDA utilizando aprendizado de máquina e características de pré-execução(2024-07-11) SIQUEIRA, Luan Ribeiro; GONZÁLEZ, Marcos Tulio Amaris; http://lattes.cnpq.br/9970287865377659Com a evolução das unidades de processamento gráfico (GPU), as aplicações de computação paralela estão se tornando cada vez mais complexas. Predizer o desempenho dessas aplicações ajuda desenvolvedores a otimizar seus algoritmos escalonadores na distribuição de seus trabalhos. Neste trabalho, foram desenvolvidos e avaliados modelos de aprendizado de maquina para predizer o desempenho de aplicações CUDA utilizando características de pre-execução. Foram comparados os modelos Ridge Regression, Random Forest e Decision Tree em nove aplicações CUDA, utilizando a métrica MAPE. Os resultados mostram que o Decision Tree obteve os menores valores de MAPE, enquanto o Random Forest apresentou um desempenho consistente. Já o Ridge Regression teve desempenho variável devido a sua limitação em lidar com multicolinearidade. O estudo enfatiza a importância considerar as características específicas da aplicação e da GPU ao fazer predições de desempenhoTrabalho de Curso - Graduação - Monografia Acesso aberto (Open Access) Sistema de classificação de imagens utilizando uma rede neural Squeezenet embarcada em uma Raspberry Pi(2023-07-10) SILVA, Kamilla Taiwhscki Barros; SILVA, Cleison Daniel; http://lattes.cnpq.br/1445401605385329; https://orcid.org/0000-0001-8280-2928A Visão Computacional é um campo da Inteligência Artificial caracterizado pelo estudo das informações existentes em imagens, identificando suas características intrínsecas. O estudo da Visão Computacional tem como objetivo a criação de modelos artificiais que imitem as habilidades analíticas da visão humana, para isso são utilizados conceitos de Processamento Digital de Imagens para extrair informações a serem estudadas. Realizar essas operações exige uma grande quantidade de dados para ser efetiva e para isso necessitam-se de algoritmos capazes de processarem essas informações. Nesse contexto, algoritmos de Aprendizado Profundo são ideais para trabalharem com uma imensa quantidade de dados, visto estes possuem eficiência e eficácia para tal. Dessa forma, o uso de Redes Neurais para este propósito se torna bastante adequado, pois essa ferramenta permite que seja possível aprender a partir de um conjunto de exemplos de forma que a generalização dos dados seja adequada aos exemplos fornecidos. No caso de imagens, Redes Neurais Convolucionais são o estado da arte na área de Visão Computacional, sendo possível observar diversas aplicações que envolvem a classificação de imagens, identificação de objetos e reconhecimento de faces. Porém, esses algoritmos são robustos e apresentam uma complexa implementação, possuindo diversos parâmetros livres que são determinados durante a execução, exigindo que o hardware que o comporta possua elevada capacidade computacional para funcionar sem erros ou com tempo de execução exacerbado. Para o caso de sistemas embarcados que necessitam de baixo custo de implementação, computadores de placa única são comumente adotados, considerando que tais hardwares podem ser aplicados em diversos contextos e possuem baixo custo de execução. Todavia, esses dispositivos são restritos em relação ao poder computacional e é necessário um grande estudo das técnicas que permitam a execução de algoritmos complexos em seus hardwares. Dessa forma, este trabalho tem o intuito de apresentar um exemplo de implementação de um classificador de imagens em um Computador de Placa Única com uma Rede Neural Convolucional (CNN) sendo executada. São expostos os conceitos de CNNs e de Processamento Digital de Imagens utilizados durante o desenvolvimento do projeto. O classificador desenvolvido captura imagens de dígitos manuscritos e classifica-os em tempo real em 10 classes distribuídas de 0 a 9. Além disso, demonstra-se as técnicas de Processamento Digital de Imagens desenvolvidas, que utilizam o Filtro Gaussiano para aproximar as imagens utilizadas para o treinamento da CNN e as imagens utilizadas durante o teste do classificador embarcado. Os resultados da classificação do sistema demonstram-se razoáveis para o cenário estabelecido, sendo resultados relevantes para o trabalho em questão, em especial ao que diz respeito a acurácia de classificação do sistema de 76% e uma precisão de 80% ao classificar as imagens.