Navegando por Assunto "Processamento de linguagem natural"
Agora exibindo 1 - 2 de 2
Resultados por página
Opções de Ordenação
Trabalho de Curso - Graduação - Monografia Acesso aberto (Open Access) Compreendendo a dinâmica emocional em projetos de código aberto: uma análise das issues(2024) MIRANDA, Fabrício de Souza; PINTO, Gustavo Henrique Lima; http://lattes.cnpq.br/1631238943341152; https://orcid.org/0000-0001-7598-2799O principal meio de comunicac¸˜ao em projetos de c´odigo aberto ocorre atrav´es das ”issues”, que, embora n˜ao sejam destinadas a expressar emoc ¸˜oes e sentimentos, podem acabar por inclu´ı-las nas interac ¸˜oes entre co laboradores. Neste estudo, conduzimos uma an´alise para avaliar a toxicidade nos coment´arios das ”issues” em projetos open source. Para isso, criamos um banco de dados contendo autores identificados como t´oxicos e, com base nessa informac ¸˜ao, mapeamos todas as ”issues” nas quais estes autores estiveram en volvidos. Posteriormente, submetemos essas ”issues” `a API do IBM Watson Natural Language para uma an´alise mais detalhada. Ap´os a classificac¸˜ao re alizada pela API do IBM Watson Natural Language, selecionamos um subcon junto para realizar uma an´alise manual adicional.Trabalho de Curso - Graduação - Artigo Acesso aberto (Open Access) Uma metodologia em cascata de quatro etapas para classificar códigos NCM usando técnicas de PLN(2022-09-30) PINHEIRO, Pedro Luiz Braga; GONZÁLEZ, Marcos Tulio Amaris; http://lattes.cnpq.br/9970287865377659Esse trabalho tem como objetivo desenvolver um processo para classificar as descrições dos produtos presentes nas Notas Ficais eletrônicas (NF-e). Essa classificação e feita sobre os 8 dígitos da Nomenclatura Comum do Mercosul (NCM), separado em 4 partes, Capítulo, Posição, Subposição e item/Subitem. A classificação foi realizada utilizando o algoritmo de Máquina de Vetores de Suporte (SVM) e o algoritmo de Naive Bayes em conjunto com as técnicas de Processamento Natural de Linguagem (PNL), para o processamento de uma base de dados de 340.000 produtos distintos. Os dados foram divididos em 80% treinamento e 20% teste e obteve-se um acurácia de 90% para um total de 98 classes.