Navegando por Assunto "Processamento de linguagem natural"
Agora exibindo 1 - 3 de 3
Resultados por página
Opções de Ordenação
Trabalho de Curso - Graduação - Monografia Acesso aberto (Open Access) Academick: assistente de estudos para o ambiente acadêmico(2025-06-23) MELLO, Cláudio Klautau; MÜLLER, Ana Carolina Quintão Siravenha; http://lattes.cnpq.br/4383482501456728; https://orcid.org/0000-0001-6664-9847; KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha; http://lattes.cnpq.br/1596629769697284; https://orcid.org/0000-0001-7773-2080O surgimento dos Grandes Modelos de Linguagem (LLMs) criou oportunidades sem prece dentes para aprimorar os processos educacionais, no entanto, muitas institui¸c˜oes de ensino superior ainda n˜ao aproveitaram plenamente essas tecnologias. Este trabalho apresenta um sistema adaptativo de chatbot educacional que integra LLMs com Gera¸c˜ao Aumentada por Recupera¸c˜ao (RAG) para fornecer assistˆencia personalizada ao aprendizado. A principal inova¸c˜ao do sistema est´a em sua abordagem baseada em inten¸c˜oes, utilizando um modelo de classifica¸c˜ao personalizado baseado na arquitetura Snowflake/snowflake-arctic-embed-l v2.0 que alcan¸cou 97,6% de precis˜ao no conjunto de teste. Este classificador, treinado em um conjunto de dados bil´ıngue (portuguˆes e inglˆes), permite que o sistema identifique as inten¸c˜oes dos estudantes e ajuste dinamicamente sua estrat´egia de resposta. O sistema tamb´em apresenta um algoritmo inovador de processamento de PDF para extra¸c˜ao e indexa¸c˜ao eficiente de materiais educacionais. O chatbot pode ser rapidamente implantado para apoiar diversos cen´arios educacionais, desde a compreens˜ao de livros did´aticos at´e a an´alise de artigos acadˆemicos, exigindo apenas os materiais fonte em formato PDF e uma configura¸c˜ao m´ınima. Ao combinar esses componentes, o chatbot fornece respostas contextualizadas, cita com precis˜ao os materiais fonte e adapta seu estilo de intera¸c˜ao com base na inten¸c˜ao identificada do estudante. Este trabalho demonstra como a moderna tec nologia LLM pode ser efetivamente integrada em ferramentas educacionais para aprimorar a experiˆencia de aprendizagem, mantendo considera¸c˜oes pr´aticas de implementa¸c˜ao.Trabalho de Curso - Graduação - Monografia Acesso aberto (Open Access) Compreendendo a dinâmica emocional em projetos de código aberto: uma análise das issues(2024) MIRANDA, Fabrício de Souza; PINTO, Gustavo Henrique Lima; http://lattes.cnpq.br/1631238943341152; https://orcid.org/0000-0001-7598-2799O principal meio de comunicac¸˜ao em projetos de c´odigo aberto ocorre atrav´es das ”issues”, que, embora n˜ao sejam destinadas a expressar emoc ¸˜oes e sentimentos, podem acabar por inclu´ı-las nas interac ¸˜oes entre co laboradores. Neste estudo, conduzimos uma an´alise para avaliar a toxicidade nos coment´arios das ”issues” em projetos open source. Para isso, criamos um banco de dados contendo autores identificados como t´oxicos e, com base nessa informac ¸˜ao, mapeamos todas as ”issues” nas quais estes autores estiveram en volvidos. Posteriormente, submetemos essas ”issues” `a API do IBM Watson Natural Language para uma an´alise mais detalhada. Ap´os a classificac¸˜ao re alizada pela API do IBM Watson Natural Language, selecionamos um subcon junto para realizar uma an´alise manual adicional.Trabalho de Curso - Graduação - Artigo Acesso aberto (Open Access) Uma metodologia em cascata de quatro etapas para classificar códigos NCM usando técnicas de PLN(2022-09-30) PINHEIRO, Pedro Luiz Braga; GONZÁLEZ, Marcos Tulio Amaris; http://lattes.cnpq.br/9970287865377659Esse trabalho tem como objetivo desenvolver um processo para classificar as descrições dos produtos presentes nas Notas Ficais eletrônicas (NF-e). Essa classificação e feita sobre os 8 dígitos da Nomenclatura Comum do Mercosul (NCM), separado em 4 partes, Capítulo, Posição, Subposição e item/Subitem. A classificação foi realizada utilizando o algoritmo de Máquina de Vetores de Suporte (SVM) e o algoritmo de Naive Bayes em conjunto com as técnicas de Processamento Natural de Linguagem (PNL), para o processamento de uma base de dados de 340.000 produtos distintos. Os dados foram divididos em 80% treinamento e 20% teste e obteve-se um acurácia de 90% para um total de 98 classes.