Um classificador supervisionado para relatos policiais no Estado do Pará

dc.contributor.advisor1SANTOS FILHO, Reginaldo Cordeiro dos
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/9157422386900321pt_BR
dc.creatorMATOS, Helder Mateus dos Reis
dc.creator.Latteshttp://lattes.cnpq.br/2551518132451353pt_BR
dc.creator.ORCIDhttps://orcid.org/0000-0002-5632-7948pt_BR
dc.date.accessioned2025-02-28T22:11:09Z
dc.date.available2025-02-28T22:11:09Z
dc.date.issued2022-12-16
dc.description.abstractPublic sectors are becoming more aware of the tendencies of data science and data mining applications, due to the exponential increase of its data volume over the recent years, the consequent and more frequent demand for hidden information in the massive amount of data generated daily, and the solutions offered by these fields of study over the automation and improvement of internal processes. Public security holds a huge potential of acquiring benefits from tools of automatic knowledge extraction on databases, including classification of text included on police records. This paper describes the development of a supervised classifier for police records, constructed upon knowledge extracted from police report public databases, in the years between 2019 and 2021, in the state of Pará, Brazil. Among the utilized techniques, it can be highlighted a data mining methodology based on CRISP-DM, Natural Language Processing, text sequence vectorization through word embeddings, and a deep learning model based on Convolutional Neural Networks. The model achieved an overall accuracy of approximately 78% for the prediction of 463 unique labels related to public safety. These labels include categories derived from the Brazilian legislation, such as murder, theft, robbery, rape, and threat, adding to labels specific to the policial environment, for instance death notice, death due to state officer intervention, and drug trafficking. The resulting model was used to improve the statistical processes of criminal analysts, both in quantitative and qualitative terms, through the deployment of a police record classification tool in the state of Pará, reducing the daily efforts of data processing and consolidation to at most 5 hours.pt_BR
dc.description.resumoOs diversos setores públicos estão se voltando para as tendências de aplicações de ciência e mineração de dados, muito em razão do aumento exponencial do volume de seus dados ao longo dos últimos anos, da consequente demanda cada vez mais frequente por informações escondidas na massa de dados gerados a cada dia, e das soluções oferecidas por estas áreas do conhecimento na automação e melhoria de processos internos. A segurança pública tem um grande potencial de adquirir benefícios gerados por ferramentas de automação de extração de conhecimento em bases de dados, incluindo a classificação de textos inclusos em relatos policiais. Este trabalho descreve o desenvolvimento de um classificador supervisionado de relatos policiais, construído a partir do conhecimento extraído de bases de dados públicas de relatos policiais, para os anos entre 2019 e 2021, no estado do Pará, Brasil. Dentre as técnicas utilizadas, destacam-se o uso de da metodologia de mineração de dados CRISP-DM, Processamento de Linguagem Natural, vetorização de sequências de texto através de word embeddings e um modelo de aprendizado profundo baseado em Redes Neurais Convolucionais. Este modelo alcançou uma acurácia geral de aproximadamente 78% para a predição de 463 classes únicas relacionadas com segurança pública. Tais classes incluem categorias derivadas da legislação brasileira, como homicídio, furto, roubo, estupro e ameaça, com a inclusão de classes específicas ao ambiente policial, como a comunicação de óbito, a morte por intervenção de agente do estado e o tráfico de drogas. O modelo resultante também foi usado para melhoria de processos estatísticos de analistas criminais, tanto em termos quantitativos, quanto qualitativos, através da implantação de uma ferramenta de classificação de relatos policiais diários do estado do Pará, reduzindo os esforços diários de processamento e consolidação dos dados em até 5 horas.pt_BR
dc.identifier.citationMATOS, Helder Mateus dos Reis. Um classificador supervisionado para relatos policiais no Estado do Pará. Orientador: Reginaldo Cordeiro dos Santos Filho. 2022. 68 f. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Faculdade de Computação, Instituto de Ciências Exatas e Naturais, Universidade Federal do Pará, Belém, 2022. Disponível em:. Acesso em:.pt_BR
dc.identifier.urihttps://bdm.ufpa.br/jspui/handle/prefix/7758
dc.rightsAcesso Abertopt_BR
dc.source1 CD-ROMpt_BR
dc.subjectMineração de dadospt_BR
dc.subjectAprendizado de máquinapt_BR
dc.subjectSegurança públicapt_BR
dc.subjectData miningpt_BR
dc.subjectMachine learningpt_BR
dc.subjectPublic securitypt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
dc.titleUm classificador supervisionado para relatos policiais no Estado do Parápt_BR
dc.typeTrabalho de Curso - Graduação - Monografiapt_BR

Arquivo(s)

Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
TCC_ClassificadorSupervisionadoRelatos.pdf
Tamanho:
2.15 MB
Formato:
Adobe Portable Document Format
Licença do Pacote
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
1.84 KB
Formato:
Item-specific license agreed upon to submission
Descrição: