Um classificador supervisionado para relatos policiais no Estado do Pará
dc.contributor.advisor1 | SANTOS FILHO, Reginaldo Cordeiro dos | |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/9157422386900321 | pt_BR |
dc.creator | MATOS, Helder Mateus dos Reis | |
dc.creator.Lattes | http://lattes.cnpq.br/2551518132451353 | pt_BR |
dc.creator.ORCID | https://orcid.org/0000-0002-5632-7948 | pt_BR |
dc.date.accessioned | 2025-02-28T22:11:09Z | |
dc.date.available | 2025-02-28T22:11:09Z | |
dc.date.issued | 2022-12-16 | |
dc.description.abstract | Public sectors are becoming more aware of the tendencies of data science and data mining applications, due to the exponential increase of its data volume over the recent years, the consequent and more frequent demand for hidden information in the massive amount of data generated daily, and the solutions offered by these fields of study over the automation and improvement of internal processes. Public security holds a huge potential of acquiring benefits from tools of automatic knowledge extraction on databases, including classification of text included on police records. This paper describes the development of a supervised classifier for police records, constructed upon knowledge extracted from police report public databases, in the years between 2019 and 2021, in the state of Pará, Brazil. Among the utilized techniques, it can be highlighted a data mining methodology based on CRISP-DM, Natural Language Processing, text sequence vectorization through word embeddings, and a deep learning model based on Convolutional Neural Networks. The model achieved an overall accuracy of approximately 78% for the prediction of 463 unique labels related to public safety. These labels include categories derived from the Brazilian legislation, such as murder, theft, robbery, rape, and threat, adding to labels specific to the policial environment, for instance death notice, death due to state officer intervention, and drug trafficking. The resulting model was used to improve the statistical processes of criminal analysts, both in quantitative and qualitative terms, through the deployment of a police record classification tool in the state of Pará, reducing the daily efforts of data processing and consolidation to at most 5 hours. | pt_BR |
dc.description.resumo | Os diversos setores públicos estão se voltando para as tendências de aplicações de ciência e mineração de dados, muito em razão do aumento exponencial do volume de seus dados ao longo dos últimos anos, da consequente demanda cada vez mais frequente por informações escondidas na massa de dados gerados a cada dia, e das soluções oferecidas por estas áreas do conhecimento na automação e melhoria de processos internos. A segurança pública tem um grande potencial de adquirir benefícios gerados por ferramentas de automação de extração de conhecimento em bases de dados, incluindo a classificação de textos inclusos em relatos policiais. Este trabalho descreve o desenvolvimento de um classificador supervisionado de relatos policiais, construído a partir do conhecimento extraído de bases de dados públicas de relatos policiais, para os anos entre 2019 e 2021, no estado do Pará, Brasil. Dentre as técnicas utilizadas, destacam-se o uso de da metodologia de mineração de dados CRISP-DM, Processamento de Linguagem Natural, vetorização de sequências de texto através de word embeddings e um modelo de aprendizado profundo baseado em Redes Neurais Convolucionais. Este modelo alcançou uma acurácia geral de aproximadamente 78% para a predição de 463 classes únicas relacionadas com segurança pública. Tais classes incluem categorias derivadas da legislação brasileira, como homicídio, furto, roubo, estupro e ameaça, com a inclusão de classes específicas ao ambiente policial, como a comunicação de óbito, a morte por intervenção de agente do estado e o tráfico de drogas. O modelo resultante também foi usado para melhoria de processos estatísticos de analistas criminais, tanto em termos quantitativos, quanto qualitativos, através da implantação de uma ferramenta de classificação de relatos policiais diários do estado do Pará, reduzindo os esforços diários de processamento e consolidação dos dados em até 5 horas. | pt_BR |
dc.identifier.citation | MATOS, Helder Mateus dos Reis. Um classificador supervisionado para relatos policiais no Estado do Pará. Orientador: Reginaldo Cordeiro dos Santos Filho. 2022. 68 f. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Faculdade de Computação, Instituto de Ciências Exatas e Naturais, Universidade Federal do Pará, Belém, 2022. Disponível em:. Acesso em:. | pt_BR |
dc.identifier.uri | https://bdm.ufpa.br/jspui/handle/prefix/7758 | |
dc.rights | Acesso Aberto | pt_BR |
dc.source | 1 CD-ROM | pt_BR |
dc.subject | Mineração de dados | pt_BR |
dc.subject | Aprendizado de máquina | pt_BR |
dc.subject | Segurança pública | pt_BR |
dc.subject | Data mining | pt_BR |
dc.subject | Machine learning | pt_BR |
dc.subject | Public security | pt_BR |
dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | pt_BR |
dc.title | Um classificador supervisionado para relatos policiais no Estado do Pará | pt_BR |
dc.type | Trabalho de Curso - Graduação - Monografia | pt_BR |
Arquivo(s)
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- TCC_ClassificadorSupervisionadoRelatos.pdf
- Tamanho:
- 2.15 MB
- Formato:
- Adobe Portable Document Format
Licença do Pacote
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- license.txt
- Tamanho:
- 1.84 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição: