Anais Do IV Dataset Showcase Workshop (DSW 2022) 2022
DOI: 10.5753/dsw.2022.224925
|View full text |Cite
|
Sign up to set email alerts
|

LiPSet: Um conjunto de Dados com Documentos Rotulados de Licitações Públicas

Abstract: Neste trabalho, é apresentado o LiPSet, um conjunto de dados com documentos rotulados de licitações públicas de Minas Gerais. Após uma visão geral do processo de coleta e rotulação manual, uma breve análise exploratória de dados é apresentada para resumir as principais características e contribuições do conjunto de dados proposto. Além disso, são discutidas potenciais aplicações e principais desafios que envolvem o uso do LiPSet.

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
2
1

Citation Types

0
1
0
2

Year Published

2023
2023
2024
2024

Publication Types

Select...
3
2
1

Relationship

0
6

Authors

Journals

citations
Cited by 6 publications
(3 citation statements)
references
References 7 publications
0
1
0
2
Order By: Relevance
“…No Brasil, apesar dos desafios de padronizac ¸ão e disponibilizac ¸ão [Oliveira et al 2022], surgem iniciativas para detectar fraudes e irregularidades usando DAG [Oliveira andSilveira 2018, Costa et al 2022]. Um exemplo é o conjunto de dados estruturados de licitac ¸ões de municípios de Minas Gerais, disponibilizado no estudo de [Silva et al 2022]. Outra iniciativa importante uniu dados de procurac ¸ões de âmbito nacional de diversas fontes usando o esquema ETL, visando a detecc ¸ão de fraudes [Velasco et al 2021].…”
Section: Trabalhos Relacionadosunclassified
“…No Brasil, apesar dos desafios de padronizac ¸ão e disponibilizac ¸ão [Oliveira et al 2022], surgem iniciativas para detectar fraudes e irregularidades usando DAG [Oliveira andSilveira 2018, Costa et al 2022]. Um exemplo é o conjunto de dados estruturados de licitac ¸ões de municípios de Minas Gerais, disponibilizado no estudo de [Silva et al 2022]. Outra iniciativa importante uniu dados de procurac ¸ões de âmbito nacional de diversas fontes usando o esquema ETL, visando a detecc ¸ão de fraudes [Velasco et al 2021].…”
Section: Trabalhos Relacionadosunclassified
“…O objetivo deste trabalho é a detecc ¸ão de sobreprec ¸o em compras públicas e, por conseguinte, a identificac ¸ão de indícios de fraudes. Nesse contexto, os documentos de licitac ¸ão apresentam uma estrutura definida, porém utilizam termos e formas distintas para se referir a um mesmo item, o que dificulta o processamento automático desses documentos [Silva et al 2022, Oliveira et al 2022. Para solucionar esse problema, técnicas especializadas em Processamento de Linguagem Natural (PLN) são utilizadas para processar os dados textuais.…”
Section: Trabalhos Relacionadosunclassified
“…Indeed, several laws regulate the operation and functioning of companies, especially when participating in public bids [Pereira et al, 2022]. In this context, seminal works in the analysis of public bids focus on distinct aspects of fraud detection, including cartels between bidders [Gabardo and Lopes, 2014], bid characterization [Luna and Figueiredo, 2022], alerts based on network analysis [Costa et al, 2022; Pereira et al, 2022, and inconsistencies between bidder activities and bidding items [Oliveira et al, 2022a] Furthermore, Silva et al [2022] also propose LiPSet, a dataset of public bid documents, and mention fraud detection as one of its applications.…”
Section: Introductionmentioning
confidence: 99%