Um volume considerável de dados permanece à margem do conhecimento de organizações governamentais, sem recurso de curadoria, transformando-se em dados escuros (dark data). Na área de controle público, onde há silos de diversas fontes, com um volume crescente, inclusive de cidadãos, dados escuros têm sido um tema não explorado pela literatura. Este artigo traz os principais conceitos na área de dados escuros, listando suas características e riscos, elaborando um mapa conceitual para a área de controle público. No decorrer do artigo, é apresentada uma abordagem de um pipeline para manipulação de dados escuros, que oferece alta abstração para identificação, classificação e monitoramento de dados escuros, especialmente para área de controle público.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.