A Receita Federal do Brasil disponibiliza dados cadastrais de empresas, estabelecimentos e quadros societários através do Cadastro Nacional de Pessoas Jurídicas (CNPJ), servindo como uma fonte de dados confiável e acessível. Entretanto, obter e gerenciar esses dados não é uma tarefa trivial. Esse trabalho realiza a primeira iniciativa para construção de um dataset semântico ($DS$) de Pessoas Jurídicas baseado em uma arquitetura de Data Lakehouses e semântica. No decorrer deste artigo é descrito processo de construção do dataset, fornecendo também os recursos, scripts e artefatos utilizados, além de uma exploração através do GraphDB e apresentação de possíveis casos de uso.