The Web poses itself as the largest data repository ever available in the history of humankind. Major efforts have been made in order to provide efficient access to relevant information within this huge repository of data. Although several techniques have been developed to the problem of Web data extraction, their use is still not spread, mostly because of the need for high human intervention and the low quality of the extraction results. In this paper, we present a domain-oriented approach to Web data extraction and discuss its application to automatically extracting news from Web sites. Our approach is based on a highly efficient tree structure analysis that produces very effective results. We have tested our approach with several important Brazilian on-line news sites and achieved very precise results, correctly extracting 87.71% of the news in a set of 4088 pages distributed among 35 different sites.
O objetivo deste estudo é analisar como evoluíram as estatísticas relativas à violência de gênero direcionada às mulheres na Bahia, nos anos de pandemia. Para dar conta desta tarefa, recorreu-se, fundamentalmente, às informações disponibilizadas pelos mais recentes documentos produzidos pelo Fórum Brasileiro de Segurança Pública, os Anuários Brasileiros de Segurança Pública, datados dos anos de 2021 e 2022, e a parte da literatura que discute a questão da violência que historicamente afeta as mulheres. Por certo, o principal achado desta investigação diz respeito ao fato de que as estatísticas que dão conta da situação de violência que vitima as mulheres no referido estado apresentaram, em certos aspectos, um comportamento dissonante daquele que foi verificado no plano nacional. De modo mais preciso, encontraram-se algumas evidências para o estado em questão que não se harmonizam com o quadro de incremento da violência não letal contra as mulheres verificado no conjunto do país, situação essa que foi atestada, por exemplo, ao se lançar as lentes da análise para as estatísticas que apuram o número de denúncias de lesão corporal dolosa e o quantitativo de notificações das ameaças dirigidas às mulheres. Palavras-chave: mulheres; violência; pandemia.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.