This paper provides data resources for low-resource hate speech detection. Specifically, we introduce a large-scale expert annotated corpus of Brazilian Instagram comments and a context-aware offensive lexicon, which was manually extracted by a linguist from the proposed corpus and annotated with contextual information. We further provide native-speaker translations and adaptations from the specialized lexicon for other low-resource languages. The corpus consists of 7,000 document-level multi-layer annotations: (i) a binary offensive class, (ii) offensiveness-level classes, and (iii) nine hate speech targets. The context-aware offensive lexicon holds 1,000 explicit and implicit terms and expressions with pejorative connotations annotated with context-dependent offensiveness and context-independent offensiveness labels. Both corpus and lexicon were annotated by three different experts and achieved high inter-annotator agreement. Finally, we implemented baseline experiments on both data resources (corpus and lexicon). Results show the reliability of the proposed data, outperforming baseline dataset results in Portuguese, as well as presenting promising results for hate speech detection in different languages.
Com o advento da internet, da hiperconectividade e das múltiplas possibilidades de aprendizagem, a escola também se encontra imersa na cibercultura. Novas relações emergem deste processo evidenciando outras formas de lidar com as questões de gênero e sexualidades. Essa temática é alvo do debate promovido pela comunidade virtual Sexualidade para garot@s do Portal EMdiálogo [www.emdialogo.uff.br], o qual consiste em uma ação de extensão universitária que congrega nove universidades públicas brasileiras. Essa rede social de diálogo é voltada para estudantes do ensino médio público e utiliza uma interface amigável ao universo cultural juvenil com linguagens e temáticas que também abarcam este universo. No caso da comunidade sobre as relações de gênero e sexualidades, o objetivo é proporcionar o diálogo entre os/as jovens tornando-os/as protagonistas nesse ambiente virtual. Este trabalho argumenta que a comunidade virtual Sexualidade para garot@s consiste em uma possibilidade de espaço formativo para a juventude ao problematizar as configurações sociais vigentes, por meio da contestação dos padrões estabelecidos, da heteronormatividade, e das relações desiguais entre homens e mulheres. O debate traz à tona questões que têm efeitos diretos nas escolas de ensino médio, habitadas pela juventude.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.