???item.export.label??? ???item.export.type.endnote??? ???item.export.type.bibtex???

Please use this identifier to cite or link to this item: https://tede.ufam.edu.br/handle/tede/10967
???metadata.dc.type???: Dissertação
Title: Identificação e análise de discurso sexista em comentários curtos provenientes de portais de notícia
Other Titles: Identification and analysis of sexist discourse in short comments from news portals
???metadata.dc.creator???: Braga, Maria Luísa Pereira 
???metadata.dc.contributor.advisor1???: Nakamura, Eduardo Freire
???metadata.dc.contributor.referee1???: Lauschner, Tanara
???metadata.dc.contributor.referee2???: Oliveira, Jonice
???metadata.dc.description.resumo???: Identificar o discurso de disseminação de ódio e preconceito é um desafio contínuo para os ambientes de mídias sociais online. Uma caracterização e identificação precisa são peças-chave para tratar e mitigar a violência, assim como, educar os usuários de forma eficaz e assertiva. A disseminação online de ódio pode ser direcionada a grupos distintos de pessoas, o que gera várias classes de discurso de ódio, como por exemplo o racismo, a homofobia ou o sexismo. Esse último é um tópico cujo interesse social tem crescido a medida que a figura feminina vence as barreiras da desigualdade de gênero. Em particular, o discurso sexista propaga e incentiva o comportamento depreciativo e abusivo contra mulheres. Neste trabalho, apresentamos um corpus de discurso sexista em Português coletado a partir de portais de notícias de grande aceitação popular, como G1 e UOL, por exemplo. O trabalho apresenta três contribuições principais: (1) o processo de criação do corpus e de rotulação de comentários (sexista/não sexista); (2) a caracterização e análise do corpus e do comportamento dos rotuladores anônimos; (3) uma avaliação técnicas de aprendizagem de máquina para classificação de comentários sexistas/não sexistas. Os resultados preliminares mostram que, ao utilizar classificadores automáticos, é possível identificar comentários sexistas com uma medida F1 e precisão acima de 0,9 e revocação próxima a 0,8.
Abstract: Identifying the spread of hate and prejudice speech is an ongoing challenge for online social media environments. Accurate characterization and identification are key to treating and mitigating violence, as well as educating users effectively and assertively. The online dissemination of hate can be targeted at different groups of people, which generates various classes of hate speech, such as racism, homophobia or sexism. The latter is a topic whose social interest objective has grown as the female figure overcomes the barriers of gender inequality. In particular, sexist speech propagates and encourages derogatory and abusive behavior against women. In this work, we build a corpus of sexist speech in Portuguese collected from popularly accepted news portals, such as G1 and UOL, for example. The work presents the three main contributions: (1) the process of creating the corpus and rotating comments (sexist/non-sexist); (2) a characterization and analysis of the corpus and behavior of anonymous labelers; (3) an assessment of machine learning techniques for detecting sexist/non-sexist comments. Preliminary results show that, by using automatic classifiers, it is possible to identify sexist comments with an F1 measure and precision above 0.9 and recall close to 0.8.
Keywords: Aprendizado do computador
Discurso de ódio na Internet
Sexismo na comunicação
Análise do discurso - Aspectos sociais
???metadata.dc.subject.cnpq???: CIENCIAS EXATAS E DA TERRA: CIENCIA DA COMPUTACAO
???metadata.dc.subject.user???: Sexismo
Ciência de dados
Discurso de ódio
Machine learning
Language: por
???metadata.dc.publisher.country???: Brasil
Publisher: Universidade Federal do Amazonas
???metadata.dc.publisher.initials???: UFAM
???metadata.dc.publisher.department???: Instituto de Computação
???metadata.dc.publisher.program???: Programa de Pós-graduação em Informática
Citation: BRAGA, Maria Luísa Pereira. Identificação e análise de discurso sexista em comentários curtos provenientes de portais de notícia. 2022. 53 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2022.
???metadata.dc.rights???: Acesso Aberto
???metadata.dc.rights.uri???: https://creativecommons.org/licenses/by-nc-nd/4.0/
URI: https://tede.ufam.edu.br/handle/tede/10967
Issue Date: 11-Aug-2022
Appears in Collections:Mestrado em Informática

Files in This Item:
File Description SizeFormat 
DISS_MariaLuísaBraga_PPGI.pdf5.21 MBAdobe PDFThumbnail

Download/Open Preview


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.