???item.export.label??? ???item.export.type.endnote??? ???item.export.type.bibtex???

Please use this identifier to cite or link to this item: https://tede.ufam.edu.br/handle/tede/6930
Tipo do documento: Dissertação
Título: Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil
Título(s) alternativo(s): Detecting automated behavior in Twitter trend topics in Brazil
Autor: Silva, Adeilson Souza da 
Primeiro orientador: Feitosa, Eduardo Luzeiro
Primeiro membro da banca: Souto, Eduardo James Pereira
Segundo membro da banca: Batista, Daniel Macêdo
Resumo: O crescimento no número de usuários fez com que as redes sociais, especialmente o Twitter, tornassem-se suscetíveis a criação e propagação de postagens automatizadas. No Twitter, a lista de tópicos de tendência representa os assuntos mais comentados em determinada região e pode ser utilizada indevidamente por contas automatizadas. É necessário então entender e estudar a forma como esses usuários se comportam a fim de criar medidas para combatê-los e garantir que os dados publicados possuam credibilidade. Utilizando uma base de dados real coletada dos tópicos de tendência do Twitter no Brasil, no período de dezembro de 2013 a junho de 2014, com 2.853.822 contas e 11.294.861 tweets, uma metodologia para detectar comportamento automatizado nos tópicos de tendência do Twitter foi proposta. Para tanto, foram estudadas diversas características de texto e do comportamento dos usuários para identificar atributos capazes de dis- tiguir usuários humanos de usuários automatizados. Também foram propostas seis (6) novas características extraídas do texto dos tweets baseadas no conceito de Entropia. Utilizando esse conjunto de atributos com algoritmos de aprendizagem de máquina supervisionada para classificação, foi possível detectar 92% das contas automatizadas na base de dados utilizada e, assim, obter uma visão do comportamento desses usuários.
Abstract: The growth in the number of users in social networks, especially Twitter, become themselves susceptible to creation and propagation of automated posts. On Twitter, the Trend Topics list represents the most talked subjects in a particular region and can be misused by automated accounts. Then, it is necessary to understand and study how these users behave in order to create measures to combat them and ensure that published data have credibility. Using a real database collected from the Twitter Trend Topics in Brazil, from December 2013 to June 2014, with 2.853,822 accounts and 11,294,861 tweets, a methodology to detect automated behavior in Trend Topics was proposed. For this, we studied several text characteristics and user behavior to identify attributes capable of distiguish human users and automated users. Also were proposed six (6) new features based on the concept of entropy. Using this set of attributes with ma-chine learning algorithms for supervised classification, it was possible to detect 92 % of automated accounts in the database used and thus get an insight into the behavior of these users.
Palavras-chave: Tweets
Tópicos de Tendência
Entropia
Aprendizagem de Máquina
Trend Topics
Entropy
Machine Learning
Área(s) do CNPq: CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
Idioma: por
País: Brasil
Instituição: Universidade Federal do Amazonas
Sigla da instituição: UFAM
Departamento: Instituto de Computação
Programa: Programa de Pós-graduação em Informática
Citação: SILVA, Adeilson Souza da. Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil. 2015. 87 f. Dissertação (Mestrado em Informática) - Instituto de Computação, Universidade Federal do Amazonas, Manaus, 2015.
Tipo de acesso: Acesso Aberto
URI: https://tede.ufam.edu.br/handle/tede/6930
Data de defesa: 25-Sep-2015
Appears in Collections:Mestrado em Informática

Files in This Item:
File Description SizeFormat 
Dissertação_AdeilsonSilva_PPGI.pdf4,32 MBAdobe PDFThumbnail

Download/Open Preview


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.