???item.export.label??? ???item.export.type.endnote??? ???item.export.type.bibtex???

Please use this identifier to cite or link to this item: https://tede.ufam.edu.br/handle/tede/7232
???metadata.dc.type???: Dissertação
Title: Uma abordagem para seleção de tópicos relevantes em redes sociais online
???metadata.dc.creator???: Souza, Bruno Ábia 
???metadata.dc.contributor.advisor1???: Nakamura, Eduardo Freire
First advisor-co: Nakamura, Fabiola Guerra
???metadata.dc.contributor.referee1???: Figueiredo, Carlos Maurício Seródio
???metadata.dc.contributor.referee2???: Costa, Elloá Barreto Guedes da
???metadata.dc.description.resumo???: O crescente uso das redes sociais fez com que a quantidade de informações que são compartilhadas diariamente (opiniões pessoais, notícias e eventos do tipo natural ou social) aumentasse, tornando estas redes uma fonte de informaç cãoo sobre eventos. No Brasil, acontecimentos recentes, como a Operação Lava Jato conduzida pela polícia Federal e o processo de impeachment da Presidente são exemplos de eventos que geraram repercussões nos meios de comunicação. Esses fatos marcantes, podem ser utilizados para caracterizar quais são os acontecimentos relevantes de um determinado evento. Nas redes sociais, esses acontecimentos geram discussões, compartilhamentos e novas notícias, onde informações relevantes acabam tendo mais repercussões. Contudo, processar uma elevada massa de dados a fim de eliminar ruídos e reconhecer informações torna-se muito custoso. Neste contexto, este trabalho tem como objetivo demonstrar uma abordagem para caracterização de informações relevantes de eventos, através da extração de tópicos em dados compartilhados no Twitter, onde avaliamos o desempenho de três métodos de aprendizagem de máquina (K-means, Latent Dirichlet Allocation - LDA e Non-Negative Matrix Factorization - NMF) usados para extrair tópicos sobre as bases de dados da Operação Lava Jato e do processo de impeachment da presidente do Brasil em duas arquiteturas de pré-processamento diferentes (tradicional e com reconhecimento de entidade), demonstrando que é possível utilizar uma rede social como fonte de dados para descobrir os tópicos relevantes através do sensoriamento de usuários que observam um evento. Em nossos experimentos, observamos que as técnicas de pré-processamento têm influência direta sobre o resultado da extração de tópicos. Além disso, observamos que a técnica Silhouette nos ajudou a encontrar o melhor valor de clusters para uma determinada amostra de dados. Nos resultados o NMF apresentou o melhor desempenho nas duas bases de dados, tanto na tarefa de extração de tópicos quanto no tempo de execução.
Abstract: The increasing use of social networks has made the amount of information that is shared daily (personal opinions, news and events of the natural or social type) increasing significantly, making social networks a source of information about events. In Brazil, recent events such as Lava Jato Operation conducted by the Federal Police and the impeachment process of the Brazil President are examples of events that have had repercussions in the traditional medias. These facts can be used to characterize the relevant informations of an event. In social networks, the events generate discussions, sharings and news posts, where relevant information have more repercussions. However, processing a large mass of data to eliminate noise and recognize the information becomes costly. In this context, this work aims to show an approach to the characterization of relevant information by extracting topics in shared data on Twitter, where we evaluate the performance of three methods of machine learning (K-means, Latent Dirichlet Allocation (LDA) and Non-Negative Matrix Factorization (NMF)) used to extract topics on Lava Jato's databases and the impeachment process of the Brazilian president in two different preprocessing architectures (traditional and with entity recognition), demonstrating that it is possible to use the social networks as a data source to discover the relevant topics through the sensing of users that observe an event. In our experiments, we observed that the preprocessing techniques have a direct influence on the result of the topics extraction. In addition, we observed that the Silhouette technique helped us to find the best value of clusters for a given data sample. In the results the NMF presented the best performance in both databases, both in the topic extraction task and in the execution time
Keywords: Aprendizado do computador
Redes sociais on-line
Twitter (Rede social on-line)
???metadata.dc.subject.cnpq???: CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
Language: por
???metadata.dc.publisher.country???: Brasil
Publisher: Universidade Federal do Amazonas
???metadata.dc.publisher.initials???: UFAM
???metadata.dc.publisher.department???: Instituto de Computação
???metadata.dc.publisher.program???: Programa de Pós-graduação em Informática
Citation: SOUZA, Bruno Ábia. Uma abordagem para seleção de tópicos relevantes em redes sociais online. 2017. 81 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2017.
???metadata.dc.rights???: Acesso Aberto
URI: https://tede.ufam.edu.br/handle/tede/7232
Issue Date: 24-Mar-2017
Appears in Collections:Mestrado em Informática

Files in This Item:
File Description SizeFormat 
Dissertação_BrunoSouza_PPGI.pdf4.89 MBAdobe PDFThumbnail

Download/Open Preview


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.