@MASTERSTHESIS{ 2020:1365507680, title = {Avaliando atributos de credibilidade de páginas Web utilizando Aprendizagem de Máquina}, year = {2020}, url = "https://tede.ufam.edu.br/handle/tede/7807", abstract = "As informações compartilhadas na Web se propagam rapidamente, sejam elas verdadeiras ou não. O objetivo de reproduzir informações incorretas ou falsas está relacionado a diversos fatores como manipulação política, obtenção de benefícios financeiros, disseminação de difamações, entre outros. Sendo assim, verificar a credibilidade das informações disponíveis na Web acaba sendo uma tarefa obrigatória. Dentre as diversas soluções desenvolvidas para detectar se uma página Web pode ser acreditada ou não, as baseadas em aprendizagem de máquina são a mais empregadas. Esta dissertação visa avaliar e definir atributos empregáveis em um futuro modelo de avaliação de credibilidade de páginas Web, por meio da extração de características do conteúdo da página e da rede, com o auxílio de classificadores de aprendizagem de máquina, possibilitando assim maior certeza sobre a credibilidade de páginas Web. Como resultado, esta dissertação concluiu que o classificador Random Forest teve o melhor resultado para avaliação de credibilidade de páginas web com 95.36% de acurácia. Além de disponibilizar um script de extração de atributos, apontou também quais são os atributos mais relevantes e de fácil extração que podem ser obtidos e qualquer URL, para isso utilizou 3 métodos de seleção de atributos: Select kbest, Seleção RFE e Seleção RFECV, no qual este último apresentou o melhor resultado com 95.33% de acurácia.", publisher = {Universidade Federal do Amazonas}, scholl = {Programa de Pós-graduação em Informática}, note = {Instituto de Computação} }