@MASTERSTHESIS{ 2013:1070500249, title = {Aprendendo a segmentar p?ginas web}, year = {2013}, url = "http://tede.ufam.edu.br/handle/tede/2924", abstract = "Diferente dos documentos tradicionais, as p?ginasWeb s?o compostas por diferentes segmentos ou blocos, cada qual desempenhando uma fun??o espec?fica dentro de cada p?gina. Trabalhos recentes da literatura t?m demonstrado que informa??es sobre esses segmentos podem ser ?teis para melhorar os resultados de in?meras tarefas das ?reas de recupera??o de informa??o e minera??o de dados. Por esse motivo, existem muitos trabalhos cient?ficos propondo diferentes m?todos de segmenta??o de p?ginas Web. De uma forma geral, os m?todos de segmenta??o encontrados na literatura utilizam apenas evid?ncias da pr?pria p?gina a ser segmentada. No entanto, partindo da observa??o de que as p?ginas de um mesmo site tendem a possuir layouts bastante similares, apresentamos neste trabalho uma abordagem baseada em aprendizagem de m?quina que explora evid?ncias globais dos Web sites. Nosso m?todo, que adota Support Vector Machines para o processo de aprendizagem, e usa a estrutura SOM (Site Object Model) para agregar informa??es de todas as p?ginas de um mesmo Web site, apresentou bons resultados quando comparado com uma abordagem de segmenta??o manual, e quando comparado com uma recente abordagem da literatura.", publisher = {Universidade Federal do Amazonas}, scholl = {Programa de P?s-gradua??o em Inform?tica}, note = {Instituto de Computa??o} }