@MASTERSTHESIS{ 2006:1909066367, title = {Gera??o autom?tica de padr?es de navega??o para web sites de conte?do din?mico}, year = {2006}, url = "http://tede.ufam.edu.br/handle/tede/2940", abstract = "Um crescente n?mero de aplica??es para Web necessitam processar cole??es de p?ginas similares obtidas de Web sites. O objetivo final destas aplica??es ? tirar proveito de informa??es valiosas que estas p?ginas implicitamente cont?m para realizar tarefas como consulta, busca, extra??o de dados, minera??o de dados e an?lise de caracter?sticas de uso e popularidade. Para algumas destas aplica??es os crit?rios para determinar quando uma p?gina deve estar presente na cole??o est?o relacionados a caracter?sticas do conte?do da p?gina. Contudo, exitem muitas outras importantes situa??es em que caracter?sticas inerentes ? estrutura das p?ginas, ao inv?s de seu conte?do, prov?m um crit?rio melhor para guiar a coleta de p?ginas. Motivados por este problema, propomos nesta disserta??o uma nova abordagem para gera??o de coletores guiados por estrutura que requer um esfor?o m?nimo do usu?rio, pois s?o necess?rio apenas um exemplo das p?ginas a coletar e um ponto de entrada no Web site. Uma outra caracter?stica importante de nossa abordagem, ? o fato de ser capaz de lidar com sites onde as p?ginas a serem coletadas s?o geradas dinamicamente atrav?s do preenchimento de formul?rios. Ao contr?rio dos m?todos existentes na literatura, no nosso caso n?o ? necess?ria a exist?ncia de um banco de dados de amostra para auxiliar no processo de preenchimento do formul?rio, nem t?o pouco ? necess?ria grande itera??o com o usu?rio. Resultados obtidos em experimento com nossa abordagem demonstraram um valor de 100% de precis?o em coletas realizadas sobre 17 Web sites reais de conte?do est?tico e din?mico, e pelo menos 95% de revoca??o para 11 sites est?ticos utilizados nos experimentos.", publisher = {Universidade Federal do Amazonas}, scholl = {Programa de P?s-gradua??o em Inform?tica}, note = {Instituto de Computa??o} }