Aprendendo a segmentar páginas web

???item.export.label???

Please use this identifier to cite or link to this item: https://tede.ufam.edu.br/handle/tede/2924

Full metadata record

DC Field	Value	Language
dc.creator	Daoud, Caio Moura	-
dc.creator.Lattes	http://lattes.cnpq.br/8569893814198940	por
dc.contributor.advisor1	Oliveira, David Braga Fernandes de	-
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/9561812825173697	por
dc.date.available	2014-07-15	-
dc.date.issued	2013-03-28	-
dc.identifier.citation	DAOUD, Caio Moura. Aprendendo a segmentar páginas web. 2013. 59 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2013.	por
dc.identifier.uri	http://tede.ufam.edu.br/handle/tede/2924	-
dc.description.resumo	Diferente dos documentos tradicionais, as páginasWeb são compostas por diferentes segmentos ou blocos, cada qual desempenhando uma função específica dentro de cada página. Trabalhos recentes da literatura têm demonstrado que informações sobre esses segmentos podem ser úteis para melhorar os resultados de inúmeras tarefas das áreas de recuperação de informação e mineração de dados. Por esse motivo, existem muitos trabalhos científicos propondo diferentes métodos de segmentação de páginas Web. De uma forma geral, os métodos de segmentação encontrados na literatura utilizam apenas evidências da própria página a ser segmentada. No entanto, partindo da observação de que as páginas de um mesmo site tendem a possuir layouts bastante similares, apresentamos neste trabalho uma abordagem baseada em aprendizagem de máquina que explora evidências globais dos Web sites. Nosso método, que adota Support Vector Machines para o processo de aprendizagem, e usa a estrutura SOM (Site Object Model) para agregar informações de todas as páginas de um mesmo Web site, apresentou bons resultados quando comparado com uma abordagem de segmentação manual, e quando comparado com uma recente abordagem da literatura.	por
dc.description.abstract	Unlike traditional documents, Web pages are composed of different segments or blocks, each block has specific functions in each page. Recent work in the literature has shown that information on these segments may be useful to improve the results of numerous tasks in information retrieval and data mining areas. For this reason, there are many scientific works proposing different methods for Web pages segmentation. Generally speaking, the targeting methods found in the literature only use evidences of the page to be segmented. However, based on the observation that the pages of a site tend to have very similar layouts, we present a strategy based on machine learning that explores overall evidences of Web sites. Our method, which adopts Support Vector Machines for the learning process, and use the SOM structure (Site Object Model) to aggregate information from all pages of aWeb site, achieved good results when compared a manual segmentation approach, and with a recent approach in the literature.	eng
dc.description.sponsorship	CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior	-
dc.format	application/pdf	por
dc.thumbnail.url	http://200.129.163.131:8080//retrieve/9852/Disserta%c3%a7%c3%a3o%20-%20Caio%20Moura%20Daoud.pdf.jpg	*
dc.language	por	por
dc.publisher	Universidade Federal do Amazonas	por
dc.publisher.department	Instituto de Computação	por
dc.publisher.country	BR	por
dc.publisher.initials	UFAM	por
dc.publisher.program	Programa de Pós-graduação em Informática	por
dc.rights	Acesso Aberto	por
dc.subject	Segmentação de páginas Web	por
dc.subject	Aprendizagem de máquina	por
dc.subject	Árvore SOM	por
dc.subject	Web pages segmentation	eng
dc.subject	Machine learning	eng
dc.subject	SOMtree	eng
dc.subject.cnpq	CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO	por
dc.title	Aprendendo a segmentar páginas web	por
dc.type	Dissertação	por
Appears in Collections:	Mestrado em Informática

Files in This Item:

File	Description	Size	Format
Dissertação - Caio Moura Daoud.pdf	Dissertação - Caio Moura Daoud.pdf	3.12 MB	Adobe PDF	Download/Open Preview ×

Show simple item record Recommend this item

Universidade Federal do Amazonas