Aplicação de técnicas de aprendizagem de máquina na geração de índices para sistemas de busca

???item.export.label???

Please use this identifier to cite or link to this item: https://tede.ufam.edu.br/handle/tede/4517

Full metadata record

DC Field	Value	Language
dc.creator	Carvalho, André Luiz Costa	-
dc.contributor.advisor1	Moura, Edleno Silva de	-
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/4737852130924504	por
dc.contributor.referee1	Cristo, Marco	-
dc.contributor.referee2	Cavalcanti, João Marcos Bastos	-
dc.contributor.referee3	Silva, Altigran Soares da	-
dc.contributor.referee4	Ziviani, Nivio	-
dc.contributor.referee5	Heuser, Carlos A.	-
dc.date.issued	2012-11-26	-
dc.identifier.citation	CARVALHO, André Luiz Costa. Aplicação de técnicas de aprendizagem de máquina na geração de índices para sistemas de busca. 2012. 101 f. Tese (Doutorado em Informática) - Universidade Federal do Amazonas, Manaus, 2012.	por
dc.identifier.uri	http://tede.ufam.edu.br/handle/tede/4517	-
dc.description.resumo	Máquinas de busca estão entre as principais formas de se obter informações na internet,recebendo milhões de consultas diárias. Este volume avantajado de consultas gera uma considerável carga nos processadores de consultas das máquinas de busca, que devem não apenas se preocupar com a qualidade da resposta ﬁnal recebida pelos usuários, mas também com a latência desta consulta ,já que uma demora excessiva no tempo de resposta pode prejudicar a experiência de seus usuários. Nos últimos anos tem havido um considerável esforço de pesquisa na aplicação de técnicas de aprendizado de máquina durante o processamento de consultas, objetivando-se principalmente um aumento na qualidade ﬁnal de suas respostas. Nesta tese estudamos a aplicação de técnicas de aprendizagem de máquina durante a geração de índices, ao invés de aplicá-las ao processamento de consultas, abrindo portanto uma nova frente para a aplicação de técnicas de aprendizagem de máquina em sistemas de busca. Dentro do estudo, propomos duas técnicas para a aplicação de aprendizado de máquina na indexação de documentos em máquinas de busca, mostrando com isso que há espaço para melhorar a indexação com o uso dessas técnicas. A vantagem de tal abordagem é que, como esse processamento é feito antes das consultas serem feitas à maquina de busca, independente de quão custoso computacionalmente seja este processo, isto não reﬂetirá diretamente no tempo de processamento de consultas. Propomos aqui duas técnicas: LePrEF, uma técnica de fusão de evidências em tempo de indexação que tem como objetivo a melhoria do desempenho de máquinas de busca durante o processamento de consultas, por meio da geração de índices que codiﬁcam melhor a importância de cada termo em cada documento, e uma técnica de detecção de termos frasais (os sintagmas), com o objetivo de melhorar a qualidade das respostas obtidas por elas. A técnica LePrEF realiza a fusão de fontes de evidência de relevância em tempo de indexação utilizando para tanto aprendizagem de máquina. A necessidade da fusão de evidências no processamento de consultas deriva do fato de que sistemas de busca em geral utilizam diversas fontes de evidência para computar suas respostas, tais como o texto das páginas web, o texto dos apontadores recebidos por cada página, métodos de análise de apontadores como o PageRank, dentre muitos outros. Porém, o acréscimo de novas fontes de evidência leva também a novos custos de processamento. Isto, aliado ao constante crescimento na quantidade de conteúdo	por
dc.description.abstract	Search engines station between main Ways to Get INFORMATION on the Internet, receiving Million daily queries. This volume Query topping generates a considerable burden In Query processors of search machines, that should NOT JUST worry with a quality fi nal ANSWER received by users, but Also with a latency This consultation, JA What A delay excessive on MAY rhythm harm a RESPONSE Experience Users ITS. In the Last Year HAS A considerable effort been Research in Technical Application Machine Learning During Query Processing, aiming mainly um increase in the fi nal quality of YOUR answers. This thesis studied the Technical Application machine learning During the generation of indexes, rather than apply them to processing Queries, therefore opening a new front for the Technical Application of Learning Machine in search systems. Within the study, we propose two techniques for the Application Machine learning in the Document Indexing in search of machines with Showing THAT That there Space paragraph enhance an indexing with the use of these techniques. The advantage of this approach is that as THAT Processing And Done Before Consultations Made to be looking machine, Regardless of how costly this computationally BE Process, THIS IS NOT re fl directly etirá In Query Processing Time. We propose here Two techniques: LePrEF, One Evidence Fusion Technique Indexing Time Who Has As a search Purpose Machines Performance Improvement During Processing Consultations, THROUGH indexes Generation que CODI fi cam a Better importance of each term Each Document, AND A phrasal TERMS detection technique (phrases OS), with the objective of improve the quality of the responses obtained FOR THEM. The Technical LePrEF Performs a Relevance of Evidence Sources Fusion pace in Indexing using for both machine learning. The need for evidence of fusion not Drift Query Processing What do FACT search Systems in General Several use Evidence Sources To compute answers YOUR Such As the text of web pages, the text of IN pointers received each page, pointing Analysis Methods As the PageRank, Among many others. However, the recent increase Evidence Sources lev Also one New custodian processing. This is, coupled with the constant growth in the Content Quantity	por
dc.description.sponsorship	CNPq - Conselho Nacional de Pesquisa e Desenvolvimento Científico e Tecnológico	por
dc.format	application/pdf	*
dc.thumbnail.url	http://200.129.163.131:8080//retrieve/9988/Tese%20-%20Andr%c3%a9%20Luiz%20da%20Costa%20Carvalho.pdf.jpg	*
dc.language	por	por
dc.publisher	Universidade Federal do Amazonas	por
dc.publisher.department	Instituto de Computação	por
dc.publisher.country	Brasil	por
dc.publisher.initials	UFAM	por
dc.publisher.program	Programa de Pós-graduação em Informática	por
dc.rights	Acesso Aberto	por
dc.subject	Desempenho de máquina	por
dc.subject	Máquina de busca	por
dc.subject	Indexação	por
dc.subject	Sistema de busca	por
dc.subject.cnpq	CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO	por
dc.title	Aplicação de técnicas de aprendizagem de máquina na geração de índices para sistemas de busca	por
dc.type	Tese	por
Appears in Collections:	Doutorado em Informática

Files in This Item:

File	Description	Size	Format
Tese - André Luiz da Costa Carvalho.pdf	Tese - André Luiz da Costa Carvalho	748.22 kB	Adobe PDF	Download/Open Preview ×

Show simple item record Recommend this item

Universidade Federal do Amazonas