@PHDTHESIS{ 2016:2066229202, title = {Processamento eficiente de consultas em sistemas de busca}, year = {2016}, url = "http://tede.ufam.edu.br/handle/tede/5581", abstract = "Trabalhos na literatura prop?em diferentes t?cnicas para processamento de consultas em sistemas de busca. Esses sistemas s?o capazes de buscar informa??o relevante dentro de grandes cole??es de dados e est?o entre as principais formas de se obter informa??es na Internet. A populariza??o desses sistemas, associada ao crescimento constante de dispositivos eletr?nicos para armazenamento e produ??o de informa??o, impulsionam pesquisas n?o apenas em rela??o ? qualidade da resposta final fornecida aos usu?rios mas tamb?m com rela??o ? redu??o no tempo de processamento de consultas. O foco principal deste trabalho ? o desenvolvimento de solu??es que reduzam o tempo de processamento de consultas sem afetar a qualidade de respostas fornecidas por sistemas de busca. Como usu?rios tipicamente est?o interessado apenas em um determinado n?mero de respostas do topo do ranking, estudamos o cen?rio mais comum onde busca-se computar rapidamente apenas os k documentos de maior escore dentre os que atendem ?s consultas dos usu?rios. S?o propostos, implementados e avaliados dois novos m?todos de processamento de consultas, o m?todo Block Max WAND with Candidate Selection and Preserving Top- K Results (BMW-CSP) e o m?todo Waves. Os dois m?todos utilizam uma abordagem documento-a-documento e ?ndices em multi-camadas como base para reduzir o tempo de processamento de consultas. O m?todo BMW-CSP ? uma extens?o do m?todo BMW-CS, um m?todo proposto anteriormente na literatura. Apesar de muito eficiente, o BMW-CS apresenta a desvantagem de n?o garantir a corretude dos resultados do topo das respostas em sistemas de busca por poder descartar documentos que estariam originalmente entre as melhores respostas. O m?todoBMW-CSP modifica oBMW-CS para resolver o problema, tornando-se um m?todo que calcula corretamente o escore de todos os documentos. Tanto o m?todo BMW-CS quanto o BMW-CSP apresentam como desvantagem a necessidade de utilizar mem?ria extra para armazenar resultados parciais obtidos pelos m?todos durante o processamento de consultas. Estudando mais a fundo o problema, prop?s-se aqui um novo algoritmo que n?o requer tal expa?o extra de armazenamento, o algoritmo Waves. O m?todoWaves realiza passadas sucessivas pelas diversas camadas dos ?ndices. Cada passagem foi denominada aqui de wave (onda em ingl?s), o que deu origem ao nome do m?todo. Cada passagem sobre o ?ndice ? numerada e dada uma i-?sima passagem, ela processa o ?ndice apenas da i-?sima camada em diante. Ap?s cada passagem, o algoritmo faz uma verifica??o para saber se j? se pode garantir que os k maiores escores de documentos j? foram computados corretamente. Se houver garantia, o algoritmo para o processamento. Do contr?rio, o algoritmo executa uma nova passagem no ?ndice at? que o resultado correto seja matematicamente garantido. Os experimentos realizados com diferentes bases e cen?rios indicam que os dois novos m?todos podem processar consultas at? duas vezes mais r?pido que os principais m?todos propostos anteriormente na literatura.", publisher = {Universidade Federal do Amazonas}, scholl = {Programa de P?s-gradua??o em Inform?tica}, note = {Instituto de Computa??o} }