@MASTERSTHESIS{ 2016:918120671, title = {Uma estrat?gia eficiente de treinamento para Programa??o Gen?tica aplicada a deduplica??o de registros}, year = {2016}, url = "http://tede.ufam.edu.br/handle/tede/5552", abstract = "O volume de informa??o em formato digital tem aumentado consideravelmente nas ?ltimas d?cadas, e isso tem causado preocupa??o entre os administradores de grandes reposit?rios de dados. Trabalhar com esse crescimento e proteger os dados de forma eficaz ? um desafio ainda maior. Em muitos reposit?rios, o principal problema ? a exist?ncia de dados replicados. Isso pode afetar a qualidade dos dados e a capacidade de fornecer servi?os que atendam as demandas dos seus clientes. Por?m, a remo??o de registros replicados ? uma tarefa que exige muito tempo e poder de processamento computacional. Atualmente, uma das t?cnicas que vem sendo utilizada de forma eficaz no processo de remo??o de registros replicados ? a Programa??o Gen?tica (PG). Uma das principais caracter?sticas dessa t?cnica ? que ela exige exemplos para a realiza??o da etapa de treinamento. Outra caracter?stica importante ? que a PG exige um alto custo computacional para ser aplicada, al?m do esfor?o para gerar os exemplos do treino. No problema de deduplica??o um dos maiores custos durante a etapa de treino ? causado pela necessidade de comparar cada um dos registros com todos os outros registros existentes no banco de dados. Assim, o tempo gasto para realizar essas compara??es durante o treino ? muito grande. A partir desse problema, esta disserta??o prop?e uma abordagem baseada na combina??o de uma t?cnica de agrupamento e janela deslizante, visando minimizar a quantidade de compara??es exigidas na etapa de treinamento da PG. Experimentos utilizando dados reais e sint?ticos, mostram que ? poss?vel reduzir o custo de treinamento em at? 70%, sem uma redu??o significativa na qualidade das solu??es geradas.", publisher = {Universidade Federal do Amazonas}, scholl = {Programa de P?s-gradua??o em Inform?tica}, note = {Instituto de Computa??o} }