@MASTERSTHESIS{ 2015:1927214654, title = {Uma investiga??o do uso de caracter?sticas na tetec??o de URLs}, year = {2015}, url = "http://tede.ufam.edu.br/handle/tede/4740", abstract = "URLs maliciosas tornaram-se um canal para atividades criminosas na Internet, como spam e phishing. As atuais solu??es para valida??o e verifica??o de URLs maliciosas se consideram ou s?o consideradas precisas, com resultados bem ajustados. Contudo, ser? que realmente ? poss?vel ou fact?vel se obter percentuais beirando 100% de precis?o nessas solu??es? Neste sentido, esta disserta??o descreve uma simples e direta investiga??o de caracter?sticas, bases e formatos de URLs, visando mostrar que os resultados de valida??o e verifica??o de URLs s?o bastante dependentes de certos aspectos/fatores. A ideia ? extrair caracter?sticas (l?xicas, DNS e outras) que permitam obter o m?ximo de informa??o das URLs e empregar algoritmos de aprendizagem de m?quina para questionar a influ?ncia dessas caracter?sticas em todo o processo. Como forma de provar essa ideia, foram elaboramos quatro hip?teses, que ao final no trabalho, mostraram que ? poss?vel discordar do resultado de v?rios trabalhos j? existentes na literatura.", publisher = {Universidade Federal do Amazonas}, scholl = {Programa de P?s-gradua??o em Inform?tica}, note = {Instituto de Computa??o} }