@PHDTHESIS{ 2017:471830145, title = {Handling Concept Drift Based on Data Similarity and Dynamic Classifier Selection}, year = {2017}, url = "http://tede.ufam.edu.br/handle/tede/5956", abstract = "Em aplica??es do mundo real, algoritmos de aprendizagem de m?quina podem ser usados para detec??o de spam, monitoramento ambiental, detec??o de fraude, fluxo de cliques na Web, dentre outros. A maioria desses problemas apresenta ambientes que sofrem mudan?as com o passar do tempo, devido ? natureza din?mica de gera??o dos dados e/ou porque envolvem dados que ocorrem em fluxo. O problema envolvendo tarefas de classifica??o em fluxo cont?nuo de dados tem se tornado um dos maiores desafios na ?rea de aprendizagem de m?quina nas ?ltimas d?cadas, pois, como os dados n?o s?o conhecidos de antem?o, eles devem ser aprendidos ? medida que s?o processados. Al?m disso, devem ser feitas previs?es r?pidas a respeito desses dados para dar suporte ? decis?es muitas vezes tomadas em tempo real. Atualmente, m?todos baseados em monitoramento da acur?cia de classifica??o s?o geralmente usados para detectar explicitamente mudan?as nos dados. Entretanto, esses m?todos podem tornar-se invi?veis em aplica??es pr?ticas, especialmente devido a dois aspectos: a necessidade de uma realimenta??o do sistema por um operador humano, e a depend?ncia de uma queda significativa da acur?cia para que mudan?as sejam detectadas. Al?m disso, a maioria desses m?todos ? baseada em aprendizagem incremental, onde modelos de predi??o s?o atualizados para cada inst?ncia de entrada, fato que pode levar a atualiza??es desnecess?rias do sistema. A fim de tentar superar todos esses problemas, nesta tese s?o propostos dois m?todos semi-supervisionados de detec??o expl?cita de mudan?as em dados, os quais baseiam-se na estima??o e monitoramento de uma m?trica de pseudo-erro. O modelo de decis?o ? atualizado somente ap?s a detec??o de uma mudan?a. No primeiro m?todo proposto, o pseudo-erro ? monitorado a partir de m?tricas de similaridade calculadas entre a distribui??o atual e distribui??es anteriores dos dados. O segundo m?todo proposto utiliza sele??o din?mica de classificadores para aumentar a precis?o do c?lculo do pseudo-erro. Como consequ?ncia, nosso m?todo possibilita que conjuntos de classificadores online sejam criados a partir de auto-treinamento. Os experimentos apresentaram resultados competitivos quando comparados inclusive com m?todos baseados em aprendizagem incremental totalmente supervisionada. A proposta desses dois m?todos, especialmente do segundo, ? relevante por permitir que tarefas de detec??o e rea??o a mudan?as sejam aplic?veis em diversos problemas pr?ticos alcan?ando altas taxas de acur?cia, dado que, na maioria dos problemas pr?ticos, n?o ? poss?vel obter o r?tulo de uma inst?ncia imediatamente ap?s sua classifica??o feita pelo sistema.", publisher = {Universidade Federal do Amazonas}, scholl = {Programa de P?s-gradua??o em Inform?tica}, note = {Instituto de Computa??o} }