@MASTERSTHESIS{ 2020:853826557, title = {Impacto de t?cnicas de pr?-processamento de texto na detec??o de inten??o e extra??o de par?metros em sistemas de di?logo orientados a tarefa}, year = {2020}, url = "https://tede.ufam.edu.br/handle/tede/7933", abstract = "Devido ? popularidade da internet e ao baixo pre?o de dispositivos m?veis, as pessoas mudaram a forma como interagem umas com as outras e com empresas. No passado, a internet impulsionou o crescimento do com?rcio eletr?nico, inicialmente com pessoas fazendo compras por meio de computadores pessoais e mais recentemente utilizando dispositivos m?veis, quando o com?rcio eletr?nico passou a ser chamado tamb?m como com?rcio m?vel. Nos ?ltimos anos, ao lado do crescimento do com?rcio m?vel, o n?mero de usu?rios ativos em aplicativos de trocas de mensagens tamb?m cresceu. Em resposta a tal fen?meno, empresas de v?rios setores t?m investido no atendimento a seus clientes por meio deste tipo de aplicativos, contudo, manter pessoal qualificado para atender os clientes pode gerar alto custo. Al?m do custo, o atendimento tamb?m pode ficar demorado em momentos de pico, gerando insatisfa??o por parte dos clientes. Neste cen?rio o desenvolvimento de sistemas de di?logo orientados a tarefa surge como uma alternativa para o atendimento ? clientes, gra?as a sua capacidade de atender a um grande n?mero de clientes de forma ininterrupta, com boa velocidade de resposta e baixo custo. A crescente demanda por esses sistemas e os desafios envolvidos em sua constru??o, nos motivou a estudar sobre esse tipo de sistema. Neste estudo aprendemos que existe uma fase no desenvolvimento chamada de compreens?o de linguagem natural, cujo prop?sito ? identificar a inten??o do usu?rio a cada frase dita por ele, assim como par?metros relacionados a essa inten??o identificada. Este prop?sito pode ser alcan?ado por meio de duas tarefas, conhecidas como: detec??o de inten??o e extra??o de par?metros. Por serem tarefas conhecidas na literatura de sistema de di?logos, e possu?rem diversos trabalhos j? publicados ao longo de anos, propomos nesta disserta??o um estudo sobre o impacto do uso de t?cnicas de pr?-processamento de texto aplicado em modelos utilizados nessas duas tarefas. Mais precisamente, escolhemos t?cnicas como stemmer, lematiza??o, remo??o de stopwords e uso de Word Embeddings para serem utilizados em nossos experimentos. Os experimentos foram realizados em 3 bases de dados de refer?ncia para o problema estudado, conclu?mos que nem todas as t?cnicas de pr?-processamento escolhidas impactam de forma positiva quando aplicadas em trabalhos publicados na literatura. Diante das t?cnicas comparadas, apenas o stemmer resultou em ganho, um ganho de at? 3% na revoca??o da tarefa de extra??o de par?metros custando uma pequena perda de 0.9% na precis?o da mesma tarefa. J? as t?cnicas de lematiza??o, remo??o de stopwords e Word Embeddings resultaram em perdas na revoca??o e precis?o. Ao analisar os resultados negativos conclu?mos que a lematiza??o confunde o modelo por apresentar diferentes lemas para uma mesma palavra, enquanto que a remo??o de stopwords remove as preposi??es e artigos que s?o importantes para contextualizar e localizar os par?metros a serem extra?dos, no caso dos Word Embeddings a configura??o dos trabalhos comparados n?o favoreceu o uso da t?cnica.", publisher = {Universidade Federal do Amazonas}, scholl = {Programa de P?s-gradua??o em Inform?tica}, note = {Instituto de Computa??o} }