@MASTERSTHESIS{ 2018:634521208, title = {Modelos de T?picos baseados em Autocodificadores Variacionais utilizando as distribui??es Gumbel-Softmax e mistura de Normais-Log?sticas}, year = {2018}, url = "https://tede.ufam.edu.br/handle/tede/7439", abstract = "Modelos probabil?sticos de t?picos s?o modelos estat?sticos capazes de identificar t?picos em uma cole??o de texto. Eles s?o amplamente aplicados em tarefas relacionadas ? ?rea de Processamento de Linguagem Natural, uma vez que capturam com sucesso rela??es latentes por meio da an?lise de dados n?o rotulados. Entretanto, solu??es anal?ticas para a infer?ncia Bayesiana desses modelos s?o geralmente intrat?veis, dificultando a proposta de modelos probabil?sticos que sejam mais expressivos. Neste cen?rio, os Autocodificadores Variacionais (ACVs), m?todos que empregam uma rede de infer?ncia baseada em redes neurais respons?vel por estimar a distribui??o a posteriori, tornaram-se uma alternativa promissora para inferir distribui??es de t?picos em cole??es de texto. Estes modelos, contudo, tamb?m introduzem novos desafios, tal como a necessidade de distribui??es cont?nuas e reparametriz?veis que podem n?o se ajustar ?s distribui??es reais dos t?picos. Al?m disso, redes de infer?ncia tendem a apresentar um problema conhecido como colapso de componentes, onde apenas alguns t?picos contendo poucos termos correlacionados s?o efetivamente extra?dos. Para tentar evitar estes problemas, prop?em-se dois novos m?todos de t?picos. O primeiro (GSDTM) ? baseado em uma distribui??o cont?nua pseudocateg?rica denominada Gumbel-Softmax, capaz de gerar amostras aproximadamente categ?ricas, enquanto o segundo (LMDTM) adota uma mistura de distribui??es Normais-log?sticas, que pode ser adequada em cen?rios onde a distribui??o dos dados ? complexa. Apresenta-se tamb?m um estudo sobre o impacto que diferentes escolhas de modelagem t?m sobre os t?picos gerados, observando um compromisso entre coer?ncia dos t?picos e a qualidade do modelo gerador. Por meio de experimentos usando duas cole??es de dados de refer?ncia, tr?s m?tricas distintas de avalia??o quantitativa e uma inspe??o qualitativa, mostra-se que o modelo GSDTM supera de forma significativa os modelos de t?picos considerados estado da arte em grande parte dos cen?rios de teste, em termos de coer?ncia m?dia de t?picos e perplexidade.", publisher = {Universidade Federal do Amazonas}, scholl = {Programa de P?s-gradua??o em Inform?tica}, note = {Instituto de Computa??o} }