???item.export.label??? ???item.export.type.endnote??? ???item.export.type.bibtex???

Please use this identifier to cite or link to this item: https://tede.ufam.edu.br/handle/tede/8295
???metadata.dc.type???: Dissertação
Title: Classificação de produtos com base em descrições textuais
Other Titles: Product Classification Based on Textual Descriptions
???metadata.dc.creator???: Gomes, Manoel Aquino 
???metadata.dc.contributor.advisor1???: Moura, Edleno Silva de
???metadata.dc.contributor.referee1???: Silva, Altigran Soares da
???metadata.dc.contributor.referee2???: Rosa, Thierson Couto
???metadata.dc.description.resumo???: Muitas aplicações de e-commerce lidam com grandes conjuntos de dados de produtos que precisam ser classificados em uma taxonomia predefinida de categorias. Além disso, em alguns cenários práticos, o conjunto de dados é volátil, com novos produtos sendo frequentemente lançados e introduzidos nas categorias existentes. A classificação de produtos tem se tornado uma tarefa essencial para o bom funcionamento de plataformas de vendas em ambientes de e-commerce, facilitando a organização e o acesso à informação nos sites das empresas. Nesta dissertação, estudamos e discutimos métodos eficientes e eficazes para a classificação de produtos. Apesentamos uma solução rápida e competitiva para classificação baseada em Language Models para classificar produtos e discutimos o uso de um método de classificação proposto na literatura que tem sido usado com sucesso em outras aplicações, o FastText, adaptando-o e estudando-o no cenário de classificação de produtos. Estudamos formas de combinar os métodos propostos à segmentação da descrição de produtos, uma ideia utilizada anteriormente na literatura, e apresentamos experimentos com 3 bases de dados de produtos onde comparamos o desempenho das alternativas estudadas. Os resultados apresentados indicam que tanto o método baseado em language models quanto o FastText apresentam resultados qualitativos bem competitivos quando comparados a um modelo de classificação baseado em redes neurais que é considerado estado-da-arte. Os resultados foram obtidos com uma redução significativa nos custos e no tempo de processamento necessários para realizar os experimentos nas 3 bases de dados estudadas.
Abstract: Many e-commerce applications have to deal with a large set of product data that needs to be classified into a predefined product category taxonomy. In addi- tion, in some practical scenarios, the data set is volatile, with new products being frequently launched and introduced in these product categories. Product classification has become an essential task for the good functioning of sales platforms in e-commerce environments, facilitating the organization and access to information on the companies’ websites. In this dissertation, we study and discuss efficient and effective methods for product classification. We present a fast and competitive solution for classification based on Language Models to classify products and discuss the use of a classification method proposed in the literature that has been used successfully in other applications, FastText, adapting and studying it in the product classification scenario. We studied ways of combining the proposed methods with product description segmentation, an idea previously used in the literature, and we presented experiments with 3 product databases where we compared the performance of the alternatives studied. The results presented indicate that both the method based on Language Models and FastText present very competitive qualitative results when compared to a classification model based on neural networks that is considered state-of-the-art. The results were obtained with a significant reduction in costs and in the processing time necessary to carry out the experiments in the 3 databases studied.
Keywords: Comércio eletrônico
Redes neurais (Computação)
???metadata.dc.subject.cnpq???: CIENCIAS EXATAS E DA TERRA: CIENCIA DA COMPUTACAO: TEORIA DA COMPUTACAO: ANALISE DE ALGORITMOS E COMPLEXIDADE DE COMPUTACAO
???metadata.dc.subject.user???: Aprendizagem de Máquina
Classificação de Produtos
Modelos de Linguagens
Language: por
???metadata.dc.publisher.country???: Brasil
Publisher: Universidade Federal do Amazonas
???metadata.dc.publisher.initials???: UFAM
???metadata.dc.publisher.department???: Instituto de Computação
???metadata.dc.publisher.program???: Programa de Pós-graduação em Informática
Citation: GOMES, Manoel Aquino. Classificação de produtos com base em descrições textuais. 2021. 50 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus (AM), 2021.
???metadata.dc.rights???: Acesso Aberto
???metadata.dc.rights.uri???: http://creativecommons.org/licenses/by/4.0/
URI: https://tede.ufam.edu.br/handle/tede/8295
Issue Date: 13-May-2021
Appears in Collections:Mestrado em Informática

Files in This Item:
File Description SizeFormat 
Dissertacao_ManoelGomes_PPGI.pdf2.01 MBAdobe PDFThumbnail

Download/Open Preview


This item is licensed under a Creative Commons License Creative Commons