???item.export.label??? ???item.export.type.endnote??? ???item.export.type.bibtex???

Please use this identifier to cite or link to this item: https://tede.ufam.edu.br/handle/tede/7320
???metadata.dc.type???: Dissertação
Title: Uma abordagem para reconhecimento de emoção por expressão facial baseada em redes neurais de convolução
???metadata.dc.creator???: Cruz, Anderson Araújo da 
???metadata.dc.contributor.advisor1???: Barreto, Raimundo da Silva
???metadata.dc.contributor.referee1???: Oliveira, Elaine Harada Teixeira de
???metadata.dc.contributor.referee2???: Silva, Daniel Lins da
???metadata.dc.description.resumo???: Desenvolver a percepção emocional dos computadores é uma tendência tecnológica. O reconhecimento de emoção compõe sistemas cognitivos com aplicabilidade em diversas áreas. A expressão facial é uma maneira efetiva para reconhecer emoções, sobretudo por ser menos intrusiva na coleta de dados, quando comparada aos outros métodos, e pela facilidade de obter imagens da face diante da popularização das câmeras. Por meio das expressões faciais é possível classificar o grupo das emoções básicas (alegria, medo, surpresa, tristeza, desgosto e raiva) e neutralidade. Atualmente, as redes neurais de convolução (CNN) tem sido o estado da arte para classificação de imagens. Diante desse contexto, esta dissertação apresenta uma abordagem para reconhecer emoções por expressão facial utilizando CNN denominada como Single Shot Facial Expression Recognition (SSFER) e o seu uso em um estudo de caso. Inicialmente, um estudo experimental foi realizado para avaliar quatro detectores de faces em bases de expressões faciais e na VOC-2007. O método MMOD-CNN foi o melhor alcançando 91.89% de acurácia. Posteriormente, um outro estudo experimental foi conduzido a fim de comparar cinco arquiteturas de CNNs alternando quatro classificadores na última camada com intuito de classificar expressões faciais. As CNNs foram: VGGNet, InceptionResNetV2, InceptionV3, MobileNetV2 e ResidualNet, e os classificadores: Softmax, SVM, Random Forest e KNN. A ideia é que a CNN funcione como um extrator de características enviando um vetor unidimensional para o classificador definir a emoção. A melhor combinação foi a VGGNet com SVM alcançando 78.95% de acurácia. Desta forma, a abordagem proposta (SSFER) venceu com uma diferença de 9.74% de acurácia a API da Microsoft Cognitive Services em um comparação avaliando bases de expressões faciais. De um modo geral, as emoções alegria e surpresa foram as que tiveram maiores taxas de precisão. Em contrapartida, as emoções medo e raiva alcançaram as menores taxas de precisão. Um estudo de caso foi executado em um cenário real voltado para educação digital. Participaram vinte e sete estudantes do ensino médio com objetivo de responder um simulado do ENEM em uma plataforma digital. Durante a prova as expressões faciais dos estudantes foram coletadas, assim como, todas as interações com a plataforma. Após o simulado, as expressões faciais foram processadas para correlacionar com as interações de cliques e desempenho no teste. Análises de dados sugerem que a neutralidade pode estar relacionada ao estado de concentração e que estudantes passam a maior parte do tempo no estado de neutralidade. O estado de surpresa pode ser confundido aos bocejos possibilitando o reconhecimento de sonolência. E os estudantes que alcançaram as melhores notas no exame foram os que tiveram menor taxa de detecção de surpresa. Por fim, a abordagem proposta demostrou ser positiva para ser utilizada em aplicações gerais e, em particular, na educação digital.
Abstract: Developing the emotional perception of computers is a technological trend. Emotion recognition composes cognitive systems with applicability in several areas. Facial expression is an effective way to recognize emotions, especially because it is less intrusive in data collection when compared to other methods, and because it is easy to obtain facial images in view of the popularization of cameras. Through facial expressions it is possible to classify the group of basic emotions (joy, fear, surprise, sadness, disgust and anger) and neutrality. Currently, convolution neural networks (CNN) have been the state of the art for image classification. Given this context, this dissertation presents an approach to recognize facial expression emotions using CNN called Single Shot Facial Expression Recognition (SSFER) and its use in a case study. Initially, an experimental study was conducted to evaluate four face detectors in facial expression bases and in VOC-2007. The MMOD-CNN method was the best, reaching 91.89% accuracy. Subsequently, another experimental study was conducted to compare five CNN architectures by alternating four classifiers in the last layer to classify facial expressions. The CNNs were: VGGNet, InceptionResNetV2, InceptionV3, MobileNetV2 and ResidualNet, and the classifiers: Softmax, SVM, Random Forest and KNN. The idea is for CNN to function as a feature puller by sending a one-dimensional vector for the classifier to define emotion. The best combination was VGGNet with SVM reaching 78.95% accuracy. Thus, the proposed approach (SSFER) outperformed the Microsoft Cognitive Services API by 9.74% in a comparison by evaluating facial expression bases. Overall, the joy and surprise emotions had the highest accuracy rates. In contrast, the fear and anger emotions achieved the lowest accuracy rates. A case study was performed in a real scenario focused on digital education. Twenty-seven high school students participated in order to answer an ENEM mock on a digital platform. During the test the students' facial expressions were collected, as well as all interactions with the platform. After the simulated, facial expressions were processed to correlate with click interactions and test performance. Data analysis suggests that neutrality may be related to the state of concentration and that students spend most of their time in the state of neutrality. The state of surprise can be confused with yawning allowing the recognition of drowsiness. And the students who scored the highest on the exam had the lowest surprise detection rate. Finally, the proposed approach has been shown to be positive for use in general applications and in particular in digital education.
Keywords: Redes neurais (Computação)
Aprendizado do computador
Reconhecimento de padrões
Expressão facial
???metadata.dc.subject.cnpq???: CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
???metadata.dc.subject.user???: Reconhecimento de emoção
Expressão facial
Redes neurais de convolução
Computação afetiva
Detecção de afeto
Language: por
???metadata.dc.publisher.country???: Brasil
Publisher: Universidade Federal do Amazonas
???metadata.dc.publisher.initials???: UFAM
???metadata.dc.publisher.department???: Instituto de Computação
???metadata.dc.publisher.program???: Programa de Pós-graduação em Informática
Citation: CRUZ, Anderson Araújo da. Uma abordagem para reconhecimento de emoção por expressão facial baseada em redes neurais de convolução. 2019. 120 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2019.
???metadata.dc.rights???: Acesso Aberto
???metadata.dc.rights.uri???: http://creativecommons.org/licenses/by-sa/4.0/
URI: https://tede.ufam.edu.br/handle/tede/7320
Issue Date: 2-Aug-2019
Appears in Collections:Mestrado em Informática

Files in This Item:
File Description SizeFormat 
Dissertação_AndersonCruz_PPGI.pdf5.63 MBAdobe PDFThumbnail

Download/Open Preview


This item is licensed under a Creative Commons License Creative Commons