@PHDTHESIS{ 2020:1278869637, title = {Uma abordagem de aprendizagem profunda que usa funções assimétricas para modelagem de pontuação de crédito no varejo}, year = {2020}, url = "https://tede.ufam.edu.br/handle/tede/7944", abstract = "Instituições credoras precisam lidar com as incertezas do negócio, criando estratégias que diminuam os riscos associados à concessão de crédito de seus clientes. Para lidar com este problema, foram desenvolvidos modelos quantitativos de previsão de risco baseados em dados cadastrais e comportamentais dos clientes. Nos últimos anos, novas gerações destes modelos, baseadas em aprendizagem de máquina, têm sido comumente usadas por instituições financeiras e de varejo. De forma geral, este problema é formulado como um problema de classificação binária onde se deseja discriminar bons de maus pagadores. Por este ser um problema de natureza desbalanceada (normalmente, há mais bons que maus pagadores), é comum a adoção de estratégias que levam à sub-representação ou extrapolação de dados e, consequentemente, com alteração da distribuição real das amostras, o que pode influenciar negativamente no desempenho dos modelos. Além disso, muitas vezes estes modelos não tiram proveito de particularidades das políticas de crédito nas quais eles serão empregados. Estas podem dar diferente valor para diferentes tipos de erro, aplicando diferentes critérios para diferentes partes das listas ordenadas de escores de crédito. Uma forma de lidar com tais problemas é criar modelos que aprendam diretamente o ranking de crédito (ou seja, qual a ordem esperada entre dois clientes, dado os seus riscos) em lugar da distinção entre bons e maus. Um inconveniente desta abordagem é que ela tem custo de aprendizado maior, uma vez que o modelo deve analisar pares de instâncias. Contudo, a literatura recente de aprendizagem de máquina tem produzido muitas técnicas de equivalência de problemas capazes de otimizar tarefas de ranking de forma robusta a desbalanceamento, com custos de treino comuns aos da tarefa de classificação. Além disso, com grandes massas de dados e complexos padrões típicos de modelos de comportamento usados no varejo, é possível adotar modelos baseados em aprendizagem profunda, que têm sido usados com sucesso em uma grande variedade de aplicações. Neste trabalho, apresentamos modelos de aprendizagem profunda para o problema de modelagem de crédito para varejo que envolve dados comportamentais na entrada. Para tanto, tratamos o problema com uma solução de equivalência entre classificação binária e ranking bipartido, utilizando para isso uma função de perda assimétrica, com hiper-parâmetros aprendidos durante o treino. Desta forma, associamos as vantagens das soluções de classificação binária com as de um modelo de ranking bipartido, ou seja, baixo custo de treinamento, possibilidade de calibrar o grau de tolerância a erros em partes específicas do ranking e robustez a desbalanceamento. Por meio da avaliação em dois conjuntos de dados de grande escala, um público e outro privado, observamos que o modelo proposto é capaz de superar vários outros modelos baseados em aprendizagem superficial e profunda.", publisher = {Universidade Federal do Amazonas}, scholl = {Programa de Pós-graduação em Informática}, note = {Instituto de Computação} }