@MASTERSTHESIS{ 2025:529230284, title = {Estimação de Múltiplos Pitches em Áudio Musical Polifônico Utilizando Rede Neural Convolucional}, year = {2025}, url = "https://tede.ufam.edu.br/handle/tede/11342", abstract = "Pitch é a percepção auditiva da altura de um som, relacionada principalmente à sua frequência fundamental. A estimativa de pitch em áudio musical é uma tarefa desafiadora no campo da recuperação de informação musical (MIR). Determinar com precisão a frequência fundamental (F0) das notas musicais é crucial para várias aplicações, incluindo transcrição musical, extração de melodia e análise de áudio. O problema é complicado por fatores como polifonia, ruído de fundo e variações no timbre e na dinâmica. Métodos tradicionais para estimativa de pitch, enfrentando essas complexidades, muitas vezes produzem resultados imprecisos ou pouco confiáveis. Recentes avanços no aprendizado profundo, particularmente o uso de redes neurais convolucionais (CNNs), têm se mostrado promissores na resolução desses desafios. As CNNs são capazes de aprender representações hierárquicas a partir de dados de áudio brutos, capturando efetivamente as características temporais e espectrais essenciais para uma estimativa de pitch precisa. Este trabalho explora o problema da estimativa de múltiplos pitches em áudio musical. Discutimos as inovações na arquitetura do modelo CREPE e estratégias de treinamento que tornam o modelo capaz de estimar múltiplos pitches. Os resultados demonstraram desempenho robusto em diferentes situações. Em conjuntos de validação com múltiplas frequências, o novo modelo proposto apresentou valores elevados de RPA, com média global próxima de 0,93, evidenciando sua capacidade de identificar corretamente pitches simultâneos.", publisher = {Universidade Federal do Amazonas}, scholl = {Programa de Pós-graduação em Engenharia Elétrica}, note = {Faculdade de Tecnologia} }