| ???jsp.display-item.social.title??? |
|
Please use this identifier to cite or link to this item:
https://tede.ufam.edu.br/handle/tede/11337| ???metadata.dc.type???: | Dissertação |
| Title: | Recuperação de paisagens sonoras: uma análise de técnicas de fusão de vetores de embeddings pré-treinados |
| Other Titles: | Improving Soundscape Retrieval for Bioacoustic Monitoring: An Analysis of Fusion Techniques with Pre-trained Embeddings |
| ???metadata.dc.creator???: | Peralta de Aguas, Andres David ![]() |
| ???metadata.dc.contributor.advisor1???: | Colonna, Juan Gabriel |
| ???metadata.dc.contributor.referee1???: | Cristo, Marco Antonio Pinheiro de |
| ???metadata.dc.contributor.referee2???: | Carvalho, André Luiz da Costa |
| ???metadata.dc.description.resumo???: | A recuperação de paisagens sonoras semelhantes é essencial para o monitoramento bioacústico e ecoacústico, tarefas que continuam sendo desafiadora devido ao grande volume de dados não rotulados, ao ruído ambiental e à complexidade das cenas acústicas. Este estudo propõe um sistema eficiente que integra embeddings extraídos de um modelo de deep learning pré-treinado, combinados com uma técnica de redução de ruído e estratégias de fusão de vetores de features para viabilizar a recuperação baseada em similaridade em uma base de dados vetorial. Avaliamos o sistema utilizando gravações de aves, anfíbios e mamíferos em quatro metodologias experimentais, incluindo um estudo de caso focado em espécies ameaçadas. Os resultados mostram que os vetores de embeddings superam consistentemente as features tradicionais de MFCC na captura da similaridade acústica e que o algoritmo de busca aproximada (HNSW) melhora significativamente tanto a precisão da recuperação quanto a eficiência das consultas. Além disso, o sistema recupera de forma eficaz gravações da espécie criticamente ameaçada Crax alberti, permitindo o mapeamento de sua distribuição geográfica e destacando seu potencial para o planejamento da conservação. |
| Abstract: | The retrieval of similar soundscapes is essential for bioacoustic and ecoacoustic monitoring, tasks that remain challenging due to the large volume of unlabeled data, environmental noise, and the complexity of acoustic scenes. This study proposes an efficient system that integrates embeddings extracted from a pre-trained deep learning model, combined with a noise reduction technique and feature vector fusion strategies to enable similarity-based retrieval in a vector database. We evaluated the system using bird, amphibian, and mammal recordings across four experimental methodologies, including a case study focused on endangered species. The results show that embedding vectors consistently outperform traditional MFCC features in capturing acoustic similarity and that the approximate search algorithm (HNSW) significantly improves both retrieval precision and query efficiency. Additionally, the system effectively retrieves recordings of the critically endangered species Crax alberti, allowing for the mapping of its geographic distribution and highlighting its potential for conservation planning. |
| ???metadata.dc.subject.cnpq???: | CIENCIAS EXATAS E DA TERRA: CIENCIA DA COMPUTACAO |
| ???metadata.dc.subject.user???: | Monitoramento bioacústico Ecoacústica Modelos Deep Learning pré-treinados Base de dados vetorial |
| Language: | por |
| ???metadata.dc.publisher.country???: | Brasil |
| Publisher: | Universidade Federal do Amazonas |
| ???metadata.dc.publisher.initials???: | UFAM |
| ???metadata.dc.publisher.department???: | Instituto de Computação |
| ???metadata.dc.publisher.program???: | Programa de Pós-graduação em Informática |
| Citation: | PERALTA DE AGUAS, Andrés David. Recuperação de paisagens sonoras: uma análise de técnicas de fusão de vetores de embeddings pré-treinados. 2025. 162 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus (AM), 2025. |
| ???metadata.dc.rights???: | Acesso Aberto |
| ???metadata.dc.rights.uri???: | https://creativecommons.org/licenses/by-nc-nd/4.0/ |
| URI: | https://tede.ufam.edu.br/handle/tede/11337 |
| Issue Date: | 25-Sep-2025 |
| Appears in Collections: | Mestrado em Informática |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| DISS_AndresPeraltadasAguas_PPGI.pdf | 17.67 MB | Adobe PDF | Download/Open Preview |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

