???item.export.label??? ???item.export.type.endnote??? ???item.export.type.bibtex???

Please use this identifier to cite or link to this item: https://tede.ufam.edu.br/handle/tede/9659
???metadata.dc.type???: Dissertação
Title: Q-learning baseado em pedágios com pagamento circunstancial
Other Titles: Toll-based Q-learning with circumstantial payment
???metadata.dc.creator???: Santos, Timóteo Fonseca 
???metadata.dc.contributor.advisor1???: Carvalho, Moisés Gomes de
???metadata.dc.contributor.referee1???: Souto, Eduardo James Pereira
???metadata.dc.contributor.referee2???: Oliveira, David Braga Fernandes de
???metadata.dc.contributor.referee3???: Salvatierra Junior, Mario
???metadata.dc.description.resumo???: Congestionamentos são um problema recorrente nas grandes cidades, resultando em perda de produtividade, poluição e diminuição da qualidade de vida. As técnicas existentes para resolução de congestionamentos de tráfego nem sempre são eficazes ou economicamente viáveis. No entanto, a implementação de sistemas de pedágio para controlar o fluxo de tráfego em áreas movimentadas já chegou a mostrar melhorias observáveis. A análise matemática e a simulação virtual surgem como ferramentas úteis para avaliar o custo-benefício de cada abordagem. Mitigar congestionamentos envolve equilibrar o desempenho ideal do sistema e o equilíbrio do usuário, exigindo incentivos para tornar alinhados o comportamento individual do motorista com melhorias no desempenho do sistema. Há uma ampla base teórica apoiando a eficácia de abordagens baseadas em pedágio. No entanto, a premissa comum de que todos os motoristas pagam pedágio pode limitar a eficiência dos modelos no mundo real devido a evasão ou limitações econômicas. Abordando esses desafios, este trabalho explora os impactos de diferentes níveis e modos de participação em sistemas de pedágio. Adaptamos uma abordagem baseada em pedágio existente para introduzir diversos cenários de pagamento seletivo de pedágio, e investigamos a viabilidade da adoção gradual de sistemas tarifários. Tendo implementado uma variação do algoritmo TQ-learning, conseguimos controlar parâmetros como a proporção de motoristas que pagam pedágio ou a proporção de ruas mais movimentadas onde o pedágio é obrigatório. Por meio de experimentos em múltiplas proporções, apresentamos resultados que ampliam a base de conhecimento para a tomada de decisão prática na resolução de congestionamentos. Nossas descobertas demonstram que quando o sistema de pedágio é implementado gradualmente por meio do crescente número de usuários que pagam regularmente, os ganhos são constantes e sem introduzir comportamento caótico. No entanto, ao introduzir pedágios por elos ou rotas dos mais aos menos movimentados, os resultados foram, na melhor das hipóteses, inconclusivos e, na pior, provocaram uma deterioração do desempenho do sistema em comparação com a ausência de implementação.
Abstract: Congestion is a recurring problem in large cities, leading to productivity loss, pollution, and decreased quality of life. Existing techniques for traffic congestion resolution are not always effective or economically viable. However, implementing toll systems to control traffic flow in busy areas has shown observable improvements. Mathematical analysis and virtual simulation emerge as useful tools to evaluate the cost-effectiveness of each approach. Mitigating congestion involves balancing the optimal system performance and user equilibrium, requiring incentives to align individual driver behavior with system improvements. Toll-based approaches have a theoretical foundation in effectively addressing this issue. However, the assumption that all drivers pay tolls may limit the real-world efficiency of the models due to non-compliance or economic limitations. Addressing these challenges, this work explores the impacts of different levels and modes of participation in toll systems. We adapt an existing toll-based approach to handle diverse scenarios of selective toll payment and investigate the viability of the gradual adoption of toll systems. Having implemented a variation of the TQ-learning algorithm with conditional payment, we can control parameters such as the proportion of toll-paying drivers or the proportion of roads where tolling is obligatory. Through experiments at multiple proportions, we present results that expand the knowledge base for practical decision-making in congestion resolution. Our findings demonstrate that when the toll system is gradually implemented through an increasing proportion of regularly-paying users the gains are steady without introducing chaotic behavior. However, when introducing tolling on a per-route or per-link basis the results were at best inconclusive and, at worst, they caused a deterioration of system performance compared to no implementation.
Keywords: Aprendizado do computador
Inteligência artificial
???metadata.dc.subject.cnpq???: CIENCIAS EXATAS E DA TERRA: CIENCIA DA COMPUTACAO
???metadata.dc.subject.user???: Aprendizagem de máquina
MCT - Marginal-cost tolling
Q-learning
Machine learning
TQ-learning
Congestionamento de tráfego
Traffic congestion
Language: por
???metadata.dc.publisher.country???: Brasil
Publisher: Universidade Federal do Amazonas
???metadata.dc.publisher.initials???: UFAM
???metadata.dc.publisher.department???: Instituto de Computação
???metadata.dc.publisher.program???: Programa de Pós-graduação em Ciências da Comunicação
Citation: SANTOS, Timóteo Fonseca. Q-learning baseado em pedágios com pagamento circunstancial. 2023. 81 f. Dissertação (Mestrado em Ciências da Comunicação) - Universidade Federal do Amazonas, Manaus (AM), 2023.
???metadata.dc.rights???: Acesso Aberto
???metadata.dc.rights.uri???: http://creativecommons.org/licenses/by/4.0/
URI: https://tede.ufam.edu.br/handle/tede/9659
Issue Date: 25-Jul-2023
Appears in Collections:Mestrado em Informática

Files in This Item:
File Description SizeFormat 
DiSS_TimoteoSantos_PPGI.pdf2.14 MBAdobe PDFThumbnail

Download/Open Preview


This item is licensed under a Creative Commons License Creative Commons