Exportar registro bibliográfico

Otimização utilizando o Algoritmo das Abelhas de hiperparâmetros do método Advantage Actor-Critic com treinamento limitado (2023)

  • Authors:
  • USP affiliated author: SINOARA, GUILHERME HIROSHI - ICMC
  • School: ICMC
  • Subjects: ALGORITMOS GENÉTICOS; INTELIGÊNCIA ARTIFICIAL; OTIMIZAÇÃO MATEMÁTICA
  • Keywords: Aprendizado por reforço; Hiperparâmetros; Advantage Actor-Critic; Meta-heurística; Algoritmo das Abelhas
  • Language: Português
  • Abstract: As técnicas de aprendizado por reforço geralmente requerem muitos dados para que apresentem um resultado satisfatório. Neste trabalho foi utilizado o Algoritmo das Abelhas para otimização de hiperparâmetros do método Advantage Actor-Critic para obter um desempenho aceitável utilizando um número limitado de episódios no ambiente Cart Pole. É proposta uma metodologia para avaliação dos conjuntos de hiperparâmetros encontrados baseada no treinamento e avaliação de múltiplos agentes. Os resultados mostram que, embora seja necessário cuidado em como os hiperparâmetros são avaliados, é possível conseguir agentes que apresentam bons resultados com poucos episódios de treinamento utilizando o Algoritmo das Abelhas.
  • Imprenta:

  • Download do texto completo

    Tipo Nome Link
    Versão Publicada Guilherme Hiroshi Sinoara... Direct link
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      SINOARA, Guilherme Hiroshi. Otimização utilizando o Algoritmo das Abelhas de hiperparâmetros do método Advantage Actor-Critic com treinamento limitado. 2023. Trabalho de Conclusão de Curso (MBA) – Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, 2023. Disponível em: https://bdta.abcd.usp.br/directbitstream/c95c5b78-c756-4d43-8298-94d7ef812b7b/Guilherme%20Hiroshi%20Sinoara.pdf. Acesso em: 30 abr. 2024.
    • APA

      Sinoara, G. H. (2023). Otimização utilizando o Algoritmo das Abelhas de hiperparâmetros do método Advantage Actor-Critic com treinamento limitado (Trabalho de Conclusão de Curso (MBA). Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos. Recuperado de https://bdta.abcd.usp.br/directbitstream/c95c5b78-c756-4d43-8298-94d7ef812b7b/Guilherme%20Hiroshi%20Sinoara.pdf
    • NLM

      Sinoara GH. Otimização utilizando o Algoritmo das Abelhas de hiperparâmetros do método Advantage Actor-Critic com treinamento limitado [Internet]. 2023 ;[citado 2024 abr. 30 ] Available from: https://bdta.abcd.usp.br/directbitstream/c95c5b78-c756-4d43-8298-94d7ef812b7b/Guilherme%20Hiroshi%20Sinoara.pdf
    • Vancouver

      Sinoara GH. Otimização utilizando o Algoritmo das Abelhas de hiperparâmetros do método Advantage Actor-Critic com treinamento limitado [Internet]. 2023 ;[citado 2024 abr. 30 ] Available from: https://bdta.abcd.usp.br/directbitstream/c95c5b78-c756-4d43-8298-94d7ef812b7b/Guilherme%20Hiroshi%20Sinoara.pdf

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

    Digital Library of Academic Works of Universidade de São Paulo     2012 - 2024