Exportar registro bibliográfico

Classificação de gênero via análise de áudio utilizando métodos de aprendizado de máquina tradicionais (2021)

  • Authors:
  • USP affiliated author: GIANESI, BRUNO HONORIO DO CARMO - EESC
  • School: EESC
  • Sigla do Departamento: SEM
  • Subjects: APRENDIZADO COMPUTACIONAL; CLASSIFICAÇÃO; RECONHECIMENTO DE VOZ
  • Keywords: Reconhecimento automático de gênero; Classificação de gênero
  • Language: Português
  • Abstract: A tarefa de classificação de gênero baseada na voz identifica automaticamente uma voz como masculina ou feminina, a partir de um arquivo de áudio. Ela tem sido amplamente utilizada e abordada por vários métodos computacionais diferentes, tanto os de aprendizado de máquina tradicionais como os de redes neurais profundas (Deep Learning). Neste trabalho, avaliamos métodos de aprendizado de máquina tradicionais e comparamos o uso de diferentes features e modelos em datasets distintos a fim de determinar a combinação que tem o melhor desempenho na tarefa de classificação de gênero baseada na voz. Além disso, também avaliamos o quanto os modelos treinados em um dataset de áudios em português do Brasil gravados em um ambiente controlado generalizam para outros contextos, como outros idiomas (escolhemos o inglês) e ambientes com ruído. Ainda, buscamos também entender se a duração do áudio utilizado no treinamento influencia na precisão dos modelos. Como resultado, constatamos que a combinação do modelo treinado com o método gradient boosting, utilizando a agregação das features de frequência fundamental, Mel-frequency cepstral coefficients (MFCCs) e estatísticas de frequência foi a que teve melhor acurácia no geral (94,1% no CETUC, 91,5% no MLS, 75,3% no Common Voice em português, 90,8% no MLS com ruído e 82,4% no Common Voice em inglês). Também inferimos que os modelos conseguiram generalizar para áudios em língua inglesa e com ruído, com bom desempenho. Por fim, em relação à duração do áudio, entendeu-se que, dependendo da feature utilizada, a precisão do modelo pode ser afetada negativamente com a redução da duração do dado.
  • Imprenta:

  • Download do texto completo

    Tipo Nome Link
    Versão Publicada Gianesi_Bruno_tcc.pdf Direct link
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      GIANESI, Bruno Honorio do Carmo. Classificação de gênero via análise de áudio utilizando métodos de aprendizado de máquina tradicionais. 2021. Trabalho de Conclusão de Curso (Graduação) – Escola de Engenharia de São Carlos, Universidade de São Paulo, São Carlos, 2021. Disponível em: https://bdta.abcd.usp.br/directbitstream/93fced06-d7a6-424d-bd41-fb39d0c175e1/Gianesi_Bruno_tcc.pdf. Acesso em: 23 abr. 2024.
    • APA

      Gianesi, B. H. do C. (2021). Classificação de gênero via análise de áudio utilizando métodos de aprendizado de máquina tradicionais (Trabalho de Conclusão de Curso (Graduação). Escola de Engenharia de São Carlos, Universidade de São Paulo, São Carlos. Recuperado de https://bdta.abcd.usp.br/directbitstream/93fced06-d7a6-424d-bd41-fb39d0c175e1/Gianesi_Bruno_tcc.pdf
    • NLM

      Gianesi BH do C. Classificação de gênero via análise de áudio utilizando métodos de aprendizado de máquina tradicionais [Internet]. 2021 ;[citado 2024 abr. 23 ] Available from: https://bdta.abcd.usp.br/directbitstream/93fced06-d7a6-424d-bd41-fb39d0c175e1/Gianesi_Bruno_tcc.pdf
    • Vancouver

      Gianesi BH do C. Classificação de gênero via análise de áudio utilizando métodos de aprendizado de máquina tradicionais [Internet]. 2021 ;[citado 2024 abr. 23 ] Available from: https://bdta.abcd.usp.br/directbitstream/93fced06-d7a6-424d-bd41-fb39d0c175e1/Gianesi_Bruno_tcc.pdf

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

    Digital Library of Academic Works of Universidade de São Paulo     2012 - 2024