ESTUDO COMPARATIVO DOS ALGORITMOS DE APRENDIZADO DE  MÁQUINA NAIVE BAYES, ÁRVORE DE DECISÃO E REDES  NEURAIS ARTIFICIAIS PARA ANÁLISE DE SENTIMENTO –  IMPLEMENTAÇÃO COM PANDAS E SCIKIT-LEARN

Marcos Vinicius Zivolo; Sandra Cristina Costa Prado

PDF

Publicado: Dec 16, 2021

Palavras-chave:

Análise de sentimento, Python, Aprendizado de Máquina, Redes Neurais Artificiais, Naive Bayes, Árvores de Decisão

Marcos Vinicius Zivolo

a:1:{s:5:"pt_BR";s:12:"Fatec Mococa";}

Sandra Cristina Costa Prado

Resumo

O objetivo deste trabalho foi comparar as performances de três algoritmos de Aprendizado de Máquina aplicados à tarefa de análise de sentimento: naive Bayes, redes neurais artificiais e árvore de decisão. A implementação foi feita na linguagem Python, utilizando as bibliotecas pandas e scikit-learn. Com a técnica de análise de sentimento, as empresas podem automatizar o processo de classificar as opiniões de seus clientes contidas mensagens de texto, obtendo informações relevantes de forma mais eficaz, rápida e barata. Para realizar o trabalho, foi usada uma base de dados
disponível, gratuitamente, na internet. A biblioteca pandas foi usada na parte inicial para tarefas, como carregar, limpar organizar os dados em duas colunas, uma para os textos e uma para a sua classificação (positivo ou negativo). Tais dados, chamados de dados brutos, devem ser convertidos para um formato, chamado de Bag of Words, adequado para serem lidos e processados pelo programa. A partir deste ponto, foi usada a biblioteca scikit-learn para criar a Bag of Words, dividir os dados em dados de treinamento e de teste, realizar o treinamento e o teste e retornar o desempenho alcançado pelos algoritmos. Os algoritmos possuem uma série de valores que devem ser determinados: a obtenção destes valores consiste no aprendizado. Dentre os valores estão os chamados hiper parâmetros que podem ser atribuídos por especialistas, de forma heurística, ou por tentativa e erro. Neste trabalho, foi avaliado o recurso GridSearchCV, também da biblioteca scikit-learn para realizar estas atribuições de forma automática.

Edição

v. 5 n. 2 (2021): 8º Congresso Tecnológico da Fatec Mococa

Seção

Artigos

Este trabalho está licenciado sob uma licença Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

##plugins.themes.bootstrap3.article.sidebar##

##plugins.themes.bootstrap3.article.main##

Resumo

##plugins.themes.bootstrap3.article.details##