ESTUDO COMPARATIVO DOS ALGORITMOS DE APRENDIZADO DE MÁQUINA NAIVE BAYES, ÁRVORE DE DECISÃO E REDES NEURAIS ARTIFICIAIS PARA ANÁLISE DE SENTIMENTO – IMPLEMENTAÇÃO COM PANDAS E SCIKIT-LEARN
##plugins.themes.bootstrap3.article.main##
Resumo
O objetivo deste trabalho foi comparar as performances de três algoritmos de Aprendizado de Máquina aplicados à tarefa de análise de sentimento: naive Bayes, redes neurais artificiais e árvore de decisão. A implementação foi feita na linguagem Python, utilizando as bibliotecas pandas e scikit-learn. Com a técnica de análise de sentimento, as empresas podem automatizar o processo de classificar as opiniões de seus clientes contidas mensagens de texto, obtendo informações relevantes de forma mais eficaz, rápida e barata. Para realizar o trabalho, foi usada uma base de dados
disponível, gratuitamente, na internet. A biblioteca pandas foi usada na parte inicial para tarefas, como carregar, limpar organizar os dados em duas colunas, uma para os textos e uma para a sua classificação (positivo ou negativo). Tais dados, chamados de dados brutos, devem ser convertidos para um formato, chamado de Bag of Words, adequado para serem lidos e processados pelo programa. A partir deste ponto, foi usada a biblioteca scikit-learn para criar a Bag of Words, dividir os dados em dados de treinamento e de teste, realizar o treinamento e o teste e retornar o desempenho alcançado pelos algoritmos. Os algoritmos possuem uma série de valores que devem ser determinados: a obtenção destes valores consiste no aprendizado. Dentre os valores estão os chamados hiper parâmetros que podem ser atribuídos por especialistas, de forma heurística, ou por tentativa e erro. Neste trabalho, foi avaliado o recurso GridSearchCV, também da biblioteca scikit-learn para realizar estas atribuições de forma automática.
##plugins.themes.bootstrap3.article.details##

Este trabalho está licenciado sob uma licença Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.