Biblioteca

Seja um dos 15 apoiadores do Ludopédio e faça parte desse time! APOIAR AGORA
Dissertação

Aprendizado de modelos preditivos sobre o sentimento de grupos de pessoas

Uma aplicação no domínio das torcidas de futebol
Ano

2016

Faculdade/Universidade

Instituto de Informática Aplicada, Universidade de Fortaleza

Orientador(a)

Vasco Furtado

Tema

Dissertação

Área de concentração

Mestrado em Sistemas de Informação Inteligentes

Páginas

76

Arquivos

Resumo

A análise de sentimento é uma área de pesquisa que objetiva extrair o sentimento expressado por usuários de diversos meios de comunicação na Internet, como avaliações de produtos, filmes ou auxiliando em estratégias de marketing. Em alguns casos, o sentimento de grupos de pessoas evolui ao longo do tempo impactados por eventos que ocorrem de forma recorrente. Este trabalho objetiva criar modelos preditivos de sentimentos, sendo assim foram feitos estudos com base nos Modelos Ocultos de Markov – MOM, para estimar o sentimento de torcedores de times de futebol baseado em informações sobre resultados de jogos. Os modelos foram construídos com dados coletados de uma rede social de torcedores de futebol em que os torcedores são incentivados a periodicamente expressarem seus sentimentos com relação a seu time. Foi mostrado que a escolha de MOM é justificada pelo fato de que a mudança do sentimento de torcedores é análoga ao processo de Markov de mudança de estados no tempo. Avaliações comparativas foram feitas entre variações dos modelos propostos e também com o modelo que obteve maior taxa de acerto com algoritmos de classificação. O Modelo de Markov de segunda ordem, considerando os resultados das partidas e apostas de torcedores nos jogos, é o modelo com maior taxa de acerto, mesmo sendo construído com informações de diferentes campeonatos.

Abstract

Sentiment analysis is an area of research that aims to extract the sentiment expressed by users of diverse media on the Internet, such as product reviews, movies, or ancillary marketing strategies. In some cases, the sentiment of groups of people has evolved over time impacted by recurring events. This work aims to create predictive models of sentiments, thus studies were done based on Hidden Markov Models – HMM, with the objective of estimating the sentiment of soccer teams fans based on information about results of matches. Observations about different types of championships also were analyzed. The model was constructed by data collected from a social network where fans of a soccer team periodically express sentiments towards their teams. It was shown that the choice of a HMM is justified due to the fact that the change in a fan’s sentiment is analogous to a Markovian process of states change through time. Comparative evaluations will be performed between variations of the proposed models and also with the model that obtained the highest success rate with ranking algorithms. Second order HMM, considering the matches results and fan’s gambling information, is the model with the highest accuracy, even though it’d being built with information from the different championships.

Sumário

1 INTRODUÇÃO, 14

1.1 Motivação e problema, 14

1.2 Objetivos e proposta, 16

1.3 Estrutura do trabalho, 17

2 CONCEITOS E TRABALHOS RELACIONADOS, 19

2.1 Análise de sentimento e trabalhos relacionados, 19

2.2 Evolução do sentimento ao longo do tempo, 25

2.3 Considerações finais, 31

3 MODELO OCULTO DE MARKOV, 33

3.1 Redes Bayesianas, 34

3.2 Cadeia de Markov, 34

3.3 Inferências com Modelos Ocultos de Markov, 36

3.3.1 Algoritmos Forward e Backward, 36

3.3.2 Algoritmos de Viterbi , 39

3.3.3 Algoritmos Baum-Welch, 40

3.4 Modelo de Markov de Ordem N, 42

3.5 Conclusão, 42

4 APLICAÇÃO DE MOM PARA APRENDER O SENTIMENTO DE TORCEDORES DE TIMES DE FUTEBOL, 46

4.1 FootyCrowd, 48

4.2 Modelo oculto de Markov de primeira ordem, 48

4.3 Como definir o favoritismo de um time, 49

4.4 Estimativa de Parâmetros, 50

4.4.1 Suavização Laplaciana, 51

4.4 Considerações finais, 53

5 AVALIAÇÕES EMPÍRICAS, 53

5.1 Modelos de Markov de maior ordem, 56

5.2 Comparando com algoritmos de classificação, 58

6 DISCUSSÃO, 59

6.1 Tendências para bons momentos, 59

6.1.1 Balanceando a base de dados, 61

6.2 Testes removendo dados do time em análise, 66

6.3 Impacto dos diferentes campeonatos no sentimento do torcedor, 66

7 CONCLUSÃO, 71

REFERÊNCIAS BIBLIOGRÁFICAS, 74

PUBLICAÇÕES, 78

Referência

BONFIM, Rafael Pontes. Aprendizado de modelos preditivos sobre o sentimento de grupos de pessoas: Uma aplicação no domínio das torcidas de futebol. 2016. 76 f. Dissertação (Mestrado em Sistemas de Informação Inteligentes) - Instituto de Informática Aplicada, Universidade de Fortaleza, Fortaleza, 2016.
Ludopédio

Acompanhe nossa tabela do Campeonato Brasileiro - Série A