Quem controla quem? Pesquisas usam o Twitter para analisar o sentimento das pessoas

Trabalhos de Conclusão de Curso e Iniciação Científica, na Faculdade de Engenharia da Computação, tiveram orientação do Prof. Dr. Juan Manuel Adán Coello

Por Amanda Cotrim

Uma pesquisa realizada como Trabalho de Conclusão de Curso, da Faculdade de Engenharia da Computação, em 2014, analisou a rede social Twitter e identificou, de forma semiautomática, os sentimentos e as opiniões dos usuários da rede social. O então aluno da PUC-Campinas, Pedro Henrique Grandin, criou um sistema que mapeia e classifica as opiniões das pessoas em relação a determinado assunto. Para chegar nele, Pedro criou um algoritmo que identifica se os tuítes (tweets) são neutros, positivos ou negativos. O estudo se insere na área de análise de sentimentos, também conhecida como mineração de opinião.

O Twitter foi o escolhido porque é uma plataforma em que circula muita informação. Em vez de a pessoa olhar manualmente tuíte por tuíte, para saber a opinião dos outros na rede, é o sistema que faz isso automaticamente. O algoritmo criado por Pedro, como Trabalho de Conclusão de Curso, recebeu treinamento de exemplos do que seriam tuítes positivos e negativos. Pela sua lógica interna, o sistema buscou o que há em comum entre as palavras, uma vez que é preciso haver relação entre elas, pois a mesma palavra pode ter um sentido negativo num contexto e positivo em outro, explica Adán Coello, o orientador do trabalho.

Os testes aconteceram durante o período eleitoral, em outubro de 2014. Pedro analisou 50 tuítes em cada pesquisa, totalizando 250 comentários coletados automaticamente do Twitter. “O treino do classificador consistiu de arquivos com, aproximadamente, 19 mil tuítes para cada gênero, positivo e negativo, totalizando 28 mil comentários”, expõe o ex-aluno. Para tabular os resultados da avaliação experimental, Pedro utilizou o Excel e comparou o algoritmo usado pelo sistema com um classificador aleatório, apresentando melhores resultados.

Desafios:

Um dos maiores desafios da pesquisa foi classificar textos em sentimentos, reconhece o ex-aluno, visto que o sistema ainda não identifica ironias. “Além disso, os textos contêm muitos erros ortográficos, gírias, abreviações, palavras estrangeiras, termos ambíguos e demais detalhes que dificultam bastante a classificação de um texto. O meu trabalho buscou abranger um pouco a resolução desses problemas, por meio da coleta manual de tuítes que eram classificados como positivos e negativos, que serviram como base para medir se um determinado texto se encaixava mais aos tuítes positivos ou negativos. Tomando isso como base, é possível se inspirar e aperfeiçoar melhores estratégias para conseguir classificar de uma maneira mais eficiente esses tuítes”, acredita.

O sistema recebeu o nome de Piegas, um trocadilho para nomear o projeto que analisa os sentimentos na rede social. O sistema, que permite analisar textos de comentários em língua portuguesa em tempo real, tem, no entanto, fins acadêmicos e está sendo usado para experimentação, em pesquisas realizadas pela Universidade, como foi o caso do Trabalho de Iniciação Científica, realizado em 2014-2015, pela estudante do terceiro ano do Curso de Engenharia da Computação, Julia Furlani.

O Twitter foi o escolhido porque é uma plataforma onde circula muita informação- Crédito: Álvaro Jr.
O Twitter foi o escolhido porque é uma plataforma onde circula muita informação- Crédito: Álvaro Jr.

Iniciação Científica

“Eu pesquisei usuários influentes no Twitter, utilizando a análise de sentimentos criada pela pesquisa do Pedro. O objetivo do estudo que eu desenvolvi era descobrir quais eram os usuários influentes nessa rede social e se eles influenciavam positivamente ou negativamente as pessoas a respeito de um determinado assunto”, explica a estudante.

“A partir de palavras-chave, eu coletei as informações do usuário, como o número de seguidores, de retuítes e de pessoas que o usuário segue, para identificar quem era influente na rede; então, usei o sistema Piegas para identificar se essas pessoas influentes tinham opiniões positivas, negativas ou neutras sobre determinado assunto”, comenta.

Julia Furlani- Crédito: Álvaro Jr.
Julia Furlani- Crédito: Álvaro Jr.

Como experimentação, Julia usou uma marca de eletrodoméstico e uma de refrigerante. “Enquanto eu fui desenvolvendo, fui testando várias palavras diferentes para obter resultados diversos”, adianta. “No final, a pesquisa identificou que o refrigerante é algo que faz parte do dia a dia da pessoa e por isso quando o internauta posta algo sobre refrigerante isso muitas vezes não quer dizer alguma coisa. Por isso, a marca de refrigerante teve mais resultados neutros. Já a marca de eletrodoméstico, por não ser algo que faz parte do dia-a-dia das pessoas, teve mais resultados negativos e positivos e menos resultados neutros, porque geralmente os tuítes eram para elogiar ou criticar a marca”, esclarece.

 O caminho inverso

Prof. Dr. Juan Manuel Adán Coello/ Crédito: Álvaro Jr.
Prof. Dr. Juan Manuel Adán Coello/ Crédito: Álvaro Jr.

O orientador da pesquisa de Iniciação Científica e do Trabalho de Conclusão de Curso, Juan Manuel Adán Coello, ressalta a importância de ambos os trabalhos para a área de Engenharia da Computação e da análise de sentimentos, pesquisas ainda tímidas no Brasil. No entanto, faz uma ressalva crítica. Segundo ele, é preciso estar atendo às novas ferramentas tecnológicas, pois, assim como elas identificam a opinião das pessoas, também podem ser usadas para influenciar a opinião pública. “Uma ferramenta como é a rede social influencia a maneira como as pessoas se comportam e agem no dia a dia. Por isso, eu acredito que esse tipo de ferramenta, se usada por grupos bem preparados, com recursos materiais e intelectuais, pode influenciar, sim, as pessoas”, conclui.