segunda-feira, 11 de agosto de 2014

Conheça os temas de maior impacto no Twitter envolvendo candidatos à presidência

No nosso post Um mural vale mais que mil tweets, nós discutimos a inviabilidade de se analisar a opinião de milhares de pessoas acerca de um tema de interesse, mesmo que bem específico, sem uma ferramenta adequada. Essa tarefa é extremamente complexa, ainda que se disponha de uma equipe dedicada e especializada para realizá-la.

Hoje apresentaremos uma análise que fizemos dos principais temas discutidos pelos brasileiros em relação aos candidatos à presidência. Coletamos milhões de tweets no mês de julho, desses, um pouco mais de meio milhão falavam sobre a campanha presidencial dos principais candidatos ao cargo, Dilma, Aécio e Eduardo.

Analisar meio milhão de tweets significa ler aproximadamente 15 mil páginas de texto. Será mesmo possível? Como podemos identificar os tópicos de maior destaque dentro desse universo de informações e opiniões?

Para resolver esse problema, a nossa equipe desenvolveu um programa de computador capaz de processar em minutos milhares de tweets e extrair deles os temas que foram mais discutidos em um determinado período e ainda classificá-los em ordem de impacto social alcançado. Além disso, para cada tema, nosso programa é capaz de gerar estatísticas importantes, identificando inclusive as pessoas de maior influência nas redes sociais sobre esse assunto específico, o que será discutido no nosso próximo post.

No post de hoje, traremos alguns desses temas e apresentaremos também algumas das conclusões alcançadas ao se analisar o impacto do Twitter na corrida eleitoral à presidência no mês de julho de 2014.

Temas de maior impacto no mês de julho


No mês de julho, aproximadamente 161 mil pessoas participaram ativamente das discussões sobre as eleições presidenciais, trocando mais de 580 mil mensagens no Twitter, com quase 4 tweets por pessoa e mais de 18 mil tweets por dia sobre o tema.

No entanto, o que essas pessoas discutiram? O que elas consideraram importante? Quais foram os assuntos que tiverem maior destaque?

Ao analisar o mês inteiro de julho, detectamos 16 assuntos diferentes. Como esperado, desses, 7 estão relacionados de alguma forma à Copa do Mundo. De piadas a lamentações, se viu de tudo nessa Copa. Dentre as lamentações e desejo de melhoras, um chamou bastante atenção nas nossas análises. Enquanto a Dilma (ver tweet de @dilmabr abaixo) obteve 761 retuítes e 905 favoritos quando desejou "força ao querido @NeymarJr", a Marina (ver tweet de @silva_marina abaixo) obteve apenas 55 retuítes e 142 favoritos ao torcer "que tudo esteja bem com @neymarjr", repercussão de menos de 12% da obtida por Dilma. Essa diferença reflete os números apresentados pelo Ibope que mostram Eduardo com apenas 8% das intenções de votos, enquanto Dilma aparece com 38%, ou seja, com aproximadamente 21% das intenções de votos de Dilma*.


Por outro lado, nada supera o humor e a criatividade de brasileiros como Dilminha (@DilmaRousselff), com seu famoso "...eu posso tudo meu bem, eu sou Presidente". Ao todo foram 2,124 retuítes e 785 favoritos ao usá-lo para "cancelar o gol da Alemanha" no dia 08/07 e 718 retuítes e 310 favoritos ao usá-lo para "trazer Chay Suede de volta ao 'Império'"** no dia 24/07.


E os outros 9 temas, são sobre o quê? Veja no gráfico abaixo os 9 principais tópicos discutidos no mês de julho sobre a campanha presidencial que não possuem uma relação com a Copa do Mundo. Os assuntos variam de críticas a ambos Aécio e Dilma, assim como indicativos de um possível segundo turno. Além de mostrar os temas com seus respectivos números de tweets e de usuários engajados no debate, é possível também clicar em uma das barras (tweets ou usuários) para apresentar um dos tweets com maior repercussão sobre o tema logo abaixo do gráfico. Dessa forma, fica mais fácil entender do que cada tema trata.





Análise dos temas e algumas descobertas


Ao fazermos essas análises, percebemos que nem sempre um assunto que é bastante discutido nas redes sociais possui um tweet com uma quantidade enorme de retuítes e favoritos, ao contrário do que se imagina. O tema "Campanha presidencial pode custar milhões", por exemplo, foi o terceiro em número de tweets e o segundo maior em número de usuários envolvidos, enquanto um dos tweets com maior impacto apresentou apenas 51 retuítes e 26 favoritos (veja tweet da @VEJA de 05/07, clicando na barra do assunto "Campanha presidencial pode custar milhões"). A diferença nesses casos é que os comentários vieram de diversos perfis diferentes e não se concentraram em apenas retuítes de um mesmo tweet. Temas como esse são mais difíceis de se encontrar em análises manuais, pois, ao se analisar tweets individuais, o assunto não parece ter grande importância/impacto. No entanto, ao analisar os diversos tweets sobre o tema em conjunto, percebe-se que é um assunto muito discutido e de extrema relevância.

Outra descoberta importante durante nossas análises foi a relevância da relação entre quantidade de tweets e de usuários envolvidos na discussão do tema. Um tema não deve ser classificado como importante olhando apenas a quantidade de tweets publicados sobre o assunto. Tão ou mais importante que isso é a quantidade de pessoas envolvidas na discussão. Percebam que o tema "Nomeação de agentes da PF", por exemplo, embora seja o segundo tema com maior quantidade de tweets, com mais de 6 mil, foi o penúltimo assunto mais relevante em termos de quantidade de usuários envolvidos, com apenas 304. Ao analisarmos a diferença de um número para o outro, passamos a entender o que está acontecendo. Esse é um caso clássico que ocorre com certa frequência, quando poucas pessoas publicam diversos e repetidos tweets sobre o mesmo assunto com o objetivo de chamar a atenção daqueles que acompanham as redes sociais, dando a impressão que o tema está sendo bastante discutido. Essa situação ocorre geralmente em dois casos: ou são perfis falsos, geralmente robôs, publicando a mesma mensagem com pequenas variações (como acrescentando um número sequencial ao final do tweet); ou é um grupo específico de pessoas interessadas no assunto que insistem em discutir o tema até que sejam eventualmente ouvidos/atendidos. Nesse tema das nomeações da PF, temos um exemplo clássico desse último caso, também conhecido como "tuitaço". Aqui, servidores da PF, tentam usar as redes sociais para reivindicarem determinadas ações de agentes políticos. O perfil @AllaneTributino, que mais tuitou sobre o tema (808 tweets), teve sua conta suspensa pelo Twitter***.

O que o povo brasileiro realmente quer? Quais são os principais assuntos discutidos sobre educação, saúde, segurança, etc?


Vocês por acaso sabem? Nós sabemos! Se quiserem uma análise sobre qualquer um desses temas (ou outro qualquer), entre em contato conosco! Será um prazer ajudar a responder perguntas tão importantes para o futuro do nosso país e da nossa nação!

No nosso próximo post nós apresentaremos os principais formadores de opinião na campanha presidencial em 2014. Descubra quem foi responsável por chamar a atenção de milhares de pessoas nas redes sociais e tornar esses assuntos uns dos mais discutidos no mês de julho.


* Veja resultado do dia 22/07 em Pesquisa Eleitoral para Presidente.
** Veja notícia do UOL sobre o tema em Com o fim da 1ª fase, internautas lamentam saída de Chay Suede de "Império".
*** Isso não quer dizer que a conta foi suspensa pelos repetidos tweets. É apenas uma constatação que não significa, necessariamente, uma correlação.