Lovers com mais força que haters nas eleições presidenciais de 2018

8 de agosto de 2018

por labic


Pesquisa mostra nova metodologia para identificar nas redes sociais aceitação e rejeição de candidatos à presidente. “Lovers” terão mais força que haters?

Há algum tempo nosso trabalho de pesquisa é influenciado pela urgência da criação de dicionários que nos auxiliem no filtro de publicações online. Em 2015, quando nos defrontamos com o trabalho de aprimorar softwares de detecção de discursos contra grupos minorizados, tivemos que criar uma corpus linguístico da discriminação e perseguição contra negros, mulheres, pessoas LBGTs e indígenas. Por corpus entende-se aqui: um conjunto de expressões, textos ou palavras (escritas ou orais) que podem servir como marcadores para medir o tamanho de um assunto dentro de uma coleção de dados (dataset). Após constituir o corpus da ofensa online, começamos a pinçar postagens ofensivas a esses grupos.

Um ano antes, num aplicativo focado em Copa do Mundo, desenvolvido em parceria com o Estadão, fomos capazes de encontrar postagens feitas por cidades-sede e por seleção de futebol. Em 2016, fizemos o mesmo para elucidar os modos discursivos de se falar do Enem no Twitter, numa parceria frutífera com o Inep.

A partir disso, em quatro anos, passamos a ter um time de pesquisadoras (no feminino, porque elas são a maioria) focado naquilo que, dentro do Labic, chamamos de “Modelagem de tópicos”. É uma das etapas mais complexas do trabalho realizado pela jovem geração de pesquisadoras que resolveram se instalar no Labic, em Vitória-ES.

Nesse novo trabalho, intitulado “Aceitação e Rejeição Política nas Redes Sociais”, partimos da hipótese de que a escrita dos fãs e anti-fãs online dos presidenciáveis permite-nos apreender a linguagem mais vulgar do ataque e da defesa de um político. Chamamos esse corpus linguístico de Dicionário da Aceitação e Rejeição dos Presidenciáveis.  Na prática, isso significa dizer que os comentários feitos online por esses fãs possuem palavras únicas ou coassociadas que expressam maior aceitação ou rejeição a um determinado candidato, bastando então a equipe identificar esse molde vocabular para conseguir demonstrar a pulsão de negação ou atração por um presidenciável. Não se trata de uma análise de sentimento, vista, em geral, como contagem de postagens de tom positivo, negativo ou neutro. Trata-se de um análise emocional que se baseia na interrelação da análise estatística, discursiva e conteúdo.

.

O Processo Metodológico
Em seis meses, produzimos o dicionário de aceitação e rejeição de Geraldo Alckmin, Álvaro Dias, João Amoêdo, Jair Bolsonaro, Guilherme Boulos, Ciro Gomes, Lula, Marina Silva e Henrique Meirelles. É um dicionário que sempre será dinâmico, dado que a cada momento pode surgir novas hashtags, slogans, expressões e palavras que sejam assertivas para o entendimento dessa polaridade emocional (amar/odiar, aceitar/rejeitar, etc). Como foi esse processo?

1. Extração das postagens e de seus respectivos comentários nas páginas no Facebook dos candidatos a presidente. O mês utilizado pelo teste foi o de fevereiro de 2018.

2. Em seguida, excluímos da amostra todos comentários com menos de 100 caracteres. Isso nos permitiu limpar o dataset das chamadas “notificações”, que é quando um usuário marca o nome de um outro em um post. E ficaram as postagens com um número maior de orações.

3. Desse material, retiramos os termos de aceitação de cada candidato. Isso porque em páginas de políticos no Facebook, administradas por suas respectivas assessorias, comentários ofensivos são sempre deletados ou bloqueados, assim os chamados haters (usuários que destilam seu ódio contra alguém) são evitados. O efeito disso é que só sobra o léxico da aceitação. Páginas de políticos são, em certa medida, uma ilha da fantasia, onde há mais lovers (fãs) do que haters (anti-fãs).
4. Percebemos que nessas páginas também havia, mesmo que residual, um léxico de rejeição do adversário político. Foi comum ver frases desfavoráveis a Lula lendo a página de Bolsonaro. E vice-versa. Aproveitamos então esse estoque lexical negativo para montar uma primeira parte do dicionário da rejeição.

5. A segunda parte do Dicionário da Rejeição foi montada minerando 9,300 comentários longos (mais de 100 caracteres) em posts sobre os candidatos publicados em páginas de notícias no Facebook. A lista de páginas foi essa. Extraímos todos os posts dessas páginas em fevereiro e filtramos aquilo que era referente a cada um dos candidatos. Depois fizemos uma nova coleta dos comentários desses Posts IDs filtrados. Já que os chamados “comentaristas de portal” carregam viés de rejeição em suas postagens, recolhemos então os termos de negação dos candidatos, completando assim o Dicionário de Rejeição.
6. Ao final, os termos passaram por uma auditoria, fase em que descartamos os conteúdos ambíguos. Cada Dicionário obteve os termos universais (termos que podem ser atribuídos a todos candidatos) e os específicos (termos que só podem ser atribuídos a um candidato).

7. De posse desses Dicionários, a etapa seguinte foi o desenvolvimento de um script para poder automatizar a busca, identificação e contagem desses termos nos objetos de um dataset qualquer, separando-os e construindo os novos conjuntos categorizados. O script foi desenvolvido em nodejs, um framework de javascript. Concluído o script, fizemos os testes necessários de aplicabilidade em datasets do Facebook e do Twitter (por enquanto), tornando-o então apto a rotular publicações e enquadrá-las nos campos de Aceitação e Rejeição.

8. Por fim, realizamos uma coleta via API do Twitter a partir dos seguintes termos: Marina Silva e marinasilva, gerando um dataset com 46k tweets, Jair Bolsonaro e jairbolsonaro (710k), Lula e lulaoficial (310k), Ciro Gomes e cirogomes (51990), Alckmin e geraldoalckmin (69k), Boulos e guilhermeboulos (32k), Henrique Meirelles e @meirelles (2.7k), João Amoedo e joaoamoedonovo (13k), Álvaro Dias e alvarodias_ (5k). O período da coleta foi de 25 de julho a 02 de agosto de 2018. Para cada um desses datasets, aplicamos os dicionários, gerando os resultados que serão analisados a seguir.

.

RESULTADOS OBTIDOS

 

aceitação

Gráfico 01 – Percentual de frequência de Termos de Aceitação em Posts mencionando os Candidatos a Presidente do Brasil (25 de julho a 02 de agosto de 2018)

 

No primeiro gráfico da série, é possível identificar que Lula  foi o candidato que obteve 78,67% do total de comentários de aceitação dos presidenciáveis, seguido de Jair Bolsonaro (16,01%) e Ciro Gomes (3,01%). Isso significa dizer que essas candidaturas são as que mais apresentaram manifestações de apoio, muito em função de um “ecossistema de lovers”, prontos a defendê-los em eventuais conflitos online. 

rejeição

Gráfico 02 – Percentual de frequência de Termos de Rejeição em Posts mencionando os Candidatos a Presidente do Brasil (25 de julho a 02 de agosto de 2018)

Já no Gráfico 02, 54.7% das publicações que rejeitam candidatos tem menção a Lula. Em segundo lugar, Jair Bolsonaro (24,75%) e, em terceiro, Geraldo Alckmin (11,59%). Isso significa que esses candidatos são mais comumemente alvo do linguajar dos haters do Twitter. 

.

Lula

Em nossas coletas, o ex-presidente Lula (PT) ficou em primeiro lugar tanto no gráfico de aceitação quanto no de rejeição, proporcionando o maior volume de dados em nosso dataset. Alguns dos termos e hashtags que mais marcaram a manifestação dos internautas nas publicações do Lula foram “#luladenovo”, “ajuda a quem não tem condições”, “eleição sem Lula é fraude”, “vc não será eleito”, “destruidor do estado”, “cadeia é seu lugar”.

No gráfico de rejeição, o sindicalista conquistou 13.832 comentários (54.70%), ocupando quase metade de todo o dataset destacado para a análise, o qual contém um total de 25.287 termos de rejeição. Como exemplo dos termos e hashtags que foram utilizados contra a figura do ex-presidente podemos destacar “#ForaLuloNazista”, “#LulaLadrão”, “bandidomor” “#LulaÉdoDiabo”, “#LulaInimigoDoPovo”.

Dentre os termos e hashtags que marcaram a aceitação ao sindicalista temos “#Lulaperseguido”, “avante lula e pt”, “cessou a fome”, “#LulaPerseguido”. Superando o gráfico de rejeição, no gráfico de aceitação o ex-presidente antigiu a marca de 78,67%, ocupando muito mais da metade desse dataset (68.584 tweets de um total de 87.182).

Jair Bolsonaro

Candidato pelo PSL, o presidenciável Jair Bolsonaro foi segundo pré-candidato mais comentado por totalizar 12.213 publicações de caráter apoiador, e, portanto, 14,01% do total de tweets de aceitação. Por outro lado, Bolsonaro obteve 6.258 posts de rejeição, 24,75% dos tweets de negação de sua imagem foi identificado.

O presidenciável construiu sobre ele a figura de herói, o suposto futuro responsável por “resgatar” e “endireitar o Brasil”, nas palavras dos usuários que diretamente o apoiam no Twitter. Entre os demais termos de apoio, ressaltou-se a ênfase na defesa da “família e dos bons costumes”, além de ser um candidato “honesto e ficha limpa”.
Afirmações tais como “Meu voto é do Jair Messias Bolsonaro”, “Todos que querem um Brasil melhor votam em Bolsonaro” e “Orgulho de votar em Bolsonaro” foram frequentes, entretanto, a mesma efervescência para criticá-lo também foi elevada, mesmo que quantitativamente menor em relação à sua aceitação.

As tendências à direita política e ao conservadorismo social impulsionaram termos fortes como “Bolsonaro extremista”, “imbecil” e “misógino”. É apontado por “dizer o que seus eleitores querem ouvir”, como “frases de impacto” e sugerir “ideias absurdas”. Chegou a ser comparado ao líder da Alemanha nazista, Adolf Hitler, devido ao frequente “discurso de ódio” e “patriotismo genérico” expostos em entrevistas e outras falas públicas. Além das ideologias, o “despreparo” do pré-candidato é fortemente desaprovado. As expressões “falta de experiência e conhecimento”, como igualmente “não entende de economia” foram usadas para questionar a capacidade de Bolsonaro governar o Brasil.

Tanto na aceitação quanto na rejeição, Ciro Gomes (PDT) ocupa o terceiro lugar entre os presidenciáveis. Foram 2.622 tweets (3,01% do dataset) de apoio ao candidato, enquanto 1.319 postagens (5,22%) rejeitam o pedetista. Os termos pró-Ciro falam mais a respeito de suas realizações, como “recusou três aposentadorias públicas”, “plano de governo viável”, “salvou a economia brasileira”, “nenhum processo na justiça”.

Ciro Gomes

Aqueles que abraçam a figura de Ciro veem nele uma alternativa às figuras políticas mais conhecidas provenientes de partidos envolvidos em grandes esquemas de corrupção: “libertará o Brasil”, “melhor alternativa presidencial”, “não está envolvido em escândalos de corrupção”, “não tem rabo preso”. É notável que a forma dele de desafiar outras figuras políticas atrai eleitores e puxa aqueles que estão mais indecisos, principalmente a parte da população que flerta com a esquerda brasileira.

Em oposição, os termos de rejeição são majoritariamente chacotas como “adora uma erva”, “bosta esquerdista”, “charlatão” e “Ciro é um louco”. Os críticos do ex-governador do Ceará se utilizam ainda de sua fama de intelectual para o atacarem “suas propostas só funcionam no papel”, “pseudo intelectual”, “menos palavras e mais ação”.

Geraldo Alckmin

Foi observada uma maior quantidade de rejeição ao candidato Geraldo Alckmin (PSDB) do que apoio pelos internautas. Os usuários fizeram 2931 (11,59%) postagens negativas ao candidato e apenas 970 (1,11%) de aprovação.
Dentre os termos e hashtags com caráter de aprovação à candidatura do tucano, ressaltam-se “#ALCKMIN 2018”, “#psdb45”, “45 em 2018” e “Alckmin tem meu voto”. O período como governador de São Paulo é ao mesmo tempo exaltado em publicações de apoio quanto criticado pela turma opositora.

No posicionamento pró-Alckmin, os internautas apontam que independentemente do tamanho do estado e do caráter populoso de São Paulo, Geraldo Alckmin fez um grande trabalho ao superar estes obstáculos administrativos: “São Paulo é referencial em tudo”, “paulistanos agradecem”, “comandar um estado com 45 mi de pessoas”, “estado mais desenvolvido do país”.
Por outro lado, o mesmo mandato foi criticado pelos internautas, assim como a filiação dele ao PSDB. Estes pontos podem ser observados em posicionamentos tais como “há quantos anos o PSDB governa esse estado”, “abandonado pela sua administração”, “desgoverno”, “quero Geraldo Alckmin longe do governo”, entre outros.

A principal crítica apresentada em desfavor a ele é o caso da “máfia da merenda”, termo pelo qual ficou conhecido a Operação Alba Branca, da Policia Civil em parceria com o Ministério Público. A referência ao caso foi enfatizada em termos como “roubar a merenda” e palavras associadas como “corrupção e merenda”, “desvio e merenda”, “dinheiro da merenda”, entre outros observados no Dicionário.

Marina Silva

Os usuários das redes sociais se referiram a Marina Silva (Rede) principalmente com: “vou de marina”, “marina é uma mulher forte”, “#somosmarina”, “não fez nada por nós”, “não merece meu voto”, “não tem nada a contribuir”. Em ambos os gráficos, a ambientalista não alcançou desempenhos expressivos. No gráfico de aceitação, o percentual foi de 0,70%, ocupando 612 comentários do total, um número bem pequeno. Mesmo assim, alguns internautas manifestam apoio à imagem dela, como podemos observar nos termos e hashtags: “marina é do povo”, “#marinapresidente”, “estamos com você marina”, “#somosmarinapresidente”.

No gráfico de rejeição, a ex-ministra alcançou um desempenho mais expressivo, conquistando 1,08% (273 comentários de um total de 25.287). De acordo com nosso dataset, os termos que mais se repetiram na rejeição de Marina foram “não vale nada” “nunca administrou uma padaria”, “nunca será presidente”, “péssima gestão”, “sua credibilidade é zero”.

Guilherme Boulos

Apesar de não ter o alcance quantitativo de outros candidatos, como Lula e Bolsonaro, os tweets que se referiam a Guilherme Boulos (PSOL) tenderam a rejeição do candidato. Foram 803 tweets que demonstram aprovação a Boulos, o que significa 0,92% do total da frequência de aceitação entre os candidatos. A rejeição foi demonstrada em 502 postagens, o que corresponde a 1,99% dos tweets que rejeitam algum candidato.

Dentre os aspectos positivos abordados nas postagens, destaca-se a “boa preparação” e o nível intelectualmente coerente do pré-candidato. É exaltado ainda o enfoque às causas populares dado por ele, sob o argumento de que “poderá diminuir os desconfortos das classes mais baixas”.

Em contrapartida, os comentários de rejeição criticam principalmente a filiação do presidenciável à esquerda política e a tendência de Boulos ao socialismo caracterizado pelos internautas como “falhos”. Comentários tais como “A esquerda deixou o Brasil assim” ressaltam o caráter negativo da atual situação brasileira e fazem alusão aos antigos governos petistas. Os internautas o reprovam quando condenam o suposto “apoio às ditaduras da Venezuela e de Cuba”, além de destacar o poder aquisitivo do pré-candidato com os termos “milionário” “anda de carro blindado” e “doa sua mansão”. Ele é visto pela rejeição como “líder de movimentos” que “se aproveitam do povo” para benefício próprio.

Henrique Meirelles

No Twitter, a aceitação de Henrique Meirelles (MDB) é composta por 213 posts, representando 0,24% dos total de termos de aceitação. Enquanto isso, a rejeição correspondeu a 43 posts, representando 0,17% do total. É inexpressiva a presença de haters ou lovers de Mairelles.

Nos posts coletados, ele é criticado por sua candidatura ser entendida como uma extensão do governo Temer, já que são do mesmo partido (MDB). Assim, são observados termos pejorativos como associação: Meirelles e “capacho de corrupto”, Meirelles e “capacho de Temer”. Além disso, alguns usuários apontam que a candidatura de Meirelles seria um artifício para impedir que a grande rejeição pública de Temer seja relacionada ao que seria o “verdadeiro” candidato do governo, ou seja, Geraldo Alckmin.
Observamos ainda a incidência de comentários de Meirelles com termos como: pilantra, “picareta nível alto”, #cadeiapracorrupto, #corruptotemqueserpreso.

Em contrapartida, o apoio de sua candidatura está relacionado com ser considerado um candidato com experiência, preparado e um dos mais qualificados. O diferencial do candidato seria que além de ter conhecimentos na área econômica, sua principal profissão seria executivo e não político. Observamos um aumento, na internet, de pessoas que criticam os adversário de Meirelles, considerados “políticos de profissão”.

João Amoedo

Apesar do baixo volume de menções de aceitação e rejeição, João Amoêdo (Novo) tende a ser mais curtido do que odiado.Há uma maior incidência de postagens positivas, 1.060 encontradas, representando 1,22% da tabela de aceitação. Enquanto que as postagens negativas, 127, representam 0,5% do gráfico de rejeição. Há predominância de termos que fazem trocadilhos com o nome do partido, tais como os seguintes: “caminho novo”, “diferencial do novo”, “família do novo”, “ideias novas”, entre outros. Positivamente, a figura de Amoêdo é associada a diminuição de burocracia, impostos e tributos. Além de termos como “empreender”, “empreendedorismo” e “empresário não é vilão”.

Em contraposição as mesmas questões apresentadas de forma positiva acima são invertidas de forma a criticar o candidato e o partido. Dessa forma, o partido é acusado de não ser algo realmente novo, apenas, nova roupagem para a velha forma de fazer política. Vemos isso em postagens com os termos “”isso é o novo?”, “engodo”, “manipulados”, “candidato do Itaú”, “fiquei triste com o novo”, “mais do mesmo” e “psdb 2.0”.

Álvaro Dias

De forma a detratar o candidato, internautas também apontam que o candidato tem poucas chances de vencer as eleições decorrente da falta de votos e indicam sua campanha como fraca.

A perspectiva pró Alvaro Dias (Podemos) corresponde a 0,12% desse dataset, totalizando 105 postagens. Um dos principais atributos associados positivamente ao candidato – e fortalecida pela sua assessoria de imprensa, observada em parte significativa das postagens – é a honestidade, exemplificada nos seguintes termos: “ficha limpa”, “é uma pessoa integra”, “nunca ter sido investigado”, “não responde a nenhum processo”, entre outros.

Ainda nos comentários, há uma preponderância de declarações de apoio ao candidato, representadas por termos como: “conto contigo”, “tamos junto”, “a grande maioria do povo está com o senhor”, “acredito em você”.

A existência de termos de rejeição de Dias é inexpressiva, tendo um valor próximo de 0,01% uma vez que há apenas duas postagens de um dataset com 5.287 postagens. Entretanto, devido ao valor total de postagens coletadas desse candidato ser expressamente menor do que os outros presidenciáveis não é possível determinar se comparativamente Dias seria o candidato com menos rejeição entre todos.

 

EQUIPE 

Coordenação Geral:
Fábio Malini

Modelagem de Dados:
Ms. Marianne Malini (Coordenadora)
Bianca Bortolon (pesquisadora)
Carla Bianca Nigro (pesquisadora)
Johanna Honorato (pesquisadora)
Laís Santana (pesquisadora)
Saulo Salles (pesquisador)

Tasso Gasparini (pesquisador)

Verônica Haacke (pesquisadora)
Willian Lopes (pesquisador)

Texto:
Fábio Malini
Carla Bianca Nigro (pesquisador)
Laís Santana (pesquisadora)
Milena Mangabeira (pesquisadora)
Nelson Aloysio Reis (pesquisador)
Nicolas Nunes (pesquisador)
Ricardo Aiolfi (pesquisador)
Willian Lopes (pesquisador)

Compartilhe

Comentários