Resumo
A utilização das redes sociais enquanto canal de comunicação por parte de personalidades políticas para com o cidadão se tornou uma realidade efetiva, inclusive sendo explorada enquanto mecanismo de formação de opinião ou mesmo enquanto ferramenta de promoção de posicionamentos ou ações. Nesse contexto, este artigo tem como proposta realizar uma análise, por meio de Cartografia de Controvérsias, sobre um conjunto de comentários de seguidores do perfil oficial no Instagram do presidente do Brasil, Jair Messias Bolsonaro, especificamente sobre publicações relacionadas ao tema Covid-19. Para tanto, o trabalho propõe aplicar uma metodologia baseada no uso de soluções computacionais inteligentes, desde a extração de dados até a geração de visualizações de informações, as quais embasam as reflexões realizadas. Os resultados alcançados demonstram uma polarização de opiniões que giram em torno de temas como religiosidade e nacionalismo, economia e saúde.
Palavras-chave cartografia; Covid-19; análise de sentimentos; mineração de dados; Instagram
Abstract
The use of social networks as a communication channel by political personalities to citizens has become an effective reality, including its exploration as a mechanism for forming opinions or even as a tool for promoting positions or actions. This paper proposes the conduction of an analysis through Controversy Cartography on a set of comments from followers of Brazilian president Jair Messias Bolsonaro’s Instagram official profile, specifically on publications related to Covid-19. The applied methodology is based on the use of intelligent computational solutions, from the extraction of data to the generation of information visualizations, which are the basis for the presented considerations. The results demonstrate a polarization of opinions that revolve around themes such as religiosity and nationalism, economics and health.
Keywords controversy; Covid-19; sentiment analysis; data mining; Instagram
Introdução
As redes sociais digitais têm estado presentes de maneira frequente na vida dos indivíduos que têm acesso aos dispositivos móveis conectados à internet. É notável um aumento na frequência de acesso a essas redes em virtude da atual pandemia da Covid-19, situação decorrente, principalmente, de algumas medidas que tiveram o objetivo de viabilizar o controle da doença, sendo uma delas o isolamento social a nível mundial (BÖTTGER; IBRAHIM; VALLIS, 2020).
Nesse contexto de afastamento, houve uma necessidade de ressignificar as formas de expressar afeto, demonstração esta que é inerente à natureza humana. Graças às diferentes inovações nos processos de informação e comunicação, esse distanciamento vem sendo diminuído por meio das tecnologias mediadas pela internet, com o uso de redes sociais virtuais e de aplicativos de mensagens instantâneas, que acabam por atuar como mecanismos de conexão e aproximação entre pessoas, auxiliando na diminuição de sentimentos de solidão, ansiedade e medo em torno das consequências decorrentes da pandemia (GIANFREDI; PROVENZANO; SANTANGELO, 2021).
Um dos efeitos observados neste cenário de pandemia é uma enxurrada de informações e desinformações acerca do tema, ocasionando uma infodemia1 em torno da doença, dos seus efeitos, dos métodos de controle do contágio, das normas internacionais de manejo, além de posicionamentos de autoridades, dividindo a opinião pública e de especialistas sobre as possibilidades de tratamento medicamentoso e baseado no uso de vacina, associados à opinião pública, aos vieses políticos, ao baixo nível de conhecimento científico e técnico em saúde e ao comportamento humano de propagação de boatos (PIAN; CHI; MA, 2021). Esse contexto infodêmico alimentou uma controvérsia pública acerca da Covid-19 que abastece telejornais, portais de notícias e redes sociais digitais, suscitando uma polaridade discursiva em torno da pandemia, que pode ser observada nessas redes e nas conflituosas interações ocorridas no mundo virtual (JUNGKUNZ, 2021).
Uma personalidade que tem contribuído com a polaridade discursiva nas redes sociais sobre o tema da pandemia é o presidente da República do Brasil, Jair Messias Bolsonaro (MONARI et al., 2021). O debate é alimentado e retroalimentado em suas redes sociais, com destaque para o Twitter e o Instagram, ferramentas utilizadas pelo presidente para se comunicar com seus eleitores e seguidores, o que o coloca em uma posição dupla de formador de opinião, já que representa a maior autoridade política do país, eleito com mais de 57 milhões de votos, e também influenciador digital, com cerca de 40 milhões de seguidores em suas diferentes redes sociais, dos quais, somente no Twitter, chegam a 7,5 milhões, enquanto no Instagram somam mais de 19 milhões.
Aggio (2020) afirma que a comunicação política se tornou fundamental tanto para a ascensão como para a manutenção do apoio ao presidente, relação que se fortalece via redes sociais digitais. O pesquisador discute a ideia de que a comunicação política fomentada pelo atual governo promove a desinformação, alimentando uma polarização política por parte da sociedade como um todo. Esse cenário aparece consideravelmente no contexto da Covid-19, sendo observadas redes polarizadas quanto a temas de notável importância, como foi o caso dos debates em torno do uso da cloroquina e da hidroxicloroquina enquanto soluções eficazes no tratamento da doença (RECUERO; SOARES; ZAGO, 2021). Essa defesa por parte de Bolsonaro se fortaleceu após o seu diagnóstico positivo para a doença, a partir do qual fez uma campanha ativa, inclusive fazendo uso do fármaco para atestar a sua efetividade em vídeos compartilhados via redes sociais, o que aumentou a polêmica em torno do assunto.
Com base nesse breve delineamento de contexto realizaremos, como objetivo geral do presente artigo, uma Cartografia de Controvérsias em torno dos comentários dos seguidores de Jair Bolsonaro em sua página no Instagram relativos às postagens realizadas pelo presidente e que tenham a pandemia do novo coronavírus (Covid-19) como tema em destaque, com o intuito de identificar as temáticas de maior circulação e o posicionamento com relação a estas por meio das manifestações dos usuários da rede social, e as intersecções e disjunção ante as falas e os posicionamentos do presidente.
Diante disso, para coleta e tratamento dos dados utilizados, foi aplicado o processo conhecido como Knowledge Discovery in Databases (KDD), que consiste em uma abordagem de geração de conhecimento sobre grandes volumes de dados, utilizando soluções computacionais de mineração de dados e inteligência artificial. Foi aplicada uma solução de Análise de Sentimentos sobre o conteúdo dos comentários extraídos, de modo a prover a classificação destes em positivos, negativos e neutros, e, juntamente com a classificação da temática por meio da geração de grafos de similitude, apontar as contradições e as polarizações identificadas nos comentários, delineando as possíveis controvérsias e representações que surgem e que se estabelecem com base na interação dos diferentes atores envolvidos.
Jair Bolsonaro nas redes sociais digitais e a controvérsia acerca da pandemia da Covid-19
O processo eleitoral que consagrou Jair Messias Bolsonaro como presidente da República do Brasil representou, segundo alguns especialistas, a eleição de uma parcela da população que se mostrou indignada com os governos anteriores, apoiando-se em um discurso antipetista e utilizando-se de diferentes redes sociais digitais para propagar suas opiniões. Nicolau (2018) aborda como os eleitores de Jair Bolsonaro podem ter criado o então maior partido de extrema direita da história política do país, o Partido Social Liberal (PSL), tendo esses eleitores adotado uma tática de enxame.
Estávamos diante de um “tsunami” eleitoral, do “furacão” Bolsonaro, da “avalanche” de votos do PSL. Restava falar da velha ordem política também com imagens de destruição. O sistema partidário estaria “em escombros”, “em ruínas”, teria vindo ao chão diante de uma “hecatombe” de renovação
(NICOLAU, 2018).
Nicolau (2018) elencou alguns fatores que contribuíram para a ascensão de Jair Bolsonaro à Presidência. O primeiro pode ser explicado pela recorrente e já desgastada polarização nas urnas entre o Partido dos Trabalhadores (PT) e o Partido da Social Democracia Brasileira (PSDB); o segundo fator consiste na era do PT, que exerceu forte influência no sistema partidário por quase vinte anos, primeiro como oposição e, depois, representando o partido que ficou durante mais tempo no poder na história democrática recente do país; e, por fim, a fragmentação do sistema político brasileiro, que contribuiu para a grande dispersão ideológica e de bandeiras políticas, o que acabou gerando uma grande pulverização, como a ocorrida nas eleições de 2018, em que o PSL representou o fenômeno ancorado por bolsonaristas, com 11,3% dos votos válidos, o que o fez ocupar 10,1% das cadeiras na Câmara Federal. Tendo elegido apenas um deputado federal nas quatro das últimas cinco eleições em que participaram, no pleito de 2018, muitos de seus candidatos disputaram cargos políticos pela primeira vez e foram eleitos.
É durante a gestão de Jair Bolsonaro que o Brasil enfrenta o grave problema de saúde pública desencadeado pela pandemia da Covid-19.O presidente, em suas redes sociais, pareceu seguir os moldes de atuação do então presidente dos Estados Unidos Donald Trump, utilizando-os tanto para emitir mensagens e feitos do governo, como para expor sua vida particular e opiniões pessoais sobre diversos acontecimentos a nível nacional e mundial, desencadeando controvérsias discursivas que se expõem mais fortemente por meio das redes sociais e da imprensa (BÉLAND et alii, 2021).
A noção de controvérsia adequa-se tanto como aporte teórico quanto como instrumento metodológico, e uma primeira aproximação com esse conceito é a definição do Dicionário Online de Português (2020), em que a controvérsia envolve contestação, discussão de ideias, divergência de opiniões fundamentadas em polêmicas, enfim, opiniões diferentes acerca de uma ação, desentendimento em torno de uma polêmica sobre a qual muitos indivíduos discordam. As controvérsias podem ser pequenas e atingir apenas algumas pessoas ou grupos sociais, ou pública, abrangendo a sociedade como um todo, tal qual a pandemia da Covid-19, que tem gerado uma disputa discursiva em torno de sua origem, causas, tratamentos, prevenção e controle, e esses discursos têm como palco principal as redes sociais digitais.
Foram muitas as controvérsias que circularam e ainda circulam em torno da pandemia da Covid-19, vírus que continua ativo no mundo e que, no Brasil, já vitimou mais de 660 mil pessoas, chegando a alcançar mais de 4 mil mortes no dia 8 de abril de 2021, segundo dados do Conselho Nacional de Secretários da Saúde (Conass), com média móvel de 2 mil óbitos por 45 dias consecutivos, sendo considerado o mês mais letal da pandemia de Covid no país, com mais de 82 mil mortes (ROSA, 2021). Mesmo nesse contexto alarmante, a rotina de funcionamento de diversas cidades e estados brasileiros voltaram à normalidade anterior, postura fortemente incentivada pelo presidente e seus seguidores, que realizaram diferentes manifestações durante a pandemia solicitando o direito de circularem livremente e de não utilizarem máscaras, que são as principais medidas de redução do contágio viral.
Algumas dessas controvérsias giram em torno do tratamento farmacológico da doença, com destaque para o uso da cloroquina e da hidroxicloroquina, que se mantiveram no centro de inúmeros discursos, sendo defendidas pelo presidente do Brasil, não obstante sua ineficácia no combate ao coronavírus ter sido comprovada por estudos científicos robustos. Outra controvérsia circulante diz respeito a alguns posicionamentos contraditórios e vacilantes da Organização Mundial de Saúde (OMS) sobre o vírus e as formas de enfrentamento da doença, fato que refletiu nas medidas adotadas em todos os lugares do mundo. Houve, de igual modo, uma forte contradição nos estudos de especialistas e nos posicionamentos de autoridades políticas sobre o assunto, além das estratégias e dos protocolos de segurança que divergiram nas esferas locais, regionais e nacionais, o que dificultou o controle do contágio, aumentando a disseminação do vírus e, consequentemente, o número de infectados e mortos.
Nesse contexto, houve controvérsias exclusivamente criadas e fomentadas pelo presidente Jair Bolsonaro, que tem sido apontado por especialistas em economia, jornalistas, profissionais da saúde e analistas políticos como um dos piores gestores do mundo no enfrentamento da Covid-19. Essas controvérsias foram exibidas em suas diferentes redes sociais durante lives semanais e em pronunciamentos públicos e entrevistas para jornalistas, por meio de anedotas e outros posicionamentos comunicativos e semióticos que evidenciam a forma como o presidente do Brasil encara a pandemia, seus efeitos e consequências políticas e sociais que esse cenário pode gerar.
Esse posicionamento discursivo do presidente tem alimentado cada vez mais a polaridade entre os espectros políticos de esquerda e direita do país, provocando uma forte divisão social e ideológica, que se expressa no constante embate travado em comentários deixados por usuários nas redes sociais de Bolsonaro. Nota-se um alto nível de interação, movimentação e conflitos discursivos nos comentários de suas redes sociais. Portanto, na presente pesquisa, foi feita a coleta dos comentários nas postagens do presidente em que ele fala sobre a pandemia da Covid-19, base de dados sobre a qual realizou-se mineração de texto, o que possibilitará a visualização do conteúdo por meio de um padrão de texto curto, permitindo organizar a sumarização das palavras, assuntos ou temas essenciais, conteúdo que será apresentado em grafos de similitude, o que proporcionará a visualização desse cenário de controvérsias presentes nos referidos comentários.
Cartografia das controvérsias em redes sociais digitais
Os assuntos que geram polêmica nas redes sociais digitais são o ponto principal da análise baseada em controvérsias e operacionalizada pela Teoria do Ator-Rede, que tem como seus expoentes Callon (1999) e Latour (2012), além de estudiosos como Venturini (2009), com pesquisas que fundamentam a construção do método da Cartografia de Controvérsias, possibilitando a realização de estudos sobre temáticas que circulam na internet. Com base nisso, é possível alcançar diferentes atores, observando o potencial de influência na rede, assim como os objetos, as tecnologias e as coisas, que também atuam de modo influente, se comportando como atores.
Segundo Lemos (2013), a rede é o conceito chave para que se possa compreender o movimento de circulação e associação que envolve atores humanos e não humanos, já que apenas dessa maneira é possível perceber o social em composição, uma vez que as redes não significam simplesmente um emaranhado de conexões. É imprescindível direcionar um olhar crítico para as redes, e é importante frisar que “mais do que explicar os fenômenos tendo como causa a sociedade ou o social, o social será aquilo que emerge das associações, das redes” (LEMOS, 2013, p. 36). A rede, partindo dessa perspectiva, seria uma espécie de composição de agenciamentos, em que cada ator tem a capacidade de influenciar igualmente os atores que compõem esta mesma rede.
A noção de cartografia social explorada neste artigo parte da ideia de mapas da Geografia, mas com aspectos sociais, sendo uma compreensão de Deleuze e Guattari (1995), com o objetivo de descrever as relações, trajetórias e formações que se configuram de forma rizomática, de modo que seja possível perceber as linhas de fuga, rupturas e resistências. Segundo Prado Filho e Teti (2013), uma cartografia social e acrescentada, de igual modo, comunicativa, procura tecer diagramas que expõem relações, enfrentamentos e cruzamentos de forças, além de jogos de verdades e enunciações, que envolvem ainda práticas de resistência e liberdade, configurando-se como uma análise que permite compreender a história presente de modo crítico.
É possível identificar a dinâmica micropolítica de um campo social e as relações de poder que se estabelecem, além das disputas discursivas e ideológicas. Esse tipo de pesquisa permite construir cartografias de agenciamentos, que envolvem enunciações e relações de poder, “tanto podendo capturar, anular e assujeitar, quanto organizar formas de resistência a jogos de objetivação e subjetivação” (PRADO FILHO; TETI, 2013, p. 48). Em suma, é um método que trabalha os campos de forças e as relações em determinada rede, focado na enunciação e nas relações de poder que estão em constante movimento. Essa rede se forma com base em elementos díspares, controversos e heterogêneos.
Algumas possibilidades giram em torno de cartografar elementos ou relações, que são:
Compostos por linhas de visibilidade e enunciação, envolvendo regime de luz e produção de verdades, além de jogos entre visível x invisível, visível x dizível, correspondendo à dimensão do saber dos dispositivos; eles apresentam também uma dimensão de poder, compostas por linhas de força agindo como vetores que os atravessam; são ainda dotados de linhas de objetivação e subjetivação, implicando práticas produtoras de subjetividades e sujeitos, além de apresentarem linhas de ruptura e fratura que se entrecruzam em constante movimento de mutação, renovação e atualização
(PRADO FILHO; TETI, 2013, p. 50).
A ideia que Deleuze e Guattari (1995) exploram em analogia às redes é o conceito de rizoma, que
se estende e se desdobra num plano horizontal, de forma acêntrica, indefinida e não hierarquizada, abrindo-se para a multiplicidade, tanto de interpretações quanto de ações, remetendo à formação radicular da batata, da grama e da erva daninha”
(PRADO FILHO; TETI, 2003, p. 51).
Essa rede é formada por dimensões, não tendo começo, fim ou centro, sendo composta por direções variáveis, além de ser móvel, conectando diferentes pontos e posições. Nesse sentido, a heterogeneidade, a multiplicidade e as possibilidades de ruptura a qualquer momento correspondem às principais características desse tipo de rede.
Albuquerque et al. (2018, p. 2) afirmam que a Internet possibilita que “o usuário não esteja mais em um espaço estritamente territorial, geográfico, mas sim em um híbrido território/rede comunicacional”, com a conexão mais onipresente, o que ficou evidente ao longo da pandemia da Covid-19, principalmente durante as fases mais rígidas de isolamento social. Para os autores, “cartografar é ver surgir a forma de um desenho que até a sua finalização era indiscernível” (ALBUQUERQUE et al., 2018, p. 4), e, com base nesse desenho, é possível implementar uma análise da rede.
A cartografia busca, de forma tateante, mapear o movimento que envolve a realidade e as coisas do mundo, visualizando as linhas de força e enfrentamento que circundam a realidade investigada. Santaella (2014) pesquisa os gêneros híbridos na internet, baseando-se em determinados conceitos trabalhados pelo pensador russo Mikhail Bakhtin, como a heteroglossia, definida como o confronto ou o conflito entre diferentes vozes, que, para a autora, “se faz sentir com mais ênfase quando concordâncias e discordâncias são justapostas sem que umas preponderem através das outras” (SANTAELLA, 2014, p. 207).
Outro conceito do pesquisador russo de que Santaella (2014) se apropria é a ideia de dialogismo, que representaria uma comunicação interativa pela qual há uma identificação e um reconhecimento por meio do outro, assim, a dialogia se configura como o ato do diálogo, o relacionamento entre os sujeitos e as movimentações entre estes. Em redes sociais digitais, o dialogismo se expressa quando um usuário publica uma mensagem, por exemplo, e esta desencadeia uma série de reações discursivas. Nesses casos, a polifonia também se impõe como um tipo de dialogismo, expressando-se, segundo a autora, pela convivência e interação de múltiplas vozes num mesmo espaço.
Metodologia
O processo KDD (do inglês, Knowledge Discovery in Databases), proposto por Fayyad, Piatetsky-Shapiro e Schmidt (1996), pode ser descrito como um instrumento metodológico de geração de conhecimento que se baseia na exploração de grandes volumes de dados por meio do uso de soluções computacionais inteligentes, incluindo métodos de mineração de dados e aprendizado de máquina. O KDD segue uma sequência de cinco etapas interativas e iterativas: seleção, pré-processamento, transformação, mineração de dados e interpretação. Uma das principais vantagens da utilização do KDD é o fato de que as análises geradas sobre conjuntos de dados podem ser realizadas sobre um todo, e não apenas em conjuntos amostrais, promovendo uma garantia de representatividade das informações obtidas (DEAN, 2014).
A etapa de seleção se refere à determinação do conjunto de dados a ser trabalho com base no problema a ser resolvido, assim como o processo de obtenção dos dados. Nesse sentido, o presente trabalho tem como proposta a realização de análises sobre as informações circulantes por partes dos usuários do Instagram em publicações relacionadas à Covid-19 no perfil oficial do presidente da República do Brasil, Jair Messias Bolsonaro. Para tanto, foi desenvolvida uma solução computacional usando a linguagem de programação Python e a biblioteca urllib3, a qual se conecta diretamente à base de dados da rede social por meio do uso de sua API2, que tem endpoints (serviço web que possibilita o acesso com base em uma url personalizada) específicos para a obtenção de mídias de interesse. Os dados são obtidos em formato estruturado JavaScript Object Notation (JSON), persistidos em uma base de dados local.
Uma das características principais das redes sociais digitais é o livre uso da língua escrita, sem necessidade de aplicação da norma culta, o que acaba por gerar variações no uso de termos, emprego de siglas, onomatopeias, e representação de palavras com emoticons. Dessa maneira, para propósitos de análise textual por meio de métodos computacionais, a base de dados obtida necessita da aplicação de um processo de limpeza, o que se refere à etapa de pré-processamento do KDD.
Com o uso de soluções baseadas em expressões regulares (FITZGERALD, 2019), foram desenvolvidas rotinas para padronização textual para remoção de caracteres especiais, emoticons, hashtags e menções a outros usuários. Utilizou-se, nessa etapa, a biblioteca re da linguagem de programação Python. Além disso, com base em operações estatísticas, foi realizado um estudo exploratório para verificação de possíveis outliers ante o engajamento (indicador de participação ativa dos usuários, obtido, neste caso, pela soma do número de comentários e curtidas das publicações). A verificação dos outliers neste contexto se torna interessante para verificar possíveis fenômenos ou tendências que provoquem maiores manifestações por parte do cidadão, enquanto usuário da rede social.
Os dados tratados foram convertidos em dois formatos principais: inicialmente para o formato estruturado CSV (do inglês comma separated values), necessário para o uso dos métodos de mineração de dados voltados para a análise de sentimentos, e posteriormente para um formato textual, a ser utilizado nos processos de identificação dos termos de maior relevância, suas conexões semânticas, e o processo de agrupamento com base no cálculo da similaridade.
A mineração de dados pode ser descrita como um conjunto de técnicas automatizadas para extração de padrões de um conjunto de dados (ZAFARANI et al., 2014). A mineração de dados textuais é uma especialização da mineração de dados que trata, além da exploração analítica, da identificação de relacionamentos entre os termos e a análise de conteúdo (WITTEN et al., 2011). A mineração de dados textuais se desenvolve por meio de duas abordagens distintas: análise estatística/sintática e análise semântica. A primeira trata dos aspectos quantitativos dos termos que compõem a base de dados, incluindo distribuição de frequências, estatísticas, codificação e modelos de representação. A análise semântica explora aspectos relacionados à importância dos termos na constituição do significado e/ ou contexto, tendo como base o Processamento de Linguagem Natural.
Neste trabalho, foram utilizadas técnicas de análise por meio de agrupamento e classificação de dados textuais. O agrupamento possibilita identificar grupos cognatos, reunindo os documentos textuais que apresentam similaridade do ponto de vista semântico, com base na relevância dos termos. Assim, cada grupo se refere a uma classe de documentos e tal atributo pode ser utilizado posteriormente em tarefas de classificação, conforme apresentado por Witten et al. (2011).
Entre as muitas aplicações para classificação de dados textuais, está a Análise de Sentimentos (YOOSIN et al., 2018). A análise de sentimentos é uma técnica de mineração de dados que viabiliza o estudo de opiniões e emoções humanas em relação a um evento descrito em linguagem natural (comentários em postagens de redes sociais, por exemplo). A polaridade representa o grau de positividade ou negatividade em relação a determinada informação, sendo, portanto, uma forma de qualificar o sentimento e/ou opinião.
Assim, neste trabalho, a análise de sentimentos possibilitou verificar o apoio (polaridade positiva), repúdio (polaridade negativa) ou neutralidade dos usuários em relação às publicações do presidente Jair Bolsonaro em seu perfil no Instagram. Para análise de sentimentos, foi desenvolvida uma solução computacional, por meio da utilização das bibliotecas NLTK e scikit- learn da linguagem Python, de aprendizado de máquina com implementação do algoritmo Naive-Bayes (TAN et al., 2009; PARVEEN; PANDEY, 2016). A solução considera a rotulação manual de parte do conjunto de dados considerado, isto é, anotação por parte de especialistas de domínio sobre amostra dos comentários extraídos do Instagram. Para os experimentos realizados, a exemplo do descrito em Luo et al. (2021), foi considerada a rotulagem de 20% de todo o universo de dados, consolidando, desta maneira, o conjunto de dados de treinamento.
O método Naive-Bayes assume que a probabilidade de ocorrência de cada termo em um segmento de texto ou documento independe da ocorrência de qualquer outro termo e também ignora a ordem ou sequencialidade deles. Cada documento do corpus textual (texto das postagens ou texto dos comentários) foi representado com base na ocorrência (1) ou ausência (0) dos termos, e a importância (peso) de cada termo é inferida durante o processo de aprendizado. Com o somatório dos pesos dos termos em uma sequência textual, um rótulo ou classe que identifica o sentimento que se destaca é atribuído ao documento. Dessa forma, a noção de apoio, repúdio ou neutralidade a determinado discurso é obtida de maneira automatizada.
Para explorar o conteúdo das publicações no perfil escolhido, no que tange à relação entre os termos quanto aos aspectos de relevância e similaridade, foi usado o software IRAMuTeQ. Duas técnicas foram utilizadas: Método de Reinnert ou Classificação Hierárquica e Grafo de Similitude. O método de Reinnert implementa análise léxica sobre o corpus textual, utilizando o vocabulário identificado e quantificado em relação à frequência e à sua posição no texto (CAMARGO; JUSTO; IRAMUTEQ, 2013). A análise de similitude possibilita a identificação de coocorrências de termos entre as classes, indicações da conectividade dos termos dentro de cada classe e das ligações entre classes distintas (MENDES et al., 2016). Por meio do grafo de similitude, pode-se identificar a estrutura, o núcleo central e o sistema periférico da interpretação do conteúdo do corpus textual.
Resultados
Por meio da aplicação das etapas elencadas na metodologia, para extração do conteúdo veiculado no perfil oficial do presidente Jair Messias Bolsonaro na rede social Instagram, foram obtidas um total de 730 publicações, referentes ao primeiro semestre de 2020. As publicações obtidas foram submetidas a um filtro para seleção apenas daquelas com conteúdo relacionado à Covid-19, sendo a amostra efetiva composta de um total de 110 publicações, o que corresponde a 15% do conteúdo publicado. Das publicações selecionadas, foram ainda extraídos os comentários feitos por usuários da rede social, totalizando 1.886.897 comentários. Nesse sentido, após a aplicação do procedimento de pré-processamento de dados, os comentários que tinham apenas emoticons foram removidos, resultando em uma base de dados contendo um total de 725.361 comentários.
Com a obtenção da amostra de dados, foram verificados os possíveis outliers quanto ao engajamento associado às publicações. A Figura 1 apresenta os resultados obtidos nessa análise, nos quais foram detectadas dez publicações com valor de engajamento classificado como outlier, as quais apresentaram um valor de engajamento maior que 569.827,25 (valor obtido por meio de cálculo). Para os propósitos de análise do presente trabalho, as publicações classificadas como outliers foram removidas da amostra, de modo a evitar enviesamento nos resultados alcançados.
Por meio do uso do IRAMuTeQ, foram gerados os grafos de similitude referentes ao conjunto total de comentários coletados, assim como aos conjuntos dos comentários classificados como positivos e negativos. A classificação em relação ao sentimento foi realizada por meio de solução computacional baseada no método de Naive-Bayes. Os comentários classificados como positivos representam um total de 196.648 (27,1% da base de dados). Os comentários classificados como negativos computaram um total de 285.893 (33,4% da base de dados). E, finalmente, os comentários classificados como neutros somaram um total de 285.893 (39,4% da base de dados).
A Figura 2 apresenta o grafo de similitude obtido para a amostra total de comentários. É possível notar a ocorrência de um grupo principal, o qual tem como termo principal a palavra deus, e dois grupos adjacentes de maior relevância, sendo denotados pelos termos pessoa e brasil. Dentro desses grandes grupos, é possível visualizar as ramificações dos termos que expressam as disputas ideológicas e discursivas em torno da controvérsia pública que é a pandemia da Covid-19 sob o prisma dos comentários coletados.
É possível perceber também que essa rede é formada por elementos semânticos díspares, que alimentam a controvérsia sobre o vírus. Nessa rede geral, que expressa o desenho da presente cartografia, nota-se a circulação, o movimento e as associações que são feitas, no caso, pelas aproximações semânticas, permitindo analisar o conglomerado de agenciamentos que se posicionaram com termos positivos, negativos e neutros, e, em uma análise futura, explorar os atores, tanto humanos como não humanos, que fizeram parte dessa multiplicidade rizomática, em que transitam diferentes vozes e sentidos em uma mesma rede. Nota-se uma exposição dos usuários a informações que reforçam questões políticas com vieses partidários, sucumbindo, de certa maneira, a um sistema de recirculação de discursos e narrativas (LARSON, 2019).
A Figura 3 apresenta o grafo de similitude obtido para o conjunto dos comentários classificados como positivos. O resultado evidencia a forte presença de termos que se relacionam diretamente a fé e a religião (deus, jesus, graça e glória). O grupo pode ser classificado em dois temas específicos: religiosidade e nacionalismo. Além de explorar aspectos da subjetividade humana, como a fé, a crença e os sentimentos, faz parte da retórica discursiva do novo conservadorismo brasileiro, que se apoia fortemente nos valores religiosos e na defesa dos chamados valores familiares, com apoio ao endurecimento de penas criminais para punir os desviantes, e na valorização de um estado gerido pelas relações de mercado, em contraposição a um estado assistencialista, tal como condena essa corrente de pensamento (LACERDA, 2019).
A rede de apoio bolsonarista, como o próprio presidente enfatizou em seu pronunciamento de agradecimento da vitória nas urnas, é formada por lideranças evangélicas, agropecuaristas e agricultores familiares, policiais militares e civis, além de integrantes das forças armadas, tendo como bandeira principal a reivindicação pelo respeito a seus valores (SANTOS, 2018). Os termos identificados neste grupo fazem parte das narrativas recorrentes de tal rede, com ênfase para os termos relacionados ao cristianismo e alguns que se relacionam com os valores defendidos pela família tradicional brasileira, respaldados fortemente em termos que expressam ideias nacionalistas e patriotas, como brasil, nação, voto, capitão, mito, respeito, comando, coragem etc.
Diferentemente da Figura 3, que apresenta os comentários positivos da amostra, que se mostraram mais homogêneos pelo próprio tamanho do grupo, a Figura 4 expõe como essa mesma rede de comentários pode apresentar diferentes heterogeneidades argumentativas (que se apoia nos termos em destaque, como deus, povo, brasil, vírus, país, entre outros), evidenciando ainda as cacofonias que são características comuns das redes sociais, principalmente quando a interação ocorre em torno de assuntos e também de atores controversos, como é o caso deste estudo. Nos comentários classificados como negativos, a rede se mostra mais ramificada, o que possibilita o alcance de públicos diversos, e é onde se dá as relações, os enfrentamentos e o conjunto de forças do debate que travam disputas discursivas e jogos de verdade. “Essa lógica é seguida por Foucault, de modo que, para ele, ‘o discurso não é simplesmente aquilo que traduz as lutas ou os sistemas de dominação, mas aquilo por que, pelo que se luta, o poder do qual nos queremos apoderar’” (FOUCAULT, 1996, p. 10, apud VEIGA-NETO, 2016, p. 89-90).
As disputas discursivas e os jogos de verdade se tornaram comuns quando o assunto se refere à pandemia da Covid-19, principalmente diante da contestação da ciência por negacionistas e autoridades políticas, o que influencia na tomada de decisão de cidadãos comuns. Veiga-Neto (2016, p. 90) explora uma ideia de que se “‘a verdade é aquilo que dizemos ser verdadeiro’ — que equivale a dizer que as verdades não são descobertas pela razão, mas sim inventadas por ela”, tal fato não permite afirmar que qualquer um pode atribuir um sentido de verdade de acordo com sua racionalidade sobre o assunto, mas que existe uma racionalidade constituída com autoridade para dizer o que é verdade, que, no caso em estudo, trata-se da verdade ou autoridade científica, ainda que as teses negacionistas entrem nessa disputa discursiva sobre a origem, efeitos, formas de tratamento e contenção do vírus.
Uma vez que o dendograma constitui uma ferramenta de classificação dos termos, a Figura 5 sugere a divisão do corpus textual em cinco classes estáveis, agrupando unidades de contexto elementar (UCE) com vocabulário semântico similar. Assim, se verifica que os termos referentes à classe 1 (vermelho) têm menor correlação ou proximidade com os termos que compõem as demais classes, estando alinhados às questões de discursos e falas de apoio ao presidente. De forma análoga, os termos da classe 2 (cinza) e 3 (verde) são mais correlacionados entre si, trazendo questões que permeiam as relações entre a Covid-19 e questões que remetem a emprego e isolamento social. Por fim, as classes 4 (azul) e 5 (roxo) ressaltam os aspectos oposicionistas aos conteúdos circulantes, assim como questionamentos sobre a atuação do presidente enquanto autoridade maior no Executivo nacional. Essa mesma relação é observada na Figura 6, que apresenta a análise de correspondência dos termos. Verticalmente, verifica-se uma variabilidade de 25,07% entre as unidades de contexto elementar, e, no eixo horizontal, uma variabilidade de 36,04% entre os dois agrupamentos, revelando que as classes 2 (cinza) e 3 (verde) estão em campo semântico oposto à classe 1 (vermelho). Além disso, ressalta-se que o tamanho da fonte na Figura 6 define a relevância dos termos, na qual, para a classe 1 (vermelho), o termo central é deus, seguido por abençoe e presidente, e, no quadrante oposto, se tem os termos: dinheiro, receber e salário para a classe 3 (verde); vírus, fronteira e fechar para a classe 2 (cinza).
Considerações Finais
A cartografia sugere não definir atores ou ordenar a priori a controvérsia a ser estudada, porém optou-se por se basear na rede de um ator central, de uma controvérsia pública, a pandemia da Covid-19, para, por meio do mapeamento dessa rede, visualizar os termos, os fluxos e as disputas de sentimentos que compõem a controvérsia destacada. Na pesquisa, foram identificadas cinco classes de termos, que apresentaram o conjunto de enunciados e controvérsias discursivas circulantes como respostas nas postagens de Jair Bolsonaro contendo o tema da pandemia da Covid-19 no Instagram.
Das cinco classes de termos, três se destacaram em torno de assuntos guias, sendo consideradas as que alimentaram as maiores controvérsias, são elas: religiosidade e nacionalismo, que tinha como termos centrais “deus”, “abençoe” e ”presidente“ e se concentrou nas postagens da classe 1 (vermelho), com 29, 2% do total identificado, colocando-se do lado positivo da análise de sentimentos; economia, apoiada nos termos “dinheiro”, “receber” e “salário”, ocupando 14,8% do total das postagens e se posicionando do lado oposto da análise, como sentimentos negativos se concentrando na classe 3 (verde). E, ainda, o tema saúde, que também está classificado no sentido oposto da classe 1, tendo maior correlação com a classe 3, com destaque para os termos “vírus”, “fronteira” e “fechar”, com 18,1% das postagens identificadas, representado pela classe 2 (cinza). As outras duas classes 4 (azul) e 5 (roxo) são as que mais se correlacionam entre si, somando, respectivamente, 26,6% e 11,4% dos comentários filtrados sobre o assunto, cruzando mais a fronteira entre positivo e negativo e ainda se posicionando mais constantemente de forma neutra.
A análise de sentimentos é feita com base nessa classificação dos dados textuais, procurando evidenciar as opiniões e emoções humanas sobre determinados assuntos por meio de uma linguagem natural, expondo as polaridades que surgem da extração de informações subjetivas contidas no corpo textual analisado, lidando com o grau de positividade ou negatividade em relação a determinada informação. Os três temas que se sobressaíram na análise, principalmente economia e saúde, foram destaque em pautas sobre o debate em torno da efetividade ou não das políticas adotadas no enfrentamento da pandemia da Covid-19.
No artigo, procurou-se explorar a controvérsia em torno de uma disputa semântica, sendo possível delinear sentimentos positivos e negativos de tal forma que as razões pró ou contra seus posicionamentos discursivos se ramificaram em diferentes sentidos dentro da rede, gerando engajamento e compartilhamento de conteúdo, o que assume proporções inimagináveis, podendo alcançar diferentes públicos, desencadeando ainda outras redes e controvérsias sobre o assunto. Cavalcante et al. (2017, p. 5) afirmam que:
O estudo das controvérsias é proveniente da análise dos embates entre as partes oponentes e tem por objetivo revelar que não existem fatos puros, sendo a informação algo neutro. Todos os argumentos fazem parte de um jogo de poder, interesse e força, que expressam, por meio da concretude onde os fatos vão adquirindo.
Foi explorada uma controvérsia pública, a pandemia da Covid-19, que concentra o debate ou a polêmica sobre o assunto, por meio dos efeitos semânticos gerados pelas publicações de um ator central, mas que, além disso, alcançou a multiplicidade dos atores que circulam em sua rede, sejam eles humanos ou não humanos, de modo que o assunto explorado evidencia uma controvérsia inacabada em torno dos conhecimentos científicos e técnicos sobre a Covid-19, seus efeitos e modos de tratamento, o que a posiciona como uma controvérsia quente e instável, e, somente quando o debate estiver consolidado, após a resolução da controvérsia, é que o assunto se fechará em uma caixa-preta, que resulta de “um processo de endurecimento da vida em certezas, resultante dos acordos entre os atores” (CAVALCANTE et al., 2017, p. 5).
Ante as análises realizadas, é possível presenciar os microatores se comportando cada um como uma frágil caixa-preta, revelando conexões, articulações e redes que se formaram em torno de uma mesma controvérsia. Nesse recorte, a controvérsia se articula e se movimenta em diferentes sentidos, evidenciando uma disputa que identifica as vozes discordantes, que se posicionam do lado positivo ou negativo da amostra. Os sentidos e os sentimentos atribuídos à Covid-19, com base nas publicações de Jair Bolsonaro em seu Instagram, revelam as narrativas e o social se construindo, desconstruindo e sendo reconstruído, em um movimento muito dinâmico, devido à quantidade de interações sobre o assunto somente nessa rede social, o que, segundo Cavalcante et al. (2017), evidencia ainda os efeitos de sinergia, de cooperação, de encadeamento, as limitações e as repercussões da rede.
A controversa finda quando ela se consolidar em um acordo mútuo entre os atores e as partes envolvidas, criando uma espécie de consenso sobre o assunto, o que parece estar longe de acontecer, pois existem caixas-pretas abertas em torno das verdades científicas, da vacina, dos medicamentos, da logística de contenção do vírus e das políticas de governo, influenciando sobremaneira as atitudes dos atores que circulam nas redes sociais e, consequentemente, na formação da opinião pública.
-
1
Numa primeira aproximação, infodemia é um termo que deriva da palavra inglesa infodemic, de information, informação + [epi]demic, epidemia. Substantivo feminino que significa excesso de informação sobre determinado tema, por vezes incorreta e produzida por fontes não verificadas ou pouco fiáveis, que se propaga velozmente (exemplo: infodemia de notícias falsas nas redes sociais) (PRIBERAM DICIONÁRIO, 2021). Disponível em: <https://dicionario.priberam.org/infodemia>. Acesso em: 13 ago. 2021.
-
2
Graph API do Instagram. Disponível em: <https://developers.facebook.com/docs/instagram-api/>. Acesso em: 10 mar. 2020.
Referências
-
AGGIO, C. A eficácia da hidroxicloroquina. Compolítica, Rio de Janeiro, 27 de abril de 2020. Disponível em: <http://compolitica.org/novo/especial-coronavirus-2/>. Acesso em: 18 abr. 2022.
» http://compolitica.org/novo/especial-coronavirus-2/ - ALMICO, T.; FARO, A. Enfrentamento de cuidadores de crianças com câncer em processo de quimioterapia. Psicologia, Saúde & Doenças, v. 15, n.3, p. 723-737, 2014.
- ARAÚJO, M; GONÇALVES, P.; BENEVENUTO, F. Métodos para Análise de Sentimentos no Twitter. Simpósio Brasileiro de Sistemas Multimídia e Web, XIX, Salvador, 2013. Proceedings… Salvador: Webmedia, 2013.
- BÉLAND, D.; et alii Trump, Bolsonaro and the framing of the Covid-19 crisis: how political institutions shaped presidential strategies. World Affairs, v. 184, n. 4, p. 413-440, 2021.
- BENEVENUTO, F.; RIBEIRO, F.; ARAÚJO, M. Métodos para a análise de sentimentos em mídias sociais. Simpósio Brasileiro de Sistemas Multimídia e Web, XXI, Manaus, 2015. Proceeding.., Manaus: Webmedia, 2015.
- BÖTTGER, T.; IBRAHIM, G.; VALLIS, B. How the internet reacted to Covid-19: A perspective from Facebook’s edge network. ACM Internet Measurement Conference, XX, 2020. Proceedings… New York: ACM, 2020.
- CALLON, M. Actor-network theory: the market test. In: LAW, J.; HASSARD, J. (Orgs.) Actor-Network Theory and After London: Blackwell, 1999. p. 181-195.
- CAMARGO, B. V., JUSTO, A. M. IRAMUTEQ: Um software gratuito para análise de dados textuais. Temas em Psicologia, v. 21, p. 513-518, 2013.
- CAVALCANTE, R. B. et al A Teoria Ator-Rede como referencial teórico-metodológico em pesquisas em saúde e enfermagem. Texto Contexto Enfermagem, v. 26, n. 4, p. 6-9, 2017.
- DEAN, J. Big data, data mining and machine learning: value creation for business leaders and practitioners. New Jersey, USA: Wiley, 2014.
- DELEUZE, G; GUATTARI, F. Mil platôs – capitalismo e esquizofrenia, v.1. Tradução de Aurélio Guerra Neto e Célia Pinto Costa. Rio de Janeiro: Ed. 34, 1995.
- FAYYAD, U. M., PIATETSKY-SHAPIRO, G., SIMTH, P. The KDD Process for Extracting Useful Knowledge from Volumes of Data. Communications of the ACM, v. 39, n. 11, p. 27-34, 1996.
- FITZGERALD, M. Introdução às expressões regulares São Paulo: O’Reilly Novatec, 2019.
- GIANFREDI, V.; PROVENZANO, S.; SANTANGELO, O. E. What can internet users’ behaviours reveal about the mental health impacts of the COVID-19 pandemic? A systematic review. Public Health, v. 198, p. 44-52, 2021.
- JUNGKUNZ, S. Political polarization during the COVID-19 pandemic. Frontiers in Political Science, v. 3, n.p., 2021.
- LACERDA, M. B. O novo conservadorismo brasileiro: de Reagan a Bolsonaro. Porto Alegre, RS: Zouk, 2019.
- LARSON, A. O. News use as amplification: Norwegian national, regional, and hyperpartisan media on Facebook. Journalism & Mass Communication Quarterly, v. 96, n. 3, p. 721-741, 2019.
- LATOUR, B. Reagregando o social: uma introdução à teoria do Ator-Rede. Salvador: Edufba, 2012; Bauru, SP: Edusc, 2012.
- LEMOS, A. A comunicação das coisas: teoria do ator-rede e cibercultura. São Paulo: Annablume, 2013. (Coleção Atopos).
- LUO et alii Merging Naive Bayes and Causal Rules for Text Sentiment Analysis. Journal of Physics: Conference Series, v. 1757, n. 1, 012034, 2021.
- MENDES, F.; et alii Social Representations of nursing students about hospital assistance and primary health care. Rev Bras Enferm v. 69, n.2, p. 321-328, 2016.
- MONARI, A. C. P.; et. alii Legitimando um populismo anticiência: análise dos argumentos de Bolsonaro sobre a vacinação contra Covid-19 no Twitter. Liinc em Revista, v. 17, n. 1, e5707, 2021.
-
NICOLAU, J. O triunfo do bolsonarismo. Como os eleitores criaram o maior partido de extrema direita da história do país. Revista Piauí, ed. 146, nov. 2018. Disponível em: https://piaui.folha.uol.com.br/materia/o-triunfo-do-bolsonarismo/ Acesso em: 31 jul. 2020.
» https://piaui.folha.uol.com.br/materia/o-triunfo-do-bolsonarismo/ - OLIVEIRA, D. et al A aplicação da técnica de análise de sentimento em mídias sociais como instrumento para as práticas da gestão social em nível governamental. Rev. Adm. Pública, Rio de Janeiro, v. 53, n. 1, p. 235-251, 2019.
- PARVEEN, H.; PANDEY, S. Sentiment analysis on Twitter data-set using Naive Bayes algorithm. International Conference on Applied and Theoretical Computing and Communication Technology, 2nd, 2016. Proceedings… (iCATccT) Simpósio Brasileiro de Sistemas Multimídia e Web, XIX, Salvador, 2013. Proceedings… Bangalore, India: IEEE, 2016.
- PIAN, W.; CHI, J.; MA, F. The causes, impacts and countermeasures of Covid-19 “Infodemic”: A systematic review using narrative synthesis. Information Processing & Management, v. 58, n. 6, 102713, 2021.
- PRADO FILHO, K.; TETI, M. A cartografia como método para as ciências humanas e sociais. Barbaroi, Santa Cruz do Sul, n. 38, p. 45-49, jun. 2013.
- RECUERO, R.; SOARES, F.; ZAGO, G. Polarização, hiperpartidarismo e câmaras de eco: como circula a desinformação sobre Covid-19 no Twitter. Contracampo, v. 40, n. 1, p 1-17, 2021.
-
ROSA, A. Mês mais letal da pandemia, abril tem alta de 23,5% em mortes por Covid-19. CNN Brasil, São Paulo, 2021. Disponível em: https://www.cnnbrasil.com.br/saude/mortes-por-covid-19-no-brasil-tem-alta-de-23-5-em-abril/ Acesso em: 5 abr. 2022.
» https://www.cnnbrasil.com.br/saude/mortes-por-covid-19-no-brasil-tem-alta-de-23-5-em-abril/ - SANTAELLA, L. Gêneros discursivos híbridos na era da hipermídia. Bakhtiniana, Rev. Estud. Discurso, São Paulo, v. 9, n. 2, p. 206-216, 2014.
- SANTOS, M. R. “Brasil acima de tudo, Deus acima de todos”: uma análise dos usos do nacionalismo e patriotismo na candidatura presidencial de Jair Bolsonaro em 2018. 2018. Dissertação (Mestrado) - Programa de Pós-Graduação em Sociologia e Ciência Política, Universidade Federal de Santa Catarina, Florianópolis, p. 134, 2018.
- TAN, S.; et alii Adapting Naive Bayes to Domain Adaptation for Sentiment Analysis. In: BOUGHANEM, M., BERRUT, C., MOTHE, J., SOULE-DUPUY, C. (Orgs.) Advances in Information Retrieval Berlin, Heidelberg: Springer, 2009.
- VEIGA-NETO, A. Foucault & a Educação 3. ed.; 2. reimp. Belo Horizonte: Autêntica Editora, 2016.
- YOOSIN KIM KANG, M.; SEUNG R. J. Text mining and sentiment analysis for predicting box office success. KSII Transactions on Internet & Information Systems, v. 12, n. 8, p. 4090–4102, 2018.
- ZAFARANI, R.; ABBASI, M.; LIU, H. Social media mining: an introduction Cambridge University Press, 2014.
Datas de Publicação
-
Publicação nesta coleção
11 Jul 2022 -
Data do Fascículo
2022
Histórico
-
Recebido
22 Dez 2021 -
Aceito
26 Abr 2022