Open-access A capacidade dos trending topics em pautar o debate: agenda setting do algoritmo

Trending topics’ ability to guide the debate: the agenda setting of the algorithm

Resumo

O algoritmo das redes sociais funciona com um sistema complexo de inteligência artificial para criar uma linha de tempo que retenha usuários e garanta permanência de tela. Por meio de assuntos que viram tendência, o algoritmo pauta o debate público através de uma lógica: os temas surgem, na maioria das vezes, no Twitter, em contas de políticos, jornalistas ou influenciadores, e migram para outras redes. Considerando a possibilidade de produção artificial de trendings no Twitter, através do uso de robôs, os debates que são gerados podem representar um desequilíbrio no sistema político. Partindo de pesquisa bibliográfica e análise de documentos, este artigo faz uma reflexão sobre o modo como determinados procedimentos tecnológicos podem influenciar diretamente a formação da opinião pública.

algoritmo; trending topics ; Twitter; redes; discurso

Abstract

The social media algorithm works with a complex artificial intelligence system to create a timeline that keeps users in front of the screen. Through topics that become trends, the algorithm guides the public debate by means of a logic: the topics appear, most of the time, on Twitter, in accounts of politicians, journalists or influencers, and migrate to other networks. Considering the possibility of artificially producing trend topics on Twitter by using robots, the debates that are generated may represent an imbalance in the political system. Based on bibliographical research and document analysis, this article reflects on the way in which certain technological procedures can directly influence the formation of public opinion.

algorithm; trending topics; Twitter; networks; discourse

Introdução

Em 2006, o Facebook criou uma funcionalidade que viria a mudar as relações sociais no dia a dia e que, posteriormente, após diversas alterações, chegaria a interferir no debate político em eleições, o EdgeRank.1 Criado inicialmente por um engenheiro da empresa chamado Serkan Piantino, o EdgeRank é um conjunto de códigos que classifica um conteúdo na plataforma de acordo com três critérios básicos: a afinidade, o peso e a data em que foi criado aquele conteúdo. Em 2011, o Facebook abandonou o EdgeRank2 para usar um novo algoritmo,3 dessa vez com "100.000 pesos individuais para produzir o feed de notícias",4 segundo Lars Backstrom,5 para a revista MarTech.

O conjunto de códigos que se comunica com outro conjunto de códigos, a fim de estabelecer rotinas, padrões, comportamentos e de exibir, na tela do usuário, um determinado resultado para uma ação, denomina-se "Interface de Programação de Aplicações" (API, Application Programming Interface, em inglês). Por ser feita para comunicar com outras aplicações, a API é, na maioria das vezes, invisível ao usuário final. É através desses conjuntos de códigos que as redes sociais criam os feeds de notícias, que se popularizaram com características que são similares na maioria das redes sociais atuais: feed com rolagem infinita, puxar para atualizar, duplo clique para curtir e outras ações que transformaram a nossa rotina digital, o que propicia maior usabilidade e deixa a experiência dos interagentes mais intuitiva.

Esses comportamentos, redes e características criaram sistema de sugestão e exibição de conteúdo conhecido popularmente por algoritmo, um conjunto de API que estabelece critérios para exibir conteúdos na tela do usuário, buscando, na maioria das vezes, duas métricas: tempo de tela e interação. É através do tempo de tela que as plataformas conseguem mensurar o interesse do usuário, e é através da interação que as plataformas conseguem vender espaço para anunciantes.

Tanto o Twitter quanto o Facebook e as demais redes sociais sobrevivem dessa lógica. Criam API para se comunicarem com a interface, sugerindo conteúdo, buscando aumentar o tempo de tela e incentivando o usuário a interagir com outros interagentes nas plataformas, gerando dados para aumentar o interesse de anunciantes.

Esse interesse dos anunciantes acaba se tornando um dos principais, se não o principal, guia para construção de design, interface gráfica, cores e quaisquer outros elementos que consigam prender a atenção do usuário.6 A lógica econômica interfere e influencia diretamente na experiência do usuário, e, por serem empresas com bilhões de usuários ativos mensais,7 essa lógica acaba interferindo na internet como um todo. Algo análogo ao que Bourdieu (1996) chamou de "subordinação estrutural" dentro de um "mercado de bens culturais".

Esse universo relativamente autônomo (o que significa dizer também, é claro, relativamente dependente, em especial com relação ao campo econômico e ao campo político) dá lugar a uma economia às avessas, fundada, em sua lógica específica, na natureza mesma dos bens simbólicos, realidades de dupla face, mercadorias e significações, cujo valor propriamente simbólico e o valor mercantil permanecem relativamente independentes. (p. 162)

A mesma lógica aplica-se ao mundo da comunicação. Nesse sentido, ainda que haja uma transposição de realidades, seria possível compreender as redes sociais como produtos que se voltam aos interesses do mercado e aos interesses políticos ao mesmo tempo. Ou seja, acabamos conhecendo um algoritmo que serve para prender o usuário em retenção de tela, viabilizando o consumo de um produto, que pode estar diretamente atrelado a interesses políticos e econômicos. O comportamento do usuário, por sua vez, estruturado pela própria rede, será também estruturante, alimentando o algoritmo, gerando dados que o sofisticam cada vez mais.

Esse conceito é o que determina o sistema de inteligência artificial a aprendizado de máquina. Uma estrutura que aprende com a rotina dos usuários, criando um padrão de forma estruturante para novos conteúdos e novos usuários nas plataformas.

O sucesso das redes envolve diversas lógicas sociais e econômicas, mas é certo que esses algoritmos das redes são tratados como segredo de mercado. É natural compreender que qualquer funcionário de uma dessas redes sociais tenha em seu contrato a obrigação para assinar algum tipo de NDA (Acordo de Não Divulgação),8 garantindo que códigos, dados e processos ali desenvolvidos não sejam levados para outra empresa ou expostos na imprensa. O algoritmo pode ser considerado um dos capitais simbólicos de uma rede, e a capacidade do algoritmo reter o usuário na plataforma acaba se tornando segredo de mercado.

Da mesma maneira, também é compreensível que, pela quantidade de usuários e dados em suas plataformas,9 exista uma divisão de tarefas por equipes ou grupos. Cada equipe cuida de uma funcionalidade específica dentro da plataforma, seja como são disponibilizadas as fotos, seja como são enviadas as mensagens para um celular, seja ainda como é definida uma tarefa quando o usuário não está ativo. Há uma certa divisão manufatureira do trabalho na produção dessas redes, que gera uma espécie de alienação do trabalho produzido, quando um programador desenvolve uma API em específico para contribuir com um determinado algoritmo. A complexidade do trabalho impede que apenas um programador realize as rotinas; com isso, não há um entendimento por completo sobre como funcionam as regras de todos os serviços e sistemas dentro de uma plataforma. Esse elemento nos chama a atenção para o fato de que o comportamento de uma rede social não pode ser compreendido totalmente pelos seres humanos que a estruturam, o que nos faz questionar se é possível aplicar a ideia de intencionalidade e de responsabilidade às consequências das redes sociais. Disso decorre uma questão ética que demanda novos parâmetros de análise.

Um outro elemento importante para esse debate, para além do fato dos construtores das redes serem múltiplos e atuarem sem a compreensão do funcionamento total da plataforma, é o envolvimento dos interagentes na produção do próprio algoritmo. O usuário é, nesse sentido, também produtor do serviço que ele consome. Um exemplo disso pode ser visto em um experimento do Google chamado Google Quick Draw,10 pelo qual os próprios usuários ensinam um algoritmo de inteligência artificial a reconhecer formas e desenhos.

Com esses experimentos e esses códigos de inteligência artificial, as redes constroem o que é conhecido como machine learning12 ou o aprendizado de máquina, importante para o aprimoramento constante do feed de notícias no Facebook ou do feed de fotos no Instagram.13 A presença dessa tecnologia cria uma situação inédita nas relações midiáticas, porque também contribui para colocar sob suspeita a intencionalidade de uma comunicação. Os interagentes, ao buscar por assuntos de seu interesse, visitar páginas, clicar em links, curtir imagens e vídeos, fornecem informações que geram padrões de reconhecimento, alimentando o funcionamento do sistema. Dessa forma, o gosto e o interesse, ao darem início ao processo de coleta de dados, devolvem ao usuário informações em sintonia, alimentando e prolongando a perspectiva que deu início ao processo. Há, portanto, uma tendência de manutenção das perspectivas e opiniões. Contudo, essa relação sinérgica entre o interagente e as informações com as quais ele está interagindo cria uma abertura a novos conteúdos, produtos e perspectivas que pode ser muito persuasiva. As decisões passam a ser tomadas com a influência, ainda que parcial, dos algoritmos, e o aprendizado de máquina passa a ser um dos responsáveis por acertar de maneira cada vez mais precisa gostos, desejos e vontades dos usuários. Essa realidade cria uma tendência no marketing de produtos, que, ao ser aplicada ao marketing político, cria uma situação ética urgente, que precisa ser conhecida e debatida.

Este artigo procura contribuir para esse debate, questionando, a partir de características técnicas, o funcionamento das redes sociais do ponto de vista político. A partir de um olhar para o Twitter, o artigo pretende investigar a hipótese de que essa rede tecnossocial exerce influência sobre as demais redes, em especial sobre temas políticos. Pelas características da plataforma, é possível reconhecer o uso de robôs, capazes de deixar notícias, não necessariamente verdadeiras, entre os trending topics, o que gera, muitas vezes, debates orgânicos, inclusive em outras plataformas. Considerando a hipótese da agenda setting, tentamos olhar para o Twitter como uma plataforma que dita, muitas vezes, os temas debatidos nas interações sociais, independentemente de sua veracidade. Nesse sentido, emerge um debate ético sobre a forma como procedimentos tecnológicos influenciam diretamente a formação da opinião pública.

Os dados abertos do Twitter e os trending topics

O Twitter é uma rede social com características muito específicas e que virou a preferida de muitos políticos. É bastante comum líderes usarem o Twitter para se comunicar virtualmente com sua audiência ou até mesmo anunciar em primeira mão políticas públicas pela plataforma. Com pouco mais de 16 milhões de usuários,14 o Twitter não é equivalente ao eleitorado brasileiro, mas, nos últimos anos, essa rede social passou a funcionar como um termômetro do debate político no Brasil e em muitos outros países.

A plataforma é recorrentemente um meio utilizado por autoridades para se comunicar diretamente com suas bases, o que a tornou uma ferramenta de tomada de decisões, além de, muitas vezes, pautar a imprensa e penetrar boa parte do debate político. No episódio número 96 podcast Foro de Teresina, produzido pela revista Piauí, um dos integrantes, o jornalista José Roberto de Toledo, faz uma análise do papel do Twitter em tempos em que as redes sociais com mais acesso são o Facebook, WhatsApp e Instagram. Diz Toledo que "O Twitter não é um espelho da sociedade, mas sim um espelho do debate político, e ali o que a gente está medindo é o engajamento, a força dos atores e o quanto eles conseguem mobilizar suas bases".15

Para entender essa métrica de engajamento e a importância do Twitter para os políticos e chefes de estado, uma agência de comunicação com sede em 6 países, a BCW,16 analisou o comportamento dos líderes em época de redes sociais, chamando esse estudo de "nova diplomacia", ou "Twiplomacy". O estudo analisou 1.089 contas17 de chefes de estado, governos e ministros de relações exteriores, mostrando diversos momentos e situações diplomáticas durante a pandemia.

No estudo, fica claro que os chefes de estado utilizam o Twitter para estabelecer relações com outros chefes de estado; com a sua população; para prestar contas para a população (accountability); e incentivar, durante a pandemia, a população a se cuidar. Por exemplo, o primeiro-ministro do Reino Unido, Boris Johnson, anunciou "o primeiro gabinete digital" pelo Twitter. E disse que a mensagem é "fique em casa, proteja o sistema de saúde nacional, salve vidas", conforme mostra a Figura 2.

Figura 2
– Tuíte de Boris Johnson, primeiro-ministro do Reino Unido,anunciando gabinete digital em março de 2020

É muito comum que figuras políticas postem uma frase, uma opinião no Twitter e, em seguida, tirem um print de seu tuíte e o utilizem em outras redes.18 Mas é muito incomum o contrário, encontrar algum print de uma postagem de outras redes (seja Facebook, Instagram ou qualquer outra) na linha do tempo de alguma figura pública no Twitter. Nesse sentido, é possível afirmar que, em algumas circunstâncias, o Twitter pauta outras redes sociais. Com esse engajamento e tipo de uso, é seguro dizer que o Twitter pode ser considerado um espelho do debate político e de seus atores, e não exatamente um espelho da sociedade. É no Twitter que está, de forma ativa, a maioria dos líderes políticos e é no Twitter que é possível mensurar, de forma mais detalhada, o volume de engajamento19 de determinados temas.

Essa mensuração só é possível, porque o Twitter tem uma característica determinante para que as análises políticas sejam realizadas. Possui uma API aberta para busca de conteúdo e extração de dados. O Facebook, o Instagram, o Google e o Youtube não fornecem dados precisos sobre o conteúdo de outras contas, sobre o conteúdo não proprietário. Ou seja, é impossível saber com precisão qual foi o alcance de um vídeo no Facebook, de uma foto no Instagram de um determinado perfil, mas é possível saber com precisão o engajamento de um tuíte de um líder político ou até mesmo de um tema.

Por exemplo, durante a construção deste artigo, um tema ganhou relevância nas redes sociais, a prisão do estrategista do presidente Donald Trump, Steve Bannon.20 Com um pouco de conhecimento técnico e algumas horas de programação, foi possível extrair diretamente da plataforma, de forma oficial, quais os conteúdos mais populares sobre o tema.21

Esse tipo de extração, ordenado por relevância, com métricas detalhadas e de forma oficial, não é permitido nem no Facebook, nem no Instagram e tampouco no YouTube. É possível também criar uma espécie de mapa de engajamento, conforme a Figura 3.

Figura 3
– Engajamento de tuítes na segunda semana de novembro sobre Steve Bannon e a sua prisão nos EUA

Dados do Twitter são relevantes porque podem indicar tanto o humor do momento quanto a mobilização de bases de apoio ou de oposição em relação a certo ator político ou assunto. Essa possibilidade de medir, em tempo real, a reação a uma fala, a um evento ou até a um programa de TV fez do Twitter o preferido para programas de televisão ou até mesmo para debates políticos.

Além da extração de dados, o Twitter criou um termo que se tornou popular a ponto de virar uma obsessão para grandes marcas, políticos e influenciadores: os trending topics. Uma palavra, uma frase ou um tópico que seja mencionado mais do que a média dos outros temas é considerado uma tendência. Essas tendências são listadas pelo próprio Twitter, indicando o que está sendo comentado no mundo ou em alguma região em específico.

É através dos trending topics, por exemplo, que é possível entender a reação de um público a um determinado discurso de um candidato durante um debate eleitoral. Ou através dos trending topics é possível investigar qual parte de uma entrevista divulgada em um canal está impactando mais o público. E é justamente nos trending topics que políticos baseiam algumas de suas ações nas redes.

O problema é que da mesma maneira que pelo Twitter é possível ter uma extração de dados de forma oficial, também é no Twitter que é possível criar mais facilmente robôs que interagem com outros perfis ou com determinado tema. Através de uma série de códigos, é possível, por exemplo, programar uma conta do Twitter para responder todos os tuítes que elogiem um determinado candidato, como também é possível criar uma rotina de programação que poste a cada 3 minutos um conteúdo aleatório com uma hashtag ou com uma palavra-chave.

Isso faz com que os robôs no Twitter ajudem a criar falsas tendências, inflando, muitas vezes de forma enganosa, uma propensão ao debate de um tema que, sem os robôs, não existiria. Esse comportamento não seria tão prejudicial se esses robôs criassem engajamento apenas entre si, mas, a partir do momento que um conteúdo criado por um robô se torna tendência, usuários reais, políticos e influenciadores digitais, em geral, passam a se engajar nesse mesmo tema. Um tema possivelmente inflado por uma conta falsa, através de um conjunto de códigos, pode despertar a curiosidade de um influenciador ou de um político e tornar-se um conteúdo orgânico em outra rede, como o Facebook ou o Instagram. O fato de um tema estar entre os trending topics indica maior possibilidade de engajamento nas postagens realizadas em contas sobre o mesmo tema. Ou seja, em busca da audiência, visando ao capital simbólico (Bourdieu, 1997), que repercute em capital econômico ou político, os trending topics, falsos ou verdadeiros, são alimentados por influenciadores e pessoas públicas, que não querem perder a oportunidade de manutenção ou crescimento se sua audiência.

Nesse sentido, essa situação nova permite o levantamento de uma hipótese polêmica, a de que o Twitter funcione como operador de agendas. Análogo à hipótese da agenda setting,22 o Twitter pode ser visto como uma autoridade de rede, que pode se realizar a partir da confluência entre a intencionalidade do programador e o uso dinâmico de rotinas de programação. Para compreender o ineditismo dessa situação, é preciso entender que há uma parcela de imprevisibilidade no algoritmo, que decorre do comportamento dos usuários, mas também da influência exercida pela API nesse comportamento.

Trending topics do Twitter e a influência em outras redes

Em um dos debates nas eleições presidenciais de 2018, o Twitter foi usado de forma institucional como métrica de mensuração de engajamento e como pauta de perguntas para os presidenciáveis. No debate da Gazeta, ocorrido em 8 de setembro de 2018,23 a hashtag #GazetaEstadaoJP, com o famoso ícone do Twitter, ficou na tela com a quantidade de vezes em que foi usada.

Além disso, durante os intervalos, um quadro com os "candidatos mais mencionados no Twitter" era exibido, com tuítes relevantes, escolhidos por uma curadoria do debate, mostrando algumas mensagens dos usuários.24 Elas chegaram a ser lidas pela equipe do debate e, após a exibição, a própria equipe informou que o número total de mensagens chegou a 171.374.

Vimos que o Twitter tem essa particularidade de fornecer dados públicos de métricas e engajamento com suas publicações. Mas como isso influencia outras redes? O Twitter acaba se tornando não um retrato fiel da sociedade, mas, sim, um retrato do debate político, no qual atores conseguem visualizar métricas através de dados que a própria plataforma disponibiliza. É possível medir o engajamento, a força dos agentes e o quanto cada político consegue mobilizar suas bases. É muito comum um debate se iniciar no Twitter e ganhar força a ponto de ficar visível na própria plataforma. À medida que cresce o engajamento dos usuários no tema, eles passam a exportar o debate para outras redes. De forma contrária, isso quase nunca acontece; é muito raro ver um debate se iniciar no Facebook, por exemplo, e migrar para o Twitter.

A forma como o feed se organiza e a agilidade da escrita são possíveis explicações para esse protagonismo. Outro fator está diretamente ligado às características trazidas pela Web 2.0: convergência digital e mobilidade, que permitem aos interagentes ações multifocais. A linguagem do Twitter aposta na impessoalidade, na velocidade e na interconexão de temas e debates. Uma pessoa diante da TV emitirá sua opinião no Twitter de forma imediata, como no exemplo do debate eleitoral da Gazeta/Estadão/Jovem Pan citado acima. Outro motivo significativo é a opacidade das outras redes. Não é possível saber o que está nos trending topics do Facebook, por exemplo. Por fim, o elemento mais importante: o algoritmo.

O fato de o Twitter ser uma rede transparente permite que pesquisadores estudem o comportamento das informações e encontrem pistas relevantes sobre a forma como o debate público ocorre na internet. Essa realidade é um fator a mais que motiva os profissionais do marketing político a usarem a rede social como espaço laboratorial para traçar estratégias de qualificação da imagem de candidatos e como caminho de interferência na conjuntura política, por meio da produção de debates na esfera pública. Essa interferência, muitas vezes, ocorre com o uso de robôs.

Em outubro de 2021, o Twitter publicou, através de seis pesquisadores, um artigo em uma revista acadêmica da Universidade de Cornell, Nova York. Nesse artigo, foram examinadas algumas características da rede: o algoritmo, a linha do tempo e como se comportam as postagens nessa linha do tempo. O objetivo era saber se existe uma amplificação ou priorização do conteúdo político de viés A ou B no algoritmo. A resposta que queriam encontrar é se políticos específicos teriam prioridade no algoritmo só por emitirem certas opiniões e pertencerem a determinados partidos políticos. A intencionalidade dessa pesquisa revela a preocupação da empresa com o potencial de interferência na formação da opinião pública e, ao mesmo tempo, denota uma atitude responsável.

Com "centenas de milhões de tuítes"25 analisados em sete países, em um total de 2 milhões de contas, os pesquisadores fizeram uma pergunta crucial que permeou a pesquisa: “alguns tipos de grupos políticos são amplificados por algoritmos em detrimento a outros?”.

O resumo, publicado pelo blog da própria empresa, é que em seis dos sete países (todos, menos a Alemanha), os "tuítes postados por contas de políticos alinhados a ideias de direita receberam mais amplificação algorítmica do que os tuítes de políticos alinhados à esquerda, quando estudados como um grupo" (Huszár et al., 2021, p. 4). Esse resultado mostra que, por algum motivo, o algoritmo aprende, através de técnicas de machine learning, que é importante dar mais visibilidade a tuítes ligados à direita.

O estudo mostra que tuítes políticos têm maior amplificação simplesmente por serem tuítes políticos.26 E que políticos identificados como de direita têm uma relevância para o algoritmo ainda maior, simplesmente por serem de direita, seja qual for o conteúdo postado. "Este efeito é mais forte no Canadá (liberais 43% versus 167% conservadores) e no Reino Unido (trabalhadores 112% versus conservadores 176%)" (ibid., p. 5).

Outro dado interessante é que, apesar de grupos se comportarem com ampliação por algoritmo conforme demonstrado, ao se analisar individualmente as contas de políticos, alguns ligados à esquerda também têm seus tuítes amplificados, o que demonstra que não são necessariamente suas ideias, mas, talvez, como as expressam através de tuítes. Segundo o estudo,

Vemos que comparar os partidos políticos com base na amplificação agregada de todo o partido, ou com base na amplificação individual de seus membros, leva a conclusões aparentemente diferentes: enquanto a amplificação individual não está associada à filiação partidária, a amplificação do grupo agregado pode ser diferente para cada partido. Esses resultados não são contraditórios, considerando que diferentes políticos podem chegar a sobrepor audiências entre si. Mesmo que a amplificação de políticos individuais não esteja correlacionada com sua filiação política, quando consideramos aumentos em seu alcance combinado, podem surgir correlações em nível de grupo (Ibid., p. 5)

Em seu blog oficial, o Twitter declarou que essa amplificação do conteúdo é problemática, já que o algoritmo é construído de forma automática, através de sistemas de aprendizado de máquina, e que é necessária uma análise de causa mais profunda para determinar quais mudanças são necessárias para reduzir os impactos adversos do algoritmo na linha do tempo dos usuários.

O Twitter, portanto, reconhece a necessidade de agir de forma responsável e imparcial, compreendendo que o resultado da machine learning pode contribuir para distorções na formação da opinião pública. No entanto, a realização dessas correções enfrenta a dificuldade da complexidade do algoritmo, produzido por várias pessoas, que resulta na dificuldade de seu conhecimento absoluto.

Facebook Papers e o debate político

O algoritmo virou uma realidade das redes. Tanto nas redes da empresa Meta, Facebook e Instagram, como no microblog Twitter e também no Google, o algoritmo funciona como um modo de otimizar performance e reter o usuário com mais tempo de tela. É plausível supor que, assim como no Twitter, o Facebook também tenha um algoritmo que privilegie conteúdos de direita. Essa hipótese é ainda mais sólida a partir da análise de um documento vazado por uma ex-funcionária do Facebook, Frances Haugen (G1 (2021), que disponibilizou, à imprensa, o que hoje é chamado de #FacebookPapers, um consórcio internacional de veículos que possuem acesso aos documentos revelados pela denunciante.

Os documentos falam sobre algo que é chamado de "conteúdo cívico", um tipo de informação que o Facebook aparentemente não define bem em lugar nenhum, mas envolve publicações em torno de política. No Brasil, três veículos tiveram acesso aos documentos vazados. Folha de S.Paulo (Mello e Alonso, 2021), Estadão (2021) e Núcleo (2021). Dentre o material produzido pelos veículos, é possível ter acesso a algumas partes em que se diz que, no Brasil, apenas 3% dos usuários concentraram boa parte do "conteúdo cívico" em sua plataforma no ano de 2018. Basicamente, essa "voz cívica" (termo usado pela empresa) está concentrada sob um pequeno grupo de atores. Mas, na ocasião, ninguém sabia ao certo o motivo pelo qual aquilo estaria ocorrendo. Assim como no Twitter, o aprendizado de máquina do algoritmo do Facebook produziu um resultado que os engenheiros não puderam prever.

Segundo a própria empresa, em comunicado enviado aos veículos que estão fazendo a cobertura (Spagnuolo, Martins e Menezes, 2021), esse resultado do algoritmo é preocupante por quatro motivos: usuários sentem-se silenciados, não confortáveis em participar; usuários podem estar perdendo conexões significativas ou ideias cívicas devido a um ranking sistemático; pode haver um número pequeno de usuários controlando o alcance massivo de informações, criando um risco elevado de desinformação viral;27 e existe a possibilidade da presença de redes subterrâneas de distribuição e com mau comportamento atuando no debate público.

São muitas perguntas em aberto: “Como quantificar o impacto desse processo para as eleições nos EUA, no Brasil, no Brexit28 ou em outros países?”; “Essa é uma tendência das redes ou da sociedade em geral?”; “Como fazer para equalizar o algoritmo?”.

O Twitter alterou sua linha do tempo em 2016, passando a se assemelhar a outras redes. Vimos que o EdgeRank, o primeiro sistema de algoritmo de linha do tempo em redes sociais, tornou-se referência e balizou o desenvolvimento das plataformas. Essas mudanças são fundamentais para se compreender como essas mudanças influenciaram o debate político como um todo.

Em entrevista com o cientista de dados da empresa Lagom Data,29 Marcelo Soares, foi perguntado sobre a lógica das redes no debate político. Soares respondeu que os algoritmos acabam contaminando o que deve e o que não deve ser notícia ou estar em destaque nos portais de notícia, baseado em número de cliques e potencial de viralização. É nesse sentido que o pensamento de Bourdieu (1997) contribui com uma nova perspectiva. Os profissionais de mídia passaram a entender o tipo de informação que gera mais engajamento e o horário mais eficiente de postagem. Com isso, em função da monetização, os profissionais passaram a priorizar conteúdos em detrimento de outros, gerando distorções preocupantes. Com Bourdieu, seria possível ampliar o leque de perguntas: “O resultado das eleições nos EUA, no Brasil e no Brexit não contou com uma cultura conservadora e individualista, distante da coisa pública e aderente a discursos superficiais?”.

Após 2016, quando houve eleições gerais no Facebook e surgiu o debate sobre uso de dados e sobre a empresa Cambridge Analytica,30 o Facebook tomou algumas medidas para impulsionamento de conteúdo e tráfego pago. A partir das próximas eleições, não seria mais possível impulsionar conteúdo pago para mensagens negativas sobre outros candidatos ou partidos, e todos os gastos com anúncios seriam transparentes,31 em uma ferramenta que a plataforma chamou de "biblioteca de anúncios".32

Seja em 2016 pelo próprio Facebook, seja recentemente pelo Twitter, é notório que o problema de privacidade de dados e priorização do algoritmo são temas constantes nas plataformas. Manyika, Silberg e Presten (2019), em artigo publicado na Harvard Business Review, repositório de artigos da Universidade de Harvard, investigam o viés humano nos algoritmos e nos sistemas de inteligência artificial. O artigo não deixa claro se há uma pesquisa específica em alguma das plataformas de maneira específica, mas mostra que há uma reprodução de preconceitos e priorização de certos temas, mesma conclusão a que chegaria o Twitter dois anos depois com um estudo interno.

Para solucionar esses preconceitos e o viés humano nos sistemas de inteligência artificial, propõem os autores que é necessário ter interferência humana nos sistemas de inteligência artificial, algo que chamam de "human in the loop",33 ou em uma tradução livre, "humano no processo". Para os pesquisadores, é necessário que sejam processados os dados de antemão, que se alterem algumas decisões do sistema e que sejam incorporadas definições de justiça no próprio processo de treinamento (ibid.).

Considerações finais

Este artigo procurou apresentar alguns dados técnicos para compreender a realidade de funcionamento das redes tecnossociais, compreendendo seu comportamento a partir do funcionamento dos algoritmos. Além de caracterizar a forma como o debate público pode ser distorcido em função do machine learning, presente nas APIs, alertamos para o fato de que o universo tecnológico não é suficiente para compreender o comportamento das informações. O Twitter, por ser uma plataforma aberta, que permite a extração de dados, possibilita que pesquisadores tenham informações sobre o comportamento dos interagentes e possam cruzar essas informações com o comportamento das informações.

O processo de criação de dados nas redes e a priorização pelos algoritmos, que resulta em popularização ou viralização de conteúdo, acabam por influenciar a esfera pública, colonizam os debates presentes em espaços de sociabilidade e dão contornos ideológicos para as visões de mundo dos cidadãos. Ao que tudo indica, essas rotinas de programação fortalecem certo tipo de discurso e geram distorções na opinião pública.

A identificação do Twitter como a rede preferida de pessoas públicas, influenciadores, jornalistas e políticos profissionais, somada à possibilidade de se programar robôs para atuarem no comportamento das informações, leva-nos à questão central deste artigo. Se o Twitter usualmente prescreve os temas que serão exportados e debatidos em outras redes através de seus trending topics, saber que eles podem ser produzidos artificialmente nos obriga a questionar sobre a rede como operador ideológico.

Se, de fato, o Twitter é sujeito determinante na formação da agenda de outras redes, há que se relativizar o papel do algoritmo, que deixa de ser um protagonista que nos deixa na vala comum da casualidade e passa a ser um elemento maquínico de reforço de intencionalidades humanas. Trata-se de um sistema de inteligência artificial estruturado por uma inteligência humana e que estrutura comportamentos e discursos em um ciclo vicioso através do resultado dessa inteligência, mas que pode ser iniciado por uma meta política explícita, como a vitória em um processo eleitoral.

Mesmo que haja uma preocupação do Twitter com as possíveis distorções no debate público causado por seu algoritmo, seu modo de produção e a forma como envolve o machine learning apontam para a complexidade da situação. Rouvroy e Berns (2015) alertam que

[...] nossos comportamentos jamais foram tão conduzidos – observados, registrados, classificados, avaliados – como agora com esta base estatística, e isto com base em função de códigos de inteligibilidade e critérios absolutamente opacos à compreensão humana. A inofensividade, a “passividade” do governo algorítmico é apenas aparente: o governo algorítmico “cria” uma realidade ao menos tanto quanto ele a registra. Ele suscita “necessidades” ou desejos de consumo, mas, desta maneira, despolitiza os critérios de acessos a certos lugares, bens ou serviços; ele desvaloriza a política (uma vez que não haveria mais nada a decidir, a resolver em situações de incertezas, posto que estas são antecipadamente desarmadas); o governo algorítmico dispensa as instituições, o debate público; ele substitui a prevenção (em proveito apenas da preempção). (Ibid., p. 48)

Segundo os autores, a situação a que nomeiam “governo algoritmo” reforça o processo de despolitização, retirando a possibilidade de tomada de decisões. Ora, se é possível concordar com os autores a respeito do universo subjetivo maquínico que se fabrica com a interferência de redes em nosso cotidiano, constantes no interior do universo de interações simbólicas; também é verdade que é possível relativizar o diagnóstico prescrito em relação à desvalorização da política. A situação em relação ao Twitter trazida por este artigo é uma circunstância em que se identifica a presença de intencionalidade, no momento em que se programam robôs para fabricar trending topics e consequentes viralizações na esfera digital discursiva. Paradoxalmente, esse argumento de valorização do papel da política aponta para um realismo que temos de combater politicamente. Uma distorção no desenvolvimento do debate político e da opinião pública, certamente, traz uma questão ética fundamental.

Por fim, mas não menos importante, é preciso reconhecer que o sucesso da expansão do debate conservador nas redes ultrapassa a atuação dos algoritmos. Ainda que haja essa intencionalidade por parte de alguns setores políticos, os robôs de forma isolada não seriam suficientes para explicar a facilidade com que determinadas informações viralizam. Grupos progressistas também se valem de robôs, mas o comportamento das informações não é tão eficiente, conforme demonstra a pesquisa de Huszár et al. (2021). A variável que faz a diferença no comportamento dos tipos discursivos é, possivelmente, a intensidade do engajamento, diferente nos dois grupos. É muito provável que o público mais conservador tenha um ativismo mais eficiente do que o público progressista, o que ativa o algoritmo de maneira mais contundente.

Nesse sentido, concluímos com um outro paradoxo. O elemento em que identificamos a presença política, que revela o engajamento de discursos conservadores e, muitas vezes reacionários, que explica a afinidade de determinadas ideias com os algoritmos das redes, é caracterizado pela despolitização. Esses comportamentos estão distantes do civismo, do comportamento coletivista e de esforços que buscam a formação de consensos. Esses comportamentos, em geral, alinham-se a comportamentos individualistas, que reduzem as decisões públicas a matemáticas simplistas, alimentando discursos de superfície e de banalização da política.

Figura 1
– Programa de experimento de inteligência artificial do Google pedindo para que o usuário desenhe uma lanterna

Figura 4
– Debate Gazeta/Estadão/Jovem Pan, com transmissão em rede nacional e métricas em tempo real de quantidade de tuítes com a hashtag #GazetaEstadaoJP

Figura 5
– Debate Gazeta/Estadão/Jovem Pan, com a métrica de candidatos mais mencionados no Twitter #GazetaEstadaoJP

Quadro 1
– Dados extraídos através de API oficial do Twitter, com métricas de números de retuítes e número de likes por tuíte, analisando os principais tuítes sobre o assunto “Steve Bannon”

Referências

Notas

  • 1
  • 2
    Apesar de não existir mais nenhuma documentação oficial do Facebook citando o uso do EdgeRank, ainda assim toda a documentação oficial sobre "o que você vê no feed de notícias" ainda cita os três pontos do EdgeRank: a afinidade, o peso e a data em que a publicação foi criada, conforme link oficial do Facebook: https://www.facebook.com/help/520348825116417.
  • 3
    Conjunto de códigos, estabelecendo um raciocínio matemático, para parametrizar dados e exibir um resultado de acordo com diferentes lógicas e condições.
  • 4
    Lars Backstrom, gerente de engenharia do feed de notícias do Facebook, declarou para a revista MarTech que o antigo EdgeRank não existia mais e que os pontos principais criados por Serkan Piantino ainda existiam, mas de forma atualizada e aprimorada (McGee, 2023).
  • 5
    Lars Backstrom é o vice-presidente de engenharia do feed de notícias do Facebook. Cf.: https://www.linkedin.com/in/lars-backstrom-862a764.
  • 6
    A experiência de outras redes sociais, como o extinto Orkut ou o MySpace, que eram líderes de mercado, “gigantes da tecnologia” e que desapareceram, faz com que fique latente que uma das tantas preocupações do Facebook seja não apenas se tornar uma rede que tenha um número alto de usuários, mas também uma rede cujos usuários não enjoem de sua experiência.
  • 7
    A empresa Meta, dona do Facebook, apresenta trimestralmente dados de usuários ativos, lucro e receita total para os seus acionistas. No último mês de outubro de 2022, a empresa divulgou que conta com 2,91 bilhões de usuários ativos mensais. Um usuário ativo mensal é quem usou a plataforma pelo menos uma vez no mês.
  • 8
    NDA, Acordo de Não-Divulgação ou Acordo de Confidencialidade, é um tipo de contrato que prevê multas e regras para que funcionários não divulguem dados da empresa, dos produtos ou serviços.
  • 9
    No dia 25 de outubro de 2021, o Facebook divulgou seu balanço trimestral, com um aumento de 6% no número de usuários, chegando a 1,93 bilhão de usuários ativos diários.
  • 10
    O Quick Draw (disponível no endereço https://quickdraw.withgoogle.com/), é uma aplicação em que o usuário desenha um objeto e o Google tenta adivinhar qual é, e o usuário finaliza respondendo se o Google acertou ou não.
  • 11
  • 12
    Técnica que, através de algoritmos, identifica padrões em comportamentos e estabelece condições para categorizar e parametrizar dados de forma automática.
  • 13
    Apesar de ser um exemplo simplista, de desenho de uma lanterna, é com esse processo de desenhos de milhares e milhares de lanternas pelo mundo que o Google – ou qualquer outra empresa de tecnologia que faça esse tipo de estudo – consegue identificar elementos em fotos ou vídeos, conseguindo identificar o contexto de um vídeo sem precisar de um ser humano no processo.
  • 14
    Segundo dados da GWI – GlobalWebIndex, empresa de segmentação de público, especializada em fornecer dados sobre redes sociais. O estudo, divulgado pelo site hootsuite, mostra dados de julho de 2021. Disponível em: https://www.slideshare.net/DataReportal/digital-2021-july-global-statshot-report-v02. Acesso em: 25 nov 2021.
  • 15
    A fala de José Roberto de Toledo, integrante do podcast e um dos colaboradores da Archimedes Social (https://arquimedes.social/sobre/), empresa de monitoramento e análise de dados, reflete uma opinião de que, apesar de não ser líder de mercado, o Twitter é líder em coleta e análise de dados públicos, com métricas de engajamento e força dos atores políticos.
  • 16
    BCW Global. Disponível em: https://bcw-global.com/contact/latin-america/brazil. Acesso em: 25 nov 2021.
  • 17
    Um total de 1.089 contas analisadas no Twitter de chefes de estado e de governo e ministros das Relações Exteriores, 632 das quais foram verificadas pelo Twitter e trazem uma marca de verificação azul. Os dados foram coletados em 1° de maio e 1° de junho de 2020, usando Twitonomy.com, Audiense.com e Klear.com para capturar o verdadeiro alcance das contas (Twiplomacy, 2021).
  • 18
    Como exemplo, verificar: https://www.instagram.com/p/CVspTDnFVB-/.
  • 19
    O conceito de engajamento permeia praticamente todas as redes sociais. Dá-se o nome de engajamento a soma de curtidas, comentários e reações a um determinado conteúdo. No Twitter, o engajamento é medido pela soma de curtidas, retuítes e comentários.
  • 20
    Steve Bannon, diretor executivo da campanha presidencial de Trump em 2016, é um dos investigados em um processo iniciado após a invasão do Congresso americano, após as eleições de 2020. Nessa investigação, Bannon é suspeito de liderar, de forma anônima, um grupo chamado QAnon, formado por extremistas que defendem Donald Trump. A prisão de Bannon ocorreu por desacato, quando o ex-estrategista não prestou depoimentos a uma comissão parlamentar e negou enviar documentos para a investigação.
  • 21
    Para essa extração, foi usado um método oficial da API do Twitter chamado "Standard Search API" (https://api.twitter.com/1.1/search/tweets.json), usando a query "Steve Bannon", limitado a tuítes na língua portuguesa e ordenado por tuítes mais populares.
  • 22
    McCombs e Shaw (2020), pesquisadores dos anos 1970, criaram uma teoria na qual há uma construção de agenda social através da mídia. Segundo os autores, a mídia tem a capacidade de inflar a projeção dos acontecimentos na opinião pública, criando um ambiente político. Com o acompanhamento inicial das eleições gerais nos EUA, em 1968, o estudo baseou-se no acompanhamento da campanha, pesquisas com eleitores e classificação de conteúdo e matéria de 5 jornais americanos.
  • 23
    Debate dos candidatos à presidência 2018 | 01/03. Disponível em: https://www.youtube.com/watch?v=I_8jJJzFx58. Acesso em: 29 nov 2021.
  • 24
    Esse recurso é usado, também, em outros programas de TV, como o programa de entrevistas Roda Viva, da TV Cultura, em que os apresentadores sempre tiveram o costume de falar que "somos o assunto mais comentado no Twitter no momento", ou até mesmo o programa de entretenimento Big Brother Brasil, da TV Globo, quando mensagens de telespectadores aparecem durante a transmissão.
  • 25
    "Para estudar a amplificação algorítmica de veículos de notícias, analisamos centenas de milhões de tuítes contendo links para artigos compartilhados por pessoas no Twitter durante o mesmo período" (Balli, 2021).
  • 26
    Algo interessante de notar é que apesar de o Facebook ter uma capilaridade maior em praticamente todos os países – chegando a mais de 50% da população no Brasil –, geralmente é no Twitter que as contas oficiais dos governos e dos chefes de estado estabelecem alguns tipos de diálogos. Apesar de ser muito comum políticos usarem o Instagram e o Facebook, é no Twitter que surgem diálogos entre os políticos, como quando Boris Johnson, primeiro-ministro do Reino Unido, enviou um tuíte dizendo: "faça qualquer tipo de pergunta" em meio à pandemia, no mês de maio de 2020 (https://twitter.com/BorisJohnson/status/1259777299186147329).
  • 27
    Conteúdo em uma rede social que se destaca diante da média de engajamento de todos os outros conteúdos.
  • 28
    O Brexit foi um processo político que fez o Reino Unido decidir, através de plebiscito, se haveria a saída da União Européia. A fusão das palavras British e Exit formaram o nome Brexit. Após meses de campanha e disputa política, foi decidido, em 2016, que o Reino Unido não faria mais parte da União Europeia, por pouco mais de 1% dos votos. Esse processo também ficou conhecido pelo uso de dados on-line para a construção dos argumentos e impulsionamento de conteúdo pago nas redes sociais.
  • 29
    Lagom Data. Disponível em: https://lagomdata.com.br/. Acesso em: 25 nov 2021.
  • 30
    A Cambridge Analytica foi uma das principais empresas de inteligência de dados que contribuiu para a vitória de Donald Trump nas eleições de 2016. Com o debate do uso de dados e privacidade, as empresas de tecnologia adotaram medidas para dar transparência ao uso de tráfego pago e de como os dados são usados.
  • 31
    A biblioteca de anúncios é aberta para todos os usuários e pode ser acessada pelo endereço https://www.facebook.com/ads/library. Lá é possível ver, por exemplo, que a campanha de Bruno Covas para a prefeitura de São Paulo gastou R$388.000,00, assim como todos os detalhes de texto e imagens usados na campanha.
  • 32
    Outra funcionalidade implementada é que todos os gestores de tráfego, ou seja, funcionários que trabalham impulsionando esse conteúdo, precisam ter suas identidades validadas pela plataforma, enviando fotos de documentos e aguardando uma confirmação.
  • 33
    Apesar de todo processo de construção de códigos que funcionam como machine learning, é interessante o conceito de que é necessário um ser humano em um processo de aprendizado de máquina, não para aperfeiçoar o processo de inteligência artificial, mas sim para corrigir aquilo que a máquina faz e que viola padrões éticos da sociedade.

Datas de Publicação

  • Publicação nesta coleção
    04 Set 2023
  • Data do Fascículo
    Sep-Dec 2023

Histórico

  • Recebido
    30 Nov 2021
  • Aceito
    06 Jun 2022
location_on
Pontifícia Universidade Católica de São Paulo Rua Ministro de Godói, 969 - 4° andar - sala 4E20 - Perdizes, 05015-001 - São Paulo - SP - Brasil , Telefone: (55-11) 94148.9100 - São Paulo - SP - Brazil
E-mail: cadernosmetropole@outlook.com
rss_feed Acompanhe os números deste periódico no seu leitor de RSS
Acessibilidade / Reportar erro