As lições da Wikipédia e suas limitações
Humanos e tecnologia

As lições da Wikipédia e suas limitações

Ao completar 20 anos, a mais popular enciclopédia do mundo se tornou uma big tech e enfrenta as limitações da internet e da utopia colaborativa.

A Wikipédia é notória por seus erros. Não raro, se torna motivo de piada. A própria Wikipédia afirma não ser uma fonte confiável. Mesmo assim, mais de 55 milhões de artigos em mais de 300 línguas foram publicados na plataforma que dia 15 de janeiro completa 20 anos. Como a internet, que cresceu em relevância e problemas nas últimas décadas, a Wikipédia também.

O sonho utópico de uma enciclopédia digital feita por todos e para todos cada vez mais convive com fake news, bolhas de informação (filter bubble), grande disparidade na qualidade do conteúdo, sem falar no fato da grande maioria dos seus editores serem homens brancos, americanos e europeus. Também é notório como um pequeno grupo de editores têm uma influência desproporcional.

No Brasil não é diferente. E para escrever sobre a data e “vivenciar” a efeméride, decidi me aventurar pela Wikipédia para entender a dinâmica no Brasil.

Há alguns dias soube que o site Notícias da TV estava encontrando dificuldades para criar uma página na Wikipédia (full disclosure, escrevo uma coluna sobre mídia no Notícias da TV). O argumento do editor da Wikipédia para bloquear a publicação era de que o texto sugerido era muito “comercial”. Então, decidi eu mesmo publicar uma versão do texto sem citações comerciais.

Ao “estrear” na plataforma, comecei a fazer sugestões de edição de textos. Depois de algumas correções de grafia e pontuação, parti para meu primeiro artigo. Primeiramente, li artigos sobre diversos grupos de mídia na Wikipédia e tentei seguir o mesmo estilo. Além do texto em si, adicionei dois links de duas reportagens sobre o Notícias da TV e referências externas. Poucas horas depois, recebi a informação de que o conteúdo que publiquei era irrelevante.

Interessante, visto que o Notícias da TV tem mais de 30 milhões de usuários únicos, e segundo o SimilarWeb, é o 16 maior site na categoria Mídia e Notícias (o Estadão é o 13, para efeito de comparação). O Notícias também é o maior site do país dedicado à cobertura de TV. O site também possui um relevante número de seguidores em suas redes sociais, 520 mil no Facebook e 470 mil no Twitter.

O Notícias da TV não está só. Outros grupos de mídia jovens ou segmentados estão fora da plataforma, que aparentemente privilegia tópicos mais familiares aos editores. Meio & Mensagem e o PropMark, por exemplo, duas conhecidas publicações sobre mídia e publicidade, também não tem páginas na Wikipédia, apesar de serem usadas repetidamente como referência para artigos dentro da enciclopédia.

Nos fóruns da Wikipédia é possível encontrar as justificativas dos editores para barrar artigos. Lá, lê-se que para os editores da Wikipédia, a Casa Bauducco também é irrelevante. O Conselho Federal de Contabilidade? Sem chance, é uma empresa, afirmam os editores da Wikipédia, apesar do órgão ser uma autarquia.

Por sinal, o tom dos editores está longe de ser “simpático”, para dizer o mínimo. “Página já eliminada incríveis oito vezes”, afirma um editor ao responder o apelo para reavaliação da página do Conselho Federal de Contabilidade. O editor diz que a página possui trechos copiados do próprio site do Conselho. Mas, “se quer arriscar a sorte, recrie o artigo com um texto original”.

Fica claro pelos fóruns que um pequeno grupo de editores trabalha bastante na versão brasileira da Wikipédia e mantém um rígido controle. Os links das muitas regras da Wikipédia não raro se tornam o argumento para encerrar o debate (usualmente os textos são extremamente longos e abertos a interpretação). Às vezes, soa até como um esforço de expor a ignorância de quem chega frente a superioridade de quem já está lá há mais tempo. Um editor quando questionado pelo fato de ter barrado um artigo traduzido da Wikipédia americana, afirma que isso “é irrelevante”, e usa como argumento o fato do artigo ter sido escrito pela mesma pessoa em inglês. Como na vida real, os “chefes” da Wikipédia brasileira não gostam de ser expostos, muito menos contrariados.

Gigante de tecnologia

Mas se o processo de entrar na Wikipédia é trabalhoso (e irrelevante para uma marca, que pode contar sua história no próprio site), por que tantas empresas buscam estar na enciclopédia? Afinal, no momento em que uma página sobre você ou o seu negócio é publicada na Wikipédia, essa página deixa de ser sua. Você pode ter criado o texto, mas qualquer pessoa pode editar. O resultado não será uma celebração, será uma análise clínica de suas falhas e triunfos. E mais, estará sujeita a uma multidão de erros e problemas fora do seu controle.

Mas para as marcas, estar na Wikipédia significa melhorar o ranqueamento no Google. A Wikipédia é uma página com muitos links e acessos, desse modo, quando ela adiciona um link para um site, esse site aparece melhor na busca do Google.

Para os publishers a questão é mais acentuada. No YouTube, muitos vídeos aparecem com avisos da Wikipédia. E desde 2018, o Facebook usa a Wikipédia para apresentar avisos das fontes no News Articles, plataforma de notícias do Facebook. A Amazon usa a plataforma para gerar respostas para a Alexa; a Apple, para alimentar a Siri. Muitos desenvolvedores de AI (Inteligência Artificial) também usam os textos da Wikipédia.

Ou seja, os empenhados colaboradores da Wikipédia, indiretamente trabalham para as Big Techs. Muitos talvez se surpreendam, mas a Wikipédia é uma gigante de mídia e tecnologia, a exemplo de Google e Facebook. Se fosse uma empresa privada, estimativas colocam o valor de mercado da Wikipédia em até US$ 42 bilhões.

Apesar das sucessivas campanhas com pedidos de doações, a Wikipédia possui milhares de dólares em caixa. Segundo o balanço da Wikimedia Foundation, até junho de 2020, a fundação sem fins lucrativos que administra a Wikipédia possuía mais de US$180,3 milhões em ativos líquidos. Um crescimento de US$ 15 milhões em relação ao ano anterior. O custo dos servidores não chega a US$ 2,5 milhões de dólares por ano. As maiores linhas de custo são salários e premiações, respectivamente, US$ 55,6 milhões e US$ 22,8 milhões. A fundação sediada em São Francisco, nos Estados Unidos, possui cerca de 300 funcionários.

Contradições

Ser uma big tech que vive de doações é uma das aparentes contradições. Outra, é que se o trabalho é colaborativo, não seria o caso dos editores liberarem todas as publicações para correções de terceiros ou fazerem as correções que julgarem necessárias? Era assim, mas após casos em que os editores da enciclopédia foram ludibriados e se tornaram alvos de brincadeiras, o mais seguro se tornou barrar o que não é familiar nos textos.

Infelizmente, a dinâmica em que as sugestões são sumariamente deletadas afasta novos colaboradores e deixam a Wikipédia cada vez mais distante do ideal colaborativo. Segundo a lei de Cunningham, “a melhor maneira de se conseguir uma resposta correta na internet… é postar a resposta errada”.

Mas não culpe os colaboradores não remunerados da Wikipédia por serem demasiadamente humanos. A realidade é que com o surgimento de projetos colaborativos bem sucedidos nos anos 90, cresceu uma utopia em torno do tema, elevando a atividade a expectativas inatingíveis. E muitos colaboradores seguem genuinamente encantados pelo discurso da utopia digital de duas décadas atrás, mesmo diante de um mundo completamente diferente.

“A percepção generalizada do código aberto é que é um trabalho da comunidade. Olhando para trás, para o primeiro apogeu do código aberto nos anos 90, você imagina esses esforços colaborativos vagamente organizados, conflitantes, entre um grupo intimamente ligado de nerds. Alguma tecnologia especial, notavelmente o Linux, emergiu daquela época como evidência de que equipes automotivadas de voluntários podiam construir produtos de classe mundial”, lembra Alex Danco. A partir desse mantra, a solução para qualquer problema de código aberto era trazer mais colaboradores.

Um livro essencial sobre o tema é “Working in Public: The Making and Maintenance of Open Source Software”, de Nadia Eghbal. A autora cobre os últimos 20 anos de projetos de código aberto (não por acaso, tempo próximo da existência da Wikipédia).

Eghbal escreve: “A hipótese padrão hoje é que, diante da crescente demanda, um“ mantenedor” de código aberto – termo usado para se referir ao desenvolvedor principal, ou desenvolvedores, de um projeto de software – precisa encontrar mais colaboradores.”. É comum pensar que o software de código aberto é desenvolvido por “No entanto, ao falar com os mantenedores em particular, aprendi que [as iniciativas para trazer mais contribuidores] os deixava apreensivos, porque essas iniciativas geralmente atraem contribuições de baixa qualidade. Isso cria mais trabalho para os mantenedores – todas as contribuições, afinal, devem ser revisadas antes de serem aceitas. Os mantenedores frequentemente carecem de infraestrutura para trazer esses contribuintes para uma “economia do colaborador”; em muitos casos, não há comunidade por trás do projeto, apenas esforços individuais.”
comunidades, o que significa que qualquer um pode contribuir, distribuindo assim o fardo do trabalho. Superficialmente, essa parece ser a solução certa, especialmente porque parece tão alcançável. Se um único mantenedor se sentir exausto com seu volume de trabalho, ele deve simplesmente trazer mais desenvolvedores a bordo. ”

Infelizmente, para muitos mantenedores, essa mentalidade colaborativa não reflete mais a realidade.

Assim, em projetos colaborativos, é comum existir um pequeno grupo produzindo a maior parte do trabalho. E os editores da Wikipédia não são remunerados, o que intensifica dois tipos de problema. Primeiro, se você não trabalha por dinheiro, tem outras motivações, entre elas a busca por reconhecimento ou até mera vaidade. Alguns editores na Wikipédia se comportam como astros, liderando uma fiel legião de fãs (outros editores). O problema é que quanto mais fãs você tem, menos tempo para dar atenção a cada fã você terá.

Segundo, a restrição natural em projetos de código aberto tornou-se o que Danco chama de “uma espécie de Tragédia dos Comuns de cabeça para baixo”. O problema clássico dos bens comuns envolve um bem público que se auto-renova, mas finito, como o pasto da cidade que os animais pastam. Aqui, o bem comum em risco de ser descoberto não é o produto; o próprio código pode ser consumido sem limites. O risco é que os criadores fiquem cansados ​​e sobrecarregados com a participação e com a demanda de seu tempo.

Não por acaso o futuro da Wikipédia está nos países em desenvolvimento, principalmente na África e na Ásia, visto que o crescimento de colaboradores nos países mais ricos estagnou.

Nem tudo está perdido

Ninguém duvida que parte do sucesso da Wikipédia se dá por sua estrutura. Como descreve a The Economist em recente artigo:

“O projeto deve muito de seu sucesso à sua estrutura única. Financiado por doações, a Wikipédia não obtém lucros. Não tem patrocinadores de capital de risco que exijam crescimento a todo custo. Sem anunciantes para satisfazer, ela pode se concentrar exclusivamente nos interesses de seus leitores e colaboradores. É curado e administrado por pessoas, não por máquinas. Não existe um algoritmo de recomendação zumbindo em segundo plano, escolhendo o que mostrar aos leitores para mantê-los colados ao site pelo maior tempo possível.

“Outros titãs da tecnologia deveriam estudar seu sucesso. Depender de algoritmos é um dos motivos pelos quais eles alcançaram uma escala enorme com tão poucos funcionários. No entanto, as desvantagens começaram a assombrá-los. Conforme os gigantes da mídia social contratam cada vez mais pessoas como moderadores e escrevem conjuntos de regras cada vez mais longas sobre o que é permitido, a Wikipédia oferece uma lição sobre como administrar um site movido a humanos”.

No passado, fóruns e grupos de discussão evoluíram para as plataformas que conhecemos hoje (Twitter, facebook…). As plataformas tornaram muito fácil criar, compartilhar, distribuir e descobrir que todos se juntaram a elas, juntando tudo em formatos comuns e fáceis de usar, sem o contexto local ou nuance dos grupos menores.

Possivelmente, a evolução da Wikipédia seja um modelo híbrido, onde algoritmos passem a trabalhar em conjunto com editores remunerados. Algoritmos como o GPT-3, capazes de reunir dados de milhares de fontes e criar respostas a partir de múltiplos inputs tem o potencial de tornar o Google e a Wikipédia relíquias do passado.

Nossos tópicos