Science

Artigos órfãos: a 'matéria escura' da Wikipedia

A Wikipédia é a maior plataforma de conhecimento online aberto e de livre acesso. Num novo estudo, os investigadores descobriram que cerca de 15% do conteúdo é efetivamente invisível para os leitores que navegam na Wikipédia. Eles desenvolveram uma nova ferramenta para ajudar a superar isso.

Com 60 milhões de artigos em mais de 300 versões linguísticas, o conteúdo disponível da Wikipédia cresce continuamente a uma taxa de cerca de 200 mil novos artigos por mês. Os leitores muitas vezes descobrem novos conhecimentos e se aprofundam em um assunto clicando em hiperlinks que conectam um artigo ao seguinte. Mas e os artigos da Wikipédia aos quais nenhum outro artigo tem link?

Estes são comumente chamados de artigos 'órfãos' e para melhor compreender este fenômeno pesquisadores do Laboratório de Ciência de Dados (DLAB) da Escola de Ciências da Computação e da Comunicação, em colaboração com a Fundação Wikimedia, conduziram o primeiro estudo sistemático de artigos órfãos. artigos em todas as 319 versões linguísticas diferentes da Wikipédia que existiam no momento em que o estudo foi realizado.

“A Wikipedia é uma rede como as estradas, a internet, os compostos químicos ou os genes, e qualquer rede tem um conceito básico de navegabilidade para que você possa ir de um lugar a outro. As redes de informação são organizadas em hierarquias específicas e estávamos curiosos para entender artigos que não foram alcançados por ninguém. Foi assim que começamos a olhar para artigos órfãos”, explicou Akhil Arora, pesquisador PhD no DLAB e autor principal do estudo Artigos Órfãos: A Matéria Negra da Wikipédia.

Os pesquisadores descobriram que quase 9 milhões de artigos na Wikipédia em todos os idiomas – cerca de 15% – eram órfãos, efetivamente invisíveis para os leitores que navegavam na Wikipédia, existindo em quase todas as áreas temáticas da plataforma. Em geral, as visualizações de página recebidas por artigos não órfãos são o dobro das visualizações de páginas de artigos órfãos. Além de correlações simples, os pesquisadores também estabeleceram uma relação de causa e efeito entre a adição de links a artigos órfãos e um aumento nas visualizações de páginas.

A falta de visibilidade dos artigos órfãos se resume à forma como os usuários pesquisam e visualizam as páginas da Wikipédia. A primeira é por meio de um mecanismo de busca, onde o usuário é direcionado para uma página específica da Wikipédia; a segunda é usar a Wikipedia como uma enciclopédia e clicar de um artigo para outro e a terceira é uma combinação de ambos.

Em todos esses cenários, um editor não só precisará adicionar links na direção de saída do artigo que está editando, mas também precisará conhecer todos os artigos relevantes da Wikipédia que poderiam potencialmente direcionar para dentro, e esta é uma perspectiva difícil.

“Um editor está editando algo que conhece muito para poder adicionar links externos a outros artigos”, disse Arora. “Inverter a direcionalidade apresenta muitas dificuldades porque eles podem não ser especialistas em outros tópicos e artigos; às vezes essas relações não são simétricas e o universo é a totalidade da Wikipédia.”

A pesquisa descobriu que existem grandes discrepâncias entre os idiomas. Em mais de 100 línguas, a percentagem de artigos órfãos é superior a 30%, com um número particularmente elevado para o árabe egípcio (78%) e o vietnamita (50%). Ambos estão entre as 20 maiores versões em idiomas da Wikipédia. Isto aponta para o desafio da falta de capacidade dos editores em algumas línguas e demonstra a necessidade de melhorar as ferramentas existentes, como o FindLink, que apoiam os editores nesta tarefa.

Uma descoberta interessante do estudo é que um artigo órfão numa língua nem sempre é órfão noutras línguas e isto levou os investigadores a desenvolver uma nova abordagem para identificar artigos a partir dos quais podem ser ligados a órfãos através da tradução de links.

“Se o mesmo artigo não for órfão em outro idioma, significa que os editores daquela comunidade conseguiram encontrar outros artigos que poderiam ter um link para este artigo. Então, simplesmente transferimos o link de outros idiomas para o idioma em que o artigo está escrito. era órfão. Descobrimos que essa abordagem foi capaz de sugerir links para mais de 63% dos artigos órfãos”, disse Arora.

A equipe da EPFL continua a colaborar com pesquisadores da Wikimedia Foundation sobre maneiras pelas quais essa abordagem poderia ser disponibilizada como uma ferramenta (veja o protótipo inicial) para melhorar a experiência dos leitores na Wikipédia. Também está a utilizar a IA para ajudar neste esforço em duas frentes.

Primeiramente, os pesquisadores estão trabalhando em redes neurais de grafos para organizar recomendações de links que servirão de base para a ferramenta. Em segundo lugar, semelhante a um mapa de calor, eles estão desenvolvendo uma ferramenta adicional que pode orientar os editores sobre onde devem considerar adicionar novos conceitos no texto de uma página que usarão IA generativa para sugerir algum texto inicial. É importante ressaltar que editores voluntários melhoram, editam e auditam o trabalho realizado pela IA. A abordagem da IA ​​na Wikipédia sempre foi por meio de sistemas de “circuito fechado”, nos quais os humanos estão envolvidos.

“A comunidade de editores está prestando o seu serviço ao mundo, mas não há um número suficiente deles, especialmente em idiomas menores. Um dos nossos objetivos é apoiar melhor os editores porque pode ser uma tarefa difícil escrever e manter artigos. A Wikipédia é uma ferramenta incrível. serviço de acesso aberto e é por isso que as ferramentas que estamos construindo são tão úteis para os editores que fazem este trabalho valioso”, concluiu Arora.

Source

Related Articles

Back to top button