quinta-feira, 2 de setembro de 2010

Avaliação no Google: o sistema PageRank

 Motores de busca hoje em dia ocupam o lugar das Bibliotecas, seja por disponibilizarem muito mais conteúdo, seja por estarem "abertos" 24 horas por dia.

Quem busca o Google, provavelmente, não dispõe de tempo ou de boa vontade para uma busca mais minuciosa acerca de um assunto.

O que normalmente acontece é clicar nas primeiras páginas que aparecem no resultado da busca. Qual o critério para essas páginas estarem lá? Por serem as primeiras elas deveriam ser as melhores não? As mais confiáveis.

O motor de busca do Google utiliza um algoritmo basado em modelo matemático que, de certa forma, faz a avaliação dos sites de forma semelhante ao processo de citações nos artigos científicos:
A classificação das páginas (PageRank) confia na natureza excepcionalmente democrática da Web, usando sua vasta estrutura de links como um indicador do valor de uma página individual. Essencialmente, o Google interpreta um link da página A para a página B como um voto da página A para a página B. Mas o Google olha além do volume de votos, ou links, que uma página recebe; analisa também a página que dá o voto. Os votos dados por páginas "importantes" pesam mais e ajudam a tornar outras páginas "importantes."
Sites importantes, de alta qualidade recebem uma nota de avaliação maior, que o Google grava a cada busca feita. Naturalmente, uma página importante não significa nada se não combinar com a sua busca. Assim, o Google combina os resultados de alta qualidade com a busca que você está realizando para que o resultado seja o mais relevante possível. O Google pesquisa quantas vezes a palavra procurada aparece nas páginas e examina todo o aspecto delas (e conteúdo das páginas ligadas a ela) para determinar o melhor resultado para a sua busca. (GOOGLE, online)
Bom, pelo que está escrito, entendemos que o resultado dessa busca deveria ser de uma qualidade não questionável. Um exemplo dado por um estudo realizado em Portugal é o de: se o Yahoo, que é uma página "importante", linkar diretamente (referenciar) uma página qualquer pode-se entender automaticamente que essa página é confiável e deve ser muito avaliada, "Ou seja, é a lógica de ser referido por muitos web sites ou por web sites altamente conhecidos." (FREITAS; HENRIQUE, 2001)

Mas porque, apesar dessa "perfeição", as páginas que aparecem nos resultados não são necessariamente as mais confiáveis? Infelizmente, os estudos sobre esses motores de busca no Brasil ainda estão mais concentrados na área da Matemática e Informática e não nas Ciências Sociais, principalmente na Ciência da Informação (CI), responsável pela organização e recuperação da informação.

Nesse sentido a CI pode contribuir muito no entendimento do processo de avaliação, pois o PageRank faz uma avaliação muito mais quantitativa do que realmente qualitativa, embora a qualidade do conteúdo esteja subentendida no algoritmo. Por isso, mesmo que as primeiras páginas (topo do ranking) respondam satisfatoriamente às questões colocadas pelo usuário, elas não são as mais recomendadas e confiáveis. Nesse processo também é de extrema importância a indexação.

Merlo (200?) em seu estudo afirma que existe um erro no algoritmo do Google, por mais eficiente que ele seja: "[...]páginas com mais links de entrada possuem um valor alto de ranking, sem analisar a qualidade da página que tinha este link. Ou páginas que contém um termo raro, mas não possui um conteúdo relevante também era visto como uma página mais relevante."

Em sua análise ele desenvolve e comprova que é possível aprimorar esse modelo para que os resultadors das buscas dos usuários sejam cada vez mais confiáveis, sejam melhor avaliados.

REFERÊNCIAS

GOOGLE. Por que usar o Google.  Disponível em: http://www.google.com.br/why_use.html. Acesso em: 02 set. 2010.

HENRIQUES, Cristina; FREITAS, Jorge Meneses. Information Retrieval Techniques  in  Commercial Systems. 2001. Disponível em: http://paginas.fe.up.pt/~mgi00012/docs/mgi_ari_web.pdf. Acesso em: 02 set. 2010.

MERLO, Lucas Augusto Scotta. Análise Tópica de links para buscas na Web. [200?]. Disponível em: http://www.inf.ufes.br/~scotta/files/ri/Artigo_PageRank%20_Lucas_Scotta.pdf. Acesso em: 02 set. 2010.

0 comentários:

Postar um comentário