HiperPageRank
24 12 2007Pesquisa realizada na Universidade Federal do Amazonas (UFMA), com apoio da Bolsa Uol Pesquisa, prevê a criação de um novo algoritmo para a avaliação e classificação de páginas em ferramentas de busca na Web. O projeto, de autoria do Dr. Edleno Moura e do mestrando Klessius Berlt, acusa resultados superiores em qualidade até mesmo do que o PageRank do Google.
Entenda o PageRank
O PageRank é o algoritmo utilizado pelo Google Search: a ferramenta de busca mais utilizada na web - e a considerada mais eficiente. Esse status se dá principalmente em função do recurso de cotação das páginas através das referências que cada uma possui na Web (hiperlinks). A ordem do sistema de classificação do PageRank é determinado pelo número e pelo peso dos hiperlinks que indicam cada página. Assim, se um site A se hiperliga a um site B, o site A estará votando no site B. Quanto mais peso tiverem os votos - a relevância do voto de uma página é calculado pelo número de hiperligações direcionadas a essa mesma página -, mais alta será a classificação na ordem dos resultados.
Esse é um sistema supostamente democrático. Não é um administrador de rede ou o princípio da repetição de termos que dão relevância a uma página ou a outra, é a própria internet que se classifica. Assim, se os usuários, através do direcionamento de hiperlinks, determinarem que o Sbt é mais significativo como “emissora brasileira de televisão” do que a RedeTV, a página do SBT aparecerá na frente (casa a busca seja essa) na ordem dos resultados.

No entanto, esse sistema é passível de ser manipulado. Normalmente como forma de protesto, bloggeiros passam a difundir correntes na rede, incitando para que se coloque hiperlinks a um mesmo alvo com uma informação freqüentemente pejorativa. A título de exemplificação tem-se o recente protesto contra a absolvição do presidente do Senado, Renan Calheiros. Várias páginas passaram a indicar o site do Senado através do mesmo hiperlink: “vergonha nacional”. Como consequência, qualquer pessoa que procurasse no sistema de busca do Google por “vergonha nacional” teria como primeiro resultado o site do Senado brasileiro. E ainda, caso tenha selecionado a opção “Estou com Sorte”, a página teria sido aberta imediatamente. A essa estratégia de manipulação da ordem dos resultados dá-se o nome de Google Bombing (ou Bomba Google): uma maneira pós-moderna criativa de protesto.

O HiperPageRank
O HiperPageRank segue a mesma lógica do PageRank: a avaliação da reputação das páginas pela web. A diferença entre os dois modelos consiste na unidade considerada para se fazer o cálculo. O PageRank considera cada página como uma unidade, independente de pertencer à mesma raíz; o HiperPageRank, apenas o domínio. Dessa forma, na primeira situação, se os sites de duas escolas de uma mesma universidade (ecos.ucpel e esin.ucpel), fizerem uma hiperligação cada ao site do CNPq, a este será contabilizado dois votos. Na segunda situação, apenas um, pois se considera apenas o domínio da universidade (ucpel.tche.br).
E os weblogs? serão agrupados todos os blogs de um mesmo domínio (Blogger, WordPress)?
A proposta para essa questão é formar “domínios” em que se possa agrupar weblogs que tratem da mesma temática. [Adeus ao Google Bombing...]
Se o tal do PageRank conseguiu dar subsídios ao nascimento de um gigante onipresente na rede, é interessante imaginar o que o HiperPageRank poderia resultar nas mãos de uma empresa legitimamente brasileira com possibilidades financeiras de aplicar a tecnologia. Mudanças pardigmáticas, talvez?
————-
Crédito Imagem PageRank: Wikipedia




O Hiper PageRank poderia ser uma solução interessante para evitar o atual caos do Google. Blogs estão tomando conta dos primeiros resultados :T Quando o resultado não é um blog, é a Wikipedia.
Já procurasse por ‘entediante’ no Google?
… e viva os videozinhos da Bolsa Uol!
Já tinhas me falado dessa, dá no teu blog shshshs
vídeo do uol? hã? como? capaz, eu li o paper premiado aquele em inglês ¬¬ [bem capaz]
vídeos uol rulez
ah, e é separado HIPER PageRank? não me lembrava
Até procurei o paper depois de ver o videozinho, mas não encontrei
E viva os slides disponíveis em álbuns de fotos 
O PageRank baseado nos hipergrafos é um Hiperpagerank mesmo - tudo junto