HiperPageRank

24 12 2007

Pesquisa realizada na Universidade Federal do Amazonas (UFMA), com apoio da Bolsa Uol Pesquisa, prevê a criação de um novo algoritmo para a avaliação e classificação de páginas em ferramentas de busca na Web. O projeto, de autoria do Dr. Edleno Moura e do mestrando Klessius Berlt, acusa resultados superiores em qualidade até mesmo do que o PageRank do Google.

Entenda o PageRank

O PageRank é o algoritmo utilizado pelo Google Search: a ferramenta de busca mais utilizada na web - e a considerada mais eficiente. Esse status se dá principalmente em função do recurso de cotação das páginas através das referências que cada uma possui na Web (hiperlinks). A ordem do sistema de classificação do PageRank é determinado pelo número e pelo peso dos hiperlinks que indicam cada página. Assim, se um site A se hiperliga a um site B, o site A estará votando no site B. Quanto mais peso tiverem os votos - a relevância do voto de uma página é calculado pelo número de hiperligações direcionadas a essa mesma página -, mais alta será a classificação na ordem dos resultados.

Esse é um sistema supostamente democrático. Não é um administrador de rede ou o princípio da repetição de termos que dão relevância a uma página ou a outra, é a própria internet que se classifica. Assim, se os usuários, através do direcionamento de hiperlinks, determinarem que o Sbt é mais significativo como “emissora brasileira de televisão” do que a RedeTV, a página do SBT aparecerá na frente (casa a busca seja essa) na ordem dos resultados.

No entanto, esse sistema é passível de ser manipulado. Normalmente como forma de protesto, bloggeiros passam a difundir correntes na rede, incitando para que se coloque hiperlinks a um mesmo alvo com uma informação freqüentemente pejorativa. A título de exemplificação tem-se o recente protesto contra a absolvição do presidente do Senado, Renan Calheiros. Várias páginas passaram a indicar o site do Senado através do mesmo hiperlink: “vergonha nacional”. Como consequência, qualquer pessoa que procurasse no sistema de busca do Google por “vergonha nacional” teria como primeiro resultado o site do Senado brasileiro. E ainda, caso tenha selecionado a opção “Estou com Sorte”, a página teria sido aberta imediatamente. A essa estratégia de manipulação da ordem dos resultados dá-se o nome de Google Bombing (ou Bomba Google): uma maneira pós-moderna criativa de protesto.

O HiperPageRank

O HiperPageRank segue a mesma lógica do PageRank: a avaliação da reputação das páginas pela web. A diferença entre os dois modelos consiste na unidade considerada para se fazer o cálculo. O PageRank considera cada página como uma unidade, independente de pertencer à mesma raíz; o HiperPageRank, apenas o domínio. Dessa forma, na primeira situação, se os sites de duas escolas de uma mesma universidade (ecos.ucpel e esin.ucpel), fizerem uma hiperligação cada ao site do CNPq, a este será contabilizado dois votos. Na segunda situação, apenas um, pois se considera apenas o domínio da universidade (ucpel.tche.br).

E os weblogs? serão agrupados todos os blogs de um mesmo domínio (Blogger, WordPress)?

A proposta para essa questão é formar “domínios” em que se possa agrupar weblogs que tratem da mesma temática. [Adeus ao Google Bombing...]

Se o tal do PageRank conseguiu dar subsídios ao nascimento de um gigante onipresente na rede, é interessante imaginar o que o HiperPageRank poderia resultar nas mãos de uma empresa legitimamente brasileira com possibilidades financeiras de aplicar a tecnologia. Mudanças pardigmáticas, talvez?

————-
Crédito Imagem PageRank: Wikipedia


Ações

Informações

3 respostas para “HiperPageRank”

27 12 2007
Gabriela (03:24:02) :

O Hiper PageRank poderia ser uma solução interessante para evitar o atual caos do Google. Blogs estão tomando conta dos primeiros resultados :T Quando o resultado não é um blog, é a Wikipedia.

Já procurasse por ‘entediante’ no Google? :P

… e viva os videozinhos da Bolsa Uol! :D

27 12 2007
jandreb (03:52:46) :

Já tinhas me falado dessa, dá no teu blog shshshs

vídeo do uol? hã? como? capaz, eu li o paper premiado aquele em inglês ¬¬ [bem capaz]

vídeos uol rulez

ah, e é separado HIPER PageRank? não me lembrava

27 12 2007
Gabriela (13:17:02) :

Até procurei o paper depois de ver o videozinho, mas não encontrei :P
O PageRank baseado nos hipergrafos é um Hiperpagerank mesmo - tudo junto :) E viva os slides disponíveis em álbuns de fotos :D

Deixe um comentário

Você pode usar estas tags : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>