Pável Calado,

R – INESC-ID Lisboa

Abstract:

Entre as muitas novas técnicas de Recuperação de Informação (RI) criadas
no contexto da Web, análise de ligações é uma que tem atraído
grande atenção. Neste trabalho, estudamos como ligações entre páginas
Web podem ser aplicadas na resolução de dois problemas distintos: (a)
ordenação de respostas a uma consulta e (b) classificação de documentos
da Web. Para isso, modelos formais baseados em redes Bayesianas são
propostos e validados através de testes executados numa colecção
extraída da Web brasileira. Os resultados mostram que, efectivamente,
ligações entre páginas Web são uma fonte de evidência importante, tanto
para ordenar como para classificar documentos. Em ambos os casos,
combinação de informação de ligações entre páginas Web com
informação sobre o conteúdo das páginas produz resultados melhores do
que aqueles obtidos com o uso de cada fonte de evidência isoladamente.

 

Date: 2004-Nov-04     Time: 16:00:00     Room: 336


For more information: