Un ‘detective web’ permite recuperar o 81% dos enlaces rotos

Para acabar co molesto problema dos links erróneos, un grupo de investigadores da UNED desenvolveu un sinxelo sistema baseado en seguir a pista que este contido deixa na web. Segundo os investigadores, a nova ferramenta permite recuperar ata o 81% dos enlaces obsoletos.

n
n

nAlgúns estudos calculan que o 67% das direccións de Internet se converten en erróneas tras un período de catro anos de vida. Nalgunhas ocasións, o enlace é incorrecto porque a páxina desapareceu e, noutros casos, porque a información foi movida de sitio. Investigadores da UNED desenvolveron un sistema que fai a función dun 'detective privado' para atopar as pistas dese contido e seguir así o seu rastro.
n
n"Estas pistas consisten en referencias e enlaces obsoletos en motores de busca, librerías dixitais, servizos web e redes sociais", explica Juan Martínez-Romo, investigador do grupo de procesamento de linguaxe natural e recuperación de Información da UNED e autor principal do proxecto.
n
nSolicitadas as pistas, o sistema ao que se denominou Detective Brooklynk elabora dinamicamente unha estratexia para atopar a páxina desaparecida ou unha equivalente da forma máis eficiente, é dicir, consumindo os mínimos recursos e o menor tempo. Deste modo, inserindo o link erróneo, o programa devolve ao usuario unha lista de enlaces nos que pode estar a información que busca, xa sexa da mesma páxina ou ben doutras que o recolleran.
n
nPara comprobar a efectividade da ferramenta, cuxo desenvolvemento se publicou na revista Information Processing and Management' os investigadores seleccionaron aleatoriamente un conxunto de páxinas con enlaces rotos e intentaron recuperar o seu contido. "Co sistema que desenvolvemos, conseguimos recuperar o 81% dos links erróneos", asegura Martínez-Romo.
n
nOs motores de busca penalizan
n
nO problema dos enlaces obsoletos é unha das materias pendentes de Internet, e prexudica tanto a usuarios coma a creadores. "É evidente que, de cara a un internauta, atopar este tipo de problemas dificulta e entorpece as súas buscas, pero, ademais, isto repercute nunha perda de fiabilidade e prestixio para o dono da páxina", comenta o investigador.
n
nA estas molestias súmase o feito de que os motores de busca penalizan ás páxinas á hora de mostralas na lista de resultados. Nos últimos anos, apareceron algoritmos que propoñen a modificación do PageRank (algoritmo de ranking utilizado polos motores de busca) para que teña en conta esa clase de erros.
n
nO sistema desenvolvido pola UNED evitaría esta penalización, explica o responsable do proxecto. Á espera da súa versión definitiva, é un prototipo que utiliza parte das estratexias presentadas no artigo.
n
n(Fonte: UNED)
n

n