Une extension Firefox pour retrouver les pages Web disparues

Un des aspects plus qu’agaçants d’Internet est le fait que l’information qu’on trouve sur les sites Web est très volatile.

Les sites et les pages qui les composent naissent et disparaissent parfois très rapidement, rendant très difficile de retrouver une information équivalente à celle d’origine.

La célèbre erreur 404, c’est-à-dire page non trouvée, est alors affichée, indiquant quand la page a disparu de la circulation.

Heureusement qu’on retrouve la grande majorité de ces pages disparues dans des systèmes de cache, celui de Google par exemple est certainement le plus connu puisqu’il enregistre à priori tout ce qui lui passe entre les griffes, mais seulement pour une durée limitée dans le temps.

Pour le navigateur Firefox, voici une extension qui prend le relai quand une page Web n’est plus disponible : site définitivement fermé, serveur en panne, page modifiée après publication, page supprimée, etc.
Il s’agit de l’extension Resurrect Pages. Elle prend en compte les services de cache et de miroir suivants qui constituent de véritables miroirs numériques du Web :

  • CoralCDN
  • Google Cache
  • Yahoo! Cache
  • The Internet Archive
  • The Way-Back Machine
  • MSN Cache
  • Gigablast
  • WebCite

L’accès aux sites de cache se fait depuis le menu contextuel de Firefox, depuis la barre d’outils du navigateur ou via un raccourci clavier.

Il est intéressant de pouvoir choisir le cache sur lequel on recherche une page disparue des écrans radars dans la mesure où tous les systèmes de cache n’enregistrent pas l’intégralité du Web et que rien ne dit combien de temps est conservée une page qui s’y trouve à un instant T.

firefox-logo

Ce système de cache permet aussi de passer outre bon nombre de systèmes de sécurité et de filtrages dans la mesure où ces caches ne sont pas inscrits nommément sur les listes des sites à bloquer.

Source : Resurrect Pages