Les outils de suivi de site
La technique artisanale consistera à se porter volontairement sur les pages repérées d'un site et à les scruter attentivement « à l'œil nu » afin d'y découvrir les nouvelles informations, ou plus modestement, à suivre la date de mise à jour de la page, mais hélas tous les sites n'offrent pas cette information, pourtant essentielle.
Mais il existe aujourd'hui des outils permettant une aide au suivi de pages ou de sites. Ils permettent notamment de repérer le contenu d'une ou plusieurs pages, voire d'un site entier et sont capables d'en signaler ultérieurement toute modification de contenu. Il suffit dès lors de s'appuyer sur ce signalement pour prendre connaissance des modifications survenues.
L'exemple de Wysigot
Parmi ces outils, Wysigot s'est acquis une réputation d'autant plus aisée qu'une première version du produit est gratuite (Wysigot Light), à l'instar de certains agents de recherche (Copernic et Strategic Finder, notamment). Ce produit français est, dans sa version actuelle, le croisement d'E-catch, l'outil de capture de site de La Mine, et de WebCapture de Xelios, nés en 1998.
Un aspirateur de site intelligent
Le logiciel fonctionne à la base comme un aspirateur de site. Ces logiciels ont eu leur heure de gloire à une époque où beaucoup d'internautes avaient une connexion à Internet en bas débit et payée à la durée. Ils capturaient alors un site complet, en vue de pouvoir le consulter hors connexion. Signalons d'ailleurs que Microsoft Internet Explorer possède toujours une fonction de consultation hors connexion qu'il est possible d'activer lorsqu'on pose un favori.
Avertissement juridique
Rappelons à toutes fins utiles que la copie d'un site ne peut se faire que pour le seul usage privé du copiste, soit une copie sur son espace de travail, mais en aucun cas partagée sur un réseau local ou sur un intranet (art. L.122-5 2° du code de la propriété intellectuelle).
Une technique basée sur la comparaison de versions
La première étape de suivi de site sur Wysigot est donc de demander au logiciel de capturer une page ou tout ou partie d'un site à surveiller. La première capture étant faite, à toute nouvelle connexion au site, le logiciel compare entre la page enregistrée et celle en ligne. Chaque page modifiée est signalée à l'utilisateur par une alerte lui indiquant quelle page à été modifiée. Il lui suffit alors d'afficher la page pour voir apparaître toutes les nouveautés surlignées en jaune.
Exemple de nouveautés sur la page d'accueil de Yahoo ! visualisée sous Wysisgot
Un outil indiscret...
Le résultat involontaire de ce type de travail, qui se fait caractère par caractère, est que l'on peut s'apercevoir des corrections de toutes les fautes de frappe sur une page... L'effet est amusant et nullement infamant pour le gestionnaire d'un site qui veille à corriger les inévitables fautes que plusieurs relectures laissent encore passer.
Un outil efficace pour une surveillance d'information au plus près de la source
Mais surtout Wysigot se révèle être un excellent outil de suivi d'information. Les nouveautés sur les pages restent surlignées tant qu'une nouvelle version n'a pas à nouveau été repérée. Les pages repérées comme modifiées apparaissent dans le volet des pages comme non lues (en gras) à la manière d'un logiciel de messagerie, tant qu'elles n'ont pas été regardées. Il est aussi possible de conserver plusieurs versions successives d'une même page (paramètres « Propriétés » attachés à chaque page). Les informations de connexion à la page apparaissent dans une info-bulle consultable en survolant l'icône de la page dans le volet d'affichage des pages capturées. On y voit la date de mise à jour de la page, la date de dernière vérification et la date de la prochaine vérification. Wysigot ajuste automatiquement la fréquence de vérification aux habitudes de l'utilisateur. Il est aussi possible, dans les paramètres de propriétés, de régler la fréquence de vérification pour chaque page.
Exemple des informations et propriétés d'une page capturée, ici une page du site Wysigot.com
Des fonctions avancées complémentaires pour la veille
La version gratuite permet aussi d'annoter personnellement les pages visitées, ce qui peut s'avérer infiniment plus riche que de poser un simple favori sur une page. L'existence d'une note apparaît dans le volet d'affichage des pages grâce à une icône spécifique. Et l'annotation apparaît dans l'info-bulle signalée plus haut.
La version payante (38 euros TTC) permet d'améliorer la qualité des vérifications (contrôle étendu aux fichiers bureautiques associés aux pages).
Mais elle permet surtout d'effectuer des recherches dans les pages capturées, et de conserver trace de ces recherches. Avec un peu de doigté, il est possible de rechercher des mots dans un ensemble de sites capturés, ce qui peut se révéler fort instructif pour recouper des informations et mettre en évidence des collèges invisibles.
Quelques pistes
En savoir plus, télécharger le logiciel, voir le site de Wysigot en français : www.wysigot.com/fr/
Il existe un autre outil de surveillance, payant celui-là (à partir de 99 euros pour une version entreprise) : Website-Watcher, qui comme son nom ne l'indique pas, est conçu par un autrichien et disponible sur le site de l'auteur : http://aignes.com/ version anglaise ou allemande uniquement (version d'évaluation disponible).
En savoir plus sur les outils de surveillance (pris au sens large) : lire la rubrique de ce nom sur le site d'Armelle Thomas, Inforizon :
http://www.inforizon.com/index.adml?s=4912561301120692826714&r=82
|cc| Didier Frochot — juin 2006