Overblog Suivre ce blog
Editer l'article Administration Créer mon blog
28 juin 2010 1 28 /06 /juin /2010 08:38

Aspirer un site Web

Pour rédiger un rapport ou bien pour compléter un dossier, vous avez besoin d'informations provenant de pages sur Internet. Or, à moins de disposer en permanence d'une connexion à Internet, y compris en déplacement, ou bien d'avoir pris le temps de récupérer les informations qui vous sont nécessaires avant de bouger, vous n'aurez pas matière à travailler.

 

La solution : copier sur son ordinateur les pages ou les sites Web qui vous intéressent pour les emporter avec vous et pouvoir ainsi les consulter hors connexion. Cela vous permettra également de conserver une copie sur votre ordinateur de pages intéressantes, qui peuvent très bien changer ou disparaître sur Internet.

Les aspirateurs de sites Web sortis en même temps que la démocratisation d'Internet, pour pouvoir télécharger un site en bas débit et le consulter librement ensuite, sont toujours d'actualité. Avec eux, il est possible de demander le téléchargement de l'intégralité d'un site, ou seulement d'un certain nombre de niveaux de profondeur des pages dans l'arborescence, de filtrer les éléments à ramener : pages, images, animations, vidéo, musique, et même de limiter le poids total du site en fixant un seuil à ne pas dépasser. Des fonctionnalités que l'on retrouve dans HTTrack, un logiciel gratuit.

 

Et pour ne pas avoir à rapatrier l'intégralité des pages lors d'une mise à jour d'un site que vous avez aspiré, seules les pages modifiées sont téléchargées.

 

Il vous restera alors plus qu'à copier les fichiers sur votre ordinateur portable ou sur une clé USB pour pouvoir naviguer en déplacement sur les pages que vous avez téléchargées, comme si vous étiez connecté.

 

Installer HTTrack

HTTrack est un aspirateur de sites Web complet et gratuit.

  1. Rendez-vous sur la fiche de HTTrack dans la logithèque.

  2. Cliquez sur le lien Télécharger gratuitement.

Démarrer une capture de site

Lancez HTTrack.

 

Paramétrer la capture

  1. Cliquez ensuite sur le bouton Définir les options.

  2. Ouvrez l'onglet Règles de filtrage.

  3. Cochez la case gif, jpg, png, tif et bmp pour télécharger les images des pages ramenées. Cochez les cases adéquates pour téléchargement aussi les musiques, animations, etc.

  4. Ouvrez ensuite l'onglet Limites.

  5. Vous pouvez maintenant définir le niveau de profondeur maximal que vous allez télécharger dans l'arborescence de la page que vous avez indiquée. Le niveau 1 correspond à la page d'accueil, 2 à la page d'accueil et à tous les liens qu'elle contient, etc … Attention à ne pas mettre un niveau trop élevé (au dessus de 3 par exemple) car le nombre de pages téléchargées peut rapidement atteindre la dizaine de milliers sur un site bien fourni.

  6. Spécifiez également le niveau de téléchargement des liens qui pointent vers des pages extérieures au site d'origine, 1 par exemple.

  7. Si vous êtes limité en taille, vous pouvez définir une taille maximale du site en octets, 100000000 pour 100 Mo par exemple.

  8. Déroulez la liste Taux maximal et choisissez l'option 50 000 pour augmenter la vitesse de téléchargement des pages et images.

  9. Ouvrez ensuite l'onglet Liens. Cochez la case Téléchargement les HTML en premier. Toutes les pages Web seront ainsi téléchargées avant les images.

  10. Cliquez enfin sur le bouton OK. Cliquez sur Suivant puis sur Terminer.

  11. La capture commence alors. Attention, l'opération peut être assez longue : tous les liens sont analysés, les images et pages téléchargées et l'architecture du site recréée sur votre disque dur.


Naviguer sur le site hors connexion

Toutes les pages et images du site aspiré (dans la limite du niveau que vous avez défini) se trouvent sur votre ordinateur. Vous pouvez consulter quand vous le souhaitez ces pages, les copier sur une clé USB pour les emporter avec vous, etc.

 

Mettre à jour une capture

Si les pages du site que vous avez aspiré ont été mises à jour, pas besoin de tout ramener. Vous pouvez télécharger uniquement les pages qui ont été modifiées.

 

 

Partager cet article

Repost 0

commentaires

Présentation

  • : Francis Guillot
  • Francis Guillot
  • : informatique et internet - trucs et astuces Windows XP 7 (seven) et Vista - sites internet – comptabilité et fiscalité - tableau de bord - fiscalité - création d'entreprises - droit civil, social et du travail
  • Contact

Like

Yahoo

Myspaceflickr-yahoo-logo.png.v4.png

Recherche