Comment télécharger un site Web entier pour une lecture hors ligne

Bien que le Wi-Fi soit disponible partout de nos jours, vous pouvez vous retrouver sans lui de temps en temps. Et lorsque vous le faites, il peut y avoir des sites Web que vous souhaiteriez avoir enregistrés, afin que vous y ayez accès hors ligne, peut-être pour la recherche, le divertissement ou simplement pour la postérité.

Il est assez basique d'enregistrer des pages Web individuelles pour une lecture hors ligne, mais que se passe-t-il si vous souhaitez télécharger un site Web entier ? Ne vous inquiétez pas, c'est plus facile que vous ne le pensez. Mais ne nous croyez pas sur parole. Voici plusieurs outils astucieux que vous pouvez utiliser pour télécharger n'importe quel site Web pour une lecture hors ligne, sans aucun problème.

1. WebCopie

WebCopy by Cyotek prend l'URL d'un site Web et l'analyse à la recherche de liens, de pages et de médias. Au fur et à mesure qu'il trouve des pages, il recherche récursivement plus de liens, de pages et de médias jusqu'à ce que l'ensemble du site Web soit découvert. Ensuite, vous pouvez utiliser les options de configuration pour décider quelles parties télécharger hors ligne.

La chose intéressante à propos de WebCopy est que vous pouvez configurer plusieurs projets qui ont chacun leurs propres paramètres et configurations. Cela permet de retélécharger facilement de nombreux sites quand vous le souhaitez, chacun de la même manière à chaque fois.

Un projet peut copier de nombreux sites Web, alors utilisez-les avec un plan organisé (par exemple, un projet « Tech » pour copier des sites technologiques).

Comment télécharger un site Web entier avec WebCopy

  1. Installez et lancez l'application.
  2. Accédez à Fichier > Nouveau pour créer un nouveau projet.
  3. Tapez l'URL dans le champ Site Web .
  4. Remplacez le champ Enregistrer le dossier par l'emplacement où vous souhaitez enregistrer le site.
  5. Jouez avec Projet > Règles… (en savoir plus sur les règles WebCopy ).
  6. Accédez à Fichier > Enregistrer sous… pour enregistrer le projet.
  7. Cliquez sur Copier dans la barre d'outils pour démarrer le processus.

Une fois la copie terminée, vous pouvez utiliser l'onglet Résultats pour voir l'état de chaque page et/ou fichier multimédia. L'onglet Erreurs affiche tous les problèmes qui ont pu se produire et l'onglet Ignoré affiche les fichiers qui n'ont pas été téléchargés.

En relation: Meilleures applications pour enregistrer des articles pour une lecture hors ligne

Mais le plus important est le plan du site , qui montre la structure complète des répertoires du site Web telle que découverte par WebCopy.

Pour afficher le site Web hors ligne, ouvrez l'Explorateur de fichiers et accédez au dossier de sauvegarde que vous avez désigné. Ouvrez le fichier index.html (ou parfois index.htm ) dans le navigateur de votre choix pour commencer à naviguer.

Télécharger : WebCopy pourWindows (gratuit)

2. HTTrack

HTTrack est plus connu que WebCopy et est sans doute meilleur car il est open source et disponible sur des plates-formes autres que Windows. L'interface est un peu maladroite et laisse beaucoup à désirer, cependant, elle fonctionne bien, alors ne vous laissez pas décourager.

Comme WebCopy, il utilise une approche par projet qui vous permet de copier plusieurs sites Web et de les garder tous organisés. Vous pouvez suspendre et reprendre les téléchargements, et vous pouvez mettre à jour les sites Web copiés en retéléchargeant les anciens et les nouveaux fichiers.

Comment télécharger un site Web complet avec HTTrack

  1. Installez et lancez l'application.
  2. Cliquez sur Suivant pour commencer à créer un nouveau projet.
  3. Donnez au projet un nom, une catégorie, un chemin de base, puis cliquez sur Suivant .
  4. Sélectionnez Télécharger le ou les sites Web pour l'action, puis saisissez l'URL de chaque site Web dans la zone Adresses Web , une URL par ligne. Vous pouvez également stocker des URL dans un fichier TXT et l'importer, ce qui est pratique lorsque vous souhaitez télécharger à nouveau les mêmes sites ultérieurement. Cliquez sur Suivant .
  5. Ajustez les paramètres si vous le souhaitez, puis cliquez sur Terminer .

Une fois que tout est téléchargé, vous pouvez parcourir le site comme d'habitude en allant à l'endroit où les fichiers ont été téléchargés et en ouvrant le fichier index.html ou index.htm dans un navigateur.

Comment utiliser HTTrack avec Linux

Si vous êtes un utilisateur d'Ubuntu, voici comment vous pouvez utiliser HTTrack pour enregistrer un site Web entier :

  1. Lancez le Terminal et tapez la commande suivante :
     sudo apt-get install httrack
  2. Il vous demandera votre mot de passe Ubuntu (si vous en avez défini un). Tapez-le et appuyez sur Entrée . Le Terminal téléchargera l'outil dans quelques minutes.
  3. Enfin, tapez cette commande et appuyez sur Entrée . Pour cet exemple, nous avons téléchargé le site Web populaire, Brain Pickings .
     httrack https://www.brainpickings.org/
  4. Cela téléchargera l'ensemble du site Web pour une lecture hors ligne.
    télécharger un site web entier avec httrack sur ubuntu

Vous pouvez remplacer l'URL du site Web ici par l'URL du site Web que vous souhaitez télécharger. Par exemple, si vous vouliez télécharger l'Encyclopedia Britannica entière, vous devrez ajuster votre commande à ceci :

 httrack https://www.britannica.com/

Téléchargement : HTTrack pour Windows et Linux | Android (gratuit)

3.SiteSucker

Si vous utilisez un Mac, votre meilleure option est SiteSucker . Cet outil simple copie des sites Web entiers, conserve la même structure et inclut également tous les fichiers multimédias pertinents (par exemple, images, PDF, feuilles de style).

Il possède une interface claire et facile à utiliser : vous collez littéralement l'URL du site Web et appuyez sur Entrée .

Une fonctionnalité intéressante est la possibilité d'enregistrer le téléchargement dans un fichier, puis d'utiliser ce fichier pour télécharger à nouveau les mêmes fichiers et la même structure à l'avenir (ou sur une autre machine). Cette fonctionnalité est également ce qui permet à SiteSucker de suspendre et de reprendre les téléchargements.

SiteSucker coûte environ 5 $ et n'est pas fourni avec une version gratuite ou un essai gratuit, ce qui est son plus gros inconvénient. La dernière version nécessite macOS 11 Big Sur ou supérieur. Les anciennes versions de SiteSucker sont disponibles pour les anciens systèmes Mac, mais certaines fonctionnalités peuvent être manquantes.

Télécharger : SiteSucker pour iOS | Mac (4,99 $)

4. Wget

Wget est un utilitaire de ligne de commande qui peut récupérer toutes sortes de fichiers via les protocoles HTTP et FTP. Étant donné que les sites Web sont servis via HTTP et que la plupart des fichiers multimédias Web sont accessibles via HTTP ou FTP, cela fait de Wget un excellent outil pour télécharger des sites Web entiers.

Connexe : Comment télécharger des livres à partir de Google Books

Wget est fourni avec la plupart des systèmes basés sur Unix. Bien que Wget soit généralement utilisé pour télécharger des fichiers uniques, il peut également être utilisé pour télécharger de manière récursive toutes les pages et tous les fichiers trouvés via une page initiale :

 wget -r -p https://www.makeuseof.com

Selon la taille, le téléchargement du site Web complet peut prendre un certain temps.

Cependant, certains sites peuvent détecter et empêcher ce que vous essayez de faire, car l'extraction d'un site Web peut leur coûter beaucoup de bande passante. Pour contourner ce problème, vous pouvez vous déguiser en navigateur Web avec une chaîne d'agent utilisateur :

 wget -r -p -U Mozilla https://www.thegeekstuff.com

Si vous voulez être poli, vous devez également limiter votre vitesse de téléchargement (afin de ne pas monopoliser la bande passante du serveur Web) et faire une pause entre chaque téléchargement (afin de ne pas submerger le serveur Web avec trop de demandes) :

 wget -r -p -U Mozilla --wait=10 --limit-rate=35K https://www.thegeekstuff.com

Comment utiliser Wget sur un Mac

Sur un Mac, vous pouvez installer Wget à l'aide d'une seule commande Homebrew : brew install wget .

  1. Si vous n'avez pas déjà installé Homebrew, téléchargez-le avec cette commande :
     /usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"
  2. Ensuite, installez Wget avec cette commande :
     brew install wget
  3. Une fois l'installation de Wget terminée, vous pouvez télécharger le site Web avec cette commande :
     wget path/to/local.copy http://www.brainpickings.org/

Sous Windows, vous devrez utiliser cette version portée à la place. Téléchargez et installez l'application, puis suivez les instructions pour terminer le téléchargement du site.

Téléchargez facilement des sites Web entiers

Maintenant que vous savez comment télécharger un site Web entier, vous ne devriez jamais être pris sans quelque chose à lire, même si vous n'avez pas accès à Internet. Mais rappelez-vous : plus le site est gros, plus le téléchargement est important. Nous vous déconseillons de télécharger des sites volumineux comme MUO, car vous aurez besoin de milliers de Mo pour stocker tous les fichiers multimédias que nous utilisons.