Chemins d'accès

L'onglet Chemins d'accès dans la zone de dialogue Paramètres de déchargement permet d'indiquer les chemins d'accès qui doivent être repris ou exclus du déchargement. Dans ces cases de texte, mettez des URL absolus (des URL commençant par "http://" ou "https://") ou des expressions rationnelles, séparés par <Retour>.

Les paramètres de chemins d'accès fonctionnent en association avec le paramètre Option de déchargement dans les paramètres Général et le paramètre Inclure les fichiers secondaires dans les paramètres Avancé - Options selon les règles suivantes :

  1. Si c'est l'URL original (l'URL indiqué dans la case de texte URL Web), le fichier est ensuite ramené.
  2. Sinon, si l'URL commence par une des séquences (ou coïncide avec une des expressions rationnelles) de la case de texte Chemins à exclure, le fichier n'est pas ramené.
  3. Sinon, si l'URL rencontre les requis du paramètre Contrainte de chemin d’accès, le fichier est ensuite ramené.
  4. Sinon, si l'URL commence par une des séquences (ou coïncide avec une des expressions rationnelles) de la case de texte Chemins à inclure, le fichier est ensuite ramené.
  5. Sinon, si le paramètre Inclure les fichiers secondaires est activé et l'URL référence un type de fichier non-HTML, le fichier est ensuite ramené.
  6. Sinon, le fichier n'est pas ramené.

SiteSucker permet d'utiliser les expressions rationnelles dans les séquences de chemin d'accès. Si l'option Utiliser les expressions rationnelles est cochée, tous les chemins sont interprétés comme expressions rationnelles. Par exemple, pour sélectionner les URL qui reprennent un blanc souligné, indiquez l'expression rationnelle suivante : ".*_.*". Les expressions sont interprétées selon ICU v3 (pour les détails, voir le ICU User Guide for Regular Expressions). Consulter Regular Expressions Reference pour plus de conseils sur l'utilisation des expressions rationnelles.