Limitations

SiteSucker est un programme relativement simple et présente quelques limitations.

SiteSucker n'examine que le CSS et le HTML pour les URL. Lorsque SiteSucker analyse du HTML, il recherche les URL dans les attributs de style et dans les balises suivantes :

  • <a>
  • <area>
  • <audio>
  • <base>
  • <body>
  • <embed>
  • <frame>
  • <iframe>
  • <img>
  • <input>
  • <link>
  • <meta>
  • <object>
  • <script>
  • <source>
  • <style>
  • <table>
  • <tbody>
  • <td>
  • <tfoot>
  • <th>
  • <thead>
  • <tr>
  • <track>
  • <video>

Si un lien est spécifié ailleurs dans le fichier HTML, SiteSucker ne le verra pas.

SiteSucker ignore totalement le JavaScript. Tout lien repris dans du JavaScript ne sera pas vu par SiteSucker et ne sera pas ramené. (Si l'option Enregistrer les avertissements est activée dans les paramètres, SiteSucker va reprendre un avertissement dans le journal de bord pour toute page qui utilise du JavaScript.)

A priori, tout répertoire ou fichier interdit par exclusion de robot ne sera pas ramené par SiteSucker. Voir les Exclusions de robot pour plus d'information.