Requête

Request

L'écran Requête reprend les paramètres suivants :

Identifiant

Utiliser cette option pour paramétrer la séquence d'agent utilisateur que SiteSucker fournit pour s'identifier lui-même lors des requêtes HTTP. Certains sites sont très précis quant aux navigateurs qu'ils acceptent. Cette option peut servir à faire croire au site que SiteSucker est un navigateur reconnu.

Pour modifier l'identifiant de SiteSucker, cliquer sur cette option et sélectionner un des navigateurs Web repris dans la liste. Si Web View est sélectionné, la séquence d'agent utilisateur prédéfinie dans le Web View sera reprise dans toutes les requêtes. C'est le même web view que celui utilisé dans l'option Ramener à l’aide de Web Views dans les paramètres de Page Web.

Essais

Utiliser cette option pour indiquer le nombre de fois que SiteSucker doit essayer de ramener un fichier. SiteSucker ne va réessayer de ramener un fichier que si survient une erreur de dépassement de délai, connexion réseau, trop de requêtes (429), mauvaise passerelle (502) ou délai de passerelle dépassé (504).

Délai limite (secondes)

Utiliser cette option pour sélectionner le temps que SiteSucker doit attendre une réponse du serveur.

Délai (secondes)

Utiliser cette option pour indiquer le temps minimum que SiteSucker doit attendre entre les requêtes HTTP à un même hôte. Cette option permet à SiteSucker d'utiliser moins de bande passante et d'éviter les garde-fous anti-mines employés par certains sites.

Si un intervalle de navigation Crawl-delay est déjà imposé dans le fichier robots.txt du site, le plus long des deux délais va être utilisé. Voir Exclusions de robot pour plus d'information concernant le fichier robots.txt.