Limitações
O SiteSucker é um programa relativamente simples e possui várias limitações.
O SiteSucker examina apenas CSS e HTML para URLs. Quando o SiteSucker analisa HTML, ele pesquisa URLs no atributo style e nas seguintes tags:
<a>
<area>
<audio>
<base>
<body>
<embed>
<form>
<frame>
<iframe>
<img>
<input>
<link>
<meta>
<object>
<script>
<source>
<style>
<table>
<tbody>
<td>
<tfoot>
<th>
<thead>
<tr>
<track>
<video>
Se um link é especificado em qualquer outra seção em um arquivo HTML, o SiteSucker não vai vê-lo.
O SiteSucker ignora totalmente o JavaScript. Nenhum URL especificado em JavaScript será visualizada pelo SiteSucker e não será transferida. (O SiteSucker incluirá um aviso no arquivo de registro para qualquer página que use JavaScript se a opção Registro de avisos estiver ativada nos ajustes de Registro.) Se o JavaScript estiver incorporado ao texto HTML, você poderá extrair URLs do JavaScript usando o ajuste Padrões nos ajustes da página da web.
O SiteSucker ignora a maioria dos formulários, embora transfira o URL da ação
de uma tag form
e o URL src
de uma tag input
, e você pode usar o navegador para enviar formulários. Consulte Sites Protegidos por Senha para obter mais informações.
O SiteSucker não pode transferir vídeos. Consulte Perguntas e respostas frequentes para obter mais informações.
Por padrão, todos os diretórios ou arquivos não permitidos por exclusões de robô não serão transferidos pelo SiteSucker. Consulte Exclusões de Robô para mais informações.
O SiteSucker coleta uma grande quantidade de informações ao transferir um site. Quando o site é muito grande, o SiteSucker pode esgotar toda a memória disponível antes que todo o site seja transferido. Ao transferir um site muito grande, você também corre o risco de ficar sem espaço de armazenamento ou ser restringido pelas limitações do sistema de arquivos.