URL
Os ajustes de URL oferecem opções que afetam as URLs e fornecem uma maneira de especificar quais URLs devem ser incluídas ou apagadas da transferência.
O painel URL da caixa de diálogo Ajustes fornece os seguintes controles:
Verificar todos os links
Marque esta caixa para que o SiteSucker verifique todos os links em todos os arquivos HTML transferidos — incluindo links para arquivos que você não está transferindo — e registrar quaisquer erros que ocorram. Com esta opção ativada, o SiteSucker pode relatar muitos erros que você normalmente não veria. Esta definição destina-se como uma ferramenta de depuração para web designers que querem ver se os seus próprios sites têm quaisquer links ruins.
Para minimizar o tempo que leva para verificar todos os links, defina o ajuste Filtro nos ajustes Tipo de Arquivo para Permitir tipos de arquivo específicos sem nada marcado fazendo com que apenas HTML e CSS são transferidos, e defina o ajuste Modificação de arquivo nos ajustes Geral como Apagar depois de analisar, que vai apagar arquivos HTML e CSS depois de serem transferidos e analisados.
Verificar comentários para URLs
Marque esta caixa para que o SiteSucker verifique comentários de URLs. Normalmente, o SiteSucker ignora comentários. Essa opção é útil quando as etiquetas são incluídas nos comentários para que elas possam ser usadas pelo Internet Explorer ou JavaScript.
Tratar URLs ambíguos como pastas
Marque esta caixa para que o SiteSucker trate URLs ambíguas como pastas. Se uma URL não terminar com ‘/’ ou uma extensão de arquivo, o SiteSucker vai considerá-la como ambígua. Por exemplo, se essa opção estiver habilitada e o SiteSucker fizer a transferência de uma página da web de https://www.example.com/directory
, a página será salva em www.example.com/directory/index.html
na pasta de destino. Se esta opção estiver desabilitada, a página da web será salva em www.example.com/directory.html
na pasta de destino. Consulte Nomes de Arquivo para obter mais informações sobre como o SiteSucker nomeia arquivos transferidos.
Transferir links em PDFs
Marque esta caixa para que o SiteSucker transferir os arquivos vinculados a documentos PDF, se permitido por outras configurações. Como os links de PDF não podem ser localizado, os próprios documentos PDF nunca são modificados.
Restrição de URL
Marque esse controle para limitar os arquivos transferidos de um site específico, de um diretório específico ou de uma URL específica. Esta opção funciona em conjunto com os ajustes Incluir e Excluir URL e os ajustes Geral. O SiteSucker fornece as seguintes restrições de URL:
- Nenhum - O SiteSucker transfere o arquivo especificado na caixa de texto URL da Web e todos os arquivos associados à ele e cada site vinculado à esses arquivos, etc. Fique atento, porque esta opção pode resultar em uma transferência ENORME se for autorizado a continuar para sempre.
-
Domínio - O SiteSucker limita a transferência desses arquivos no domínio do arquivo original que está sendo transferido. Por exemplo, se a URL da Web é
https://www.example.com/directory/home.html
, esta definição limita a transferência para essas URLs que começam comhttp://www.example.com
ouhttps://www.example.com
. - Domínio + 1 - O SiteSucker limita a transferência aos arquivos no domínio do arquivo original que está sendo transferido (assim como a opção Domínio), mais um nível de arquivos de outros domínios vinculados ao domínio original.
-
Subdomínios - O SiteSucker limita a transferência desses arquivos dentro do domínio de segundo nível e todos os subdomínios do arquivo original que está sendo transferido. Ampliando o exemplo anterior, esta definição vai transferir URLs que começam com
http://www.example.com
,https://images.example.com
,http://guide.example.com
, ouhttps://example.com
. -
Diretório - O SiteSucker transfere apenas os arquivos que estão dentro do diretório do arquivo original que está sendo transferido. Por exemplo, se você estiver transferindo
https://www.example.com/directory/home.html
ouhttps://www.example.com/directory/
usando este ajuste, o SiteSucker vai transferir apenas os arquivos no diretóriodiretório
. Mas se você estiver transferindohttps://www.example.com/directory
, o SiteSucker vai transferir todos os arquivos dewww.example.com
a menos que o ajuste Tratar URLs ambíguas como pastas esteja ativado, sendo assim, o SiteSucker vai transferir apenas os arquivos no diretóriodiretório
. - Ajustes de URL - O SiteSucker apenas transfere o arquivo especificado na caixa de texto URL e quaisquer arquivos que tenham URLs permitidas pelos ajustes de URL Incluir e Excluir.
Ajustes de Incluir e Excluir URLs
Os ajustes Incluir e Excluir URL trabalha em conjunto com o ajuste Restrição de URL e os ajustes Geral de acordo com as seguintes regras:
- Se esta for a URL original (ou seja, a URL especificada na caixa de texto URL), o arquivo será transferido.
- Se a URL começar com uma das strings ou corresponder a uma das expressões regulares na tabela Excluir, o arquivo não será transferido.
- Se a URL atender aos requisitos do ajuste atual de Restrição de URL, a transferência do arquivo poderá ser feita.
- Se a URL começar com uma das strings ou corresponder a uma das expressões regulares na tabela Incluir, a transferência do arquivo poderá ser feita.
- Se a opção Sempre transferir HTML e CSS nos ajustes Geral estiver ativada e a URL fizer referência a um tipo de arquivo HTML ou CSS, o arquivo terá permissão para ser transferido.
- Se a opção Incluir arquivos de suporte nos ajustes Geral estiver ativada e a URL fizer referência a um tipo de arquivo não HTML, o arquivo será transferido.
- Caso contrário, o arquivo não será transferido.
Por fim, um arquivo que tenha uma URL permitida pelos ajustes de URL apenas será transferido se as exclusões de robôs, ajustes de Limite e os ajustes de Tipo de arquivo permitem a transferência.
Nessas tabelas, inserir URLs absolutas (isto é, começando com URLs http://
ou https://
) ou padrões de expressões regulares. URLs devem ser inseridas como aparecem no campo de endereço e de pesquisa do Safari, ou seja, sem codificação, exceto para caractere ISO-8859-1 extendido e caractere de espaços (que são codificados como %20
).
Ao usar expressões regulares, o padrão deve corresponder a URL inteira. Por exemplo, para corresponder a qualquer URL que contenha “logout
”, insira a expressão regular “.*logout.*
”. A sintaxe padrão atualmente suportada é aquela especificada pelo ICU, descrita em Expressões regulares - Documentação da ICU.
Para adicionar uma linha para a tabela, clique no botão , digite o URL ou padrão, e pressione ↩.
Para remover linhas da tabela, selecione-as na tabela e clique no botão .
Para modificar uma linha, dê dois cliques em uma sequência na tabela, digite uma nova sequência, e pressione ↩.