Página da Web

Página da Web

A seção Página da web do diálogo Ajustes fornece os seguintes controles:

Check All Links

Marque esta caixa para que o SiteSucker verifique todos os links em todos os arquivos HTML transferidos — incluindo links para arquivos que você não está transferindo — e registrar quaisquer erros que ocorram. Com esta opção ativada, o SiteSucker pode relatar muitos erros que você normalmente não veria. Esta definição destina-se como uma ferramenta de depuração para web designers que querem ver se os seus próprios sites têm quaisquer links ruins.

Para minimizar o tempo que leva para verificar todos os links, defina o ajuste Filtro nos ajustes Tipo de Arquivo para Permitir Tipos de Arquivos Específicos sem nada marcado fazendo com que apenas HTML e CSS são transferidos.

Verificar comentários para URLs

Marque esta caixa para que o SiteSucker verifique comentários de URLs. Normalmente, o SiteSucker ignora comentários. Essa opção é útil quando as etiquetas são incluídas nos comentários para que elas possam ser usadas pelo Internet Explorer ou JavaScript.

Incluir arquivos suportados

Marque esta caixa para que o SiteSucker inclua arquivos suportados na transferência. Quando esta opção está ativada, o SiteSucker fará a transferência de arquivos que não sejam HTML (tais como folhas de estilo, imagens, etc), mesmo que não sejam permitidos pelo atual Ajustes de Caminhos ou quando o Número Máximo de Níveis em Ajustes de Limites é excedido. Essa configuração é útil ao transferir sites vinculados a folhas de estilo, imagens ou outros arquivos de suporte que estão em domínios ou subdomínios separados.

Transferir usando visualizações web

Marque esta caixa para que o SiteSucker transfira HTML utilizando visualizadores web ocultos. Quando esta opção está ativada, o SiteSucker irá carregar cada arquivo HTML em uma visualização web oculta e então extrair o HTML da visualização web depois que a página é carregada. Isso pode ser útil se o arquivo usa JavaScript para modificar o HTML quando a página está sendo carregada ou se o arquivo é um arquivo XML que pode ser convertido em HTML pela visualização web.

Intervalo ao Salvar (segundos)

se esse controle para especificar o intervalo de salvamento de uma página do site depois de supostamente ter concluído o carregamento em uma visualização web. Algumas páginas da Web podem levar mais tempo para carregar porque o seu conteúdo é gerado usando JavaScript. Este ajuste proporciona tempo adicional para páginas da web concluírem o carregamento antes de serem salvas. Este controle é ativado apenas se o ajuste Transferir Usando Visualizações Web estiver ativado.

Codificação de texto

Use este controle para especificar a codificação de texto para páginas da web. O SiteSucker vai ler e salvar todas as páginas da web usando a codificação de texto especificada. Se definiu como Padrão, o SiteSucker tentará detectar a codificação de texto da página da web. Esse ajuste é ignorado ao ler ou salvar páginas da web que foram transferidas anteriormente.


Atributos de dados personalizados

Use a tela Atributos de dados personalizados para especificar atributos de dados personalizados que o SiteSucker deve procurar por URLs. Introduzido no HTML5, os atributos de dados personalizados armazenam informações extras, geralmente para o JavaScript da página, em tags HTML padrão. Os nomes dos atributos de dados começam com data- e não contêm caracteres maiúsculos.

Atributos de dados personalizados

Se você tocar no botão Editar na tela Atributos de dados personalizados, o SiteSucker vai exibir uma barra de ferramentas com os seguintes botões:

Apagar Apagar

Apaga os atributos de dados personalizados selecionados.

Editar Editar

Permite editar o atributo de dados personalizados selecionado.

Adicionar Adicionar

Permite adicionar um novo atributo de dados personalizado.


Padrões

Use a tela Padrões para especificar expressões regulares para substituir o texto em arquivos HTML ou extrair URLs do texto HTML.

Padrões

Para substituir textos em arquivos HTML, defina Tipo de Modelo para Substituição e insira um padrão de pesquisa e um modelo de substituição para o texto que deseja substituir. Se for encontrado um texto que corresponda ao padrão de busca, ele é alterado de acordo com o modelo de substituição. O modelo especifica o que deve ser usado para substituir cada string, com a referência reversa $0 representando o texto correspondido, $1 representando o conteúdo do primeiro grupo de captura, e assim por diante. Para apagar o texto correspondente, insira um modelo em branco.

Para extrair URLs do texto HTML, defina o Tipo de Modelo para URL, insira um padrão de pesquisa e um modelo de URL que especifica a URL que o SiteSucker deve transferir. O modelo de URL será ignorado se resultar em uma URL em branco ou uma URL idêntica ao modelo.

Esses padrões de busca são aplicados antes que o SiteSucker verifique os arquivos HTML em busca de URLs. Os padrões de busca são aplicados na ordem em que aparecem na lista e a ordem dos padrões de busca pode ser reorganizada arrastando-os na lista durante a edição. A sintaxe padrão atualmente suportada é a especificada pela ICU, descrita em Regular Expressions - ICU User Guide.

Como no exemplo, na imagem mostrada acima, o SiteSucker é instruído a fazer o seguinte:

  1. extrair uma URL do primeiro argumento da função javascript:openWin() e então
  2. substituir URLs que tem uma determinada cadeia de consulta com a mesma URL sem a sequência de consulta.

Se você tocar no botão Editar na tela Padrões, o SiteSucker vai exibir uma barra de ferramentas com os seguintes botões:

Apagar Apagar

Exclui os padrões selecionados.

Editar Editar

Permite editar o padrão selecionado.

Adicionar Adicionar

Permite adicionar um novo padrão.