Como usar o WGET no Linux

O WGET é uma ferramenta poderosa no Linux para baixar arquivos da web via linha de comando. Suporta downloads recursivos, autenticação, limite de velocidade, proxies e muito mais, sendo ideal para automação e backup de sites

Como usar o WGET no Linux

Introdução

O wget é uma ferramenta de linha de comando poderosa para baixar arquivos da internet no Linux. Ele suporta downloads simples, downloads recursivos, autenticação, uso de proxies, limitação de velocidade e muito mais. Se você precisa automatizar downloads ou baixar sites inteiros para navegação offline, o wget é a solução ideal.

Neste guia, você aprenderá como usar o wget para diversas tarefas, desde as mais simples até as mais avançadas, com exemplos práticos de comandos.

1. Instalando o WGET

Antes de começar, verifique se o wget está instalado no seu sistema:

wget --version

Se não estiver instalado, use um dos comandos abaixo para instalá-lo:

Ubuntu/Debian:

sudo apt update && sudo apt install wget

CentOS/RHEL:

sudo yum install wget

Arch Linux:

sudo pacman -S wget

2. Download de Arquivos Simples

Para baixar um arquivo de uma URL específica:

wget https://exemplo.com/arquivo.zip

Isso salvará o arquivo no diretório atual.

3. Download Recursivo

Para baixar um diretório completo de um site:

wget -r https://exemplo.com/

Isso baixará todos os arquivos e subdiretórios encontrados no site.

4. Download em Segundo Plano

Para executar o download em background:

wget -b https://exemplo.com/arquivo.zip

Isso criará um arquivo wget-log com o progresso.

5. Reinício de Downloads Interrompidos

Se o download for interrompido:

wget -c https://exemplo.com/arquivo.zip

Isso evita a necessidade de baixar o arquivo do zero.

6. Baixar Múltiplos Arquivos de uma Lista

Crie um arquivo lista.txt com as URLs e execute:

wget -i lista.txt

Isso baixará todos os arquivos listados.

7. Download com Autenticação

Para baixar arquivos protegidos por login:

wget --user=usuario --password=senha https://exemplo.com/arquivo.zip

8. Download de Sites Inteiros (Espelhamento)

Para copiar um site inteiro:

wget --mirror -p --convert-links -P pasta_destino https://exemplo.com/

9. Definição de Limite de Velocidade

Para limitar a taxa de download:

wget --limit-rate=100k https://exemplo.com/arquivo.zip

10. Download com User-Agent Personalizado

Para simular um navegador:

wget --user-agent="Mozilla/5.0" https://exemplo.com/arquivo.zip

11. Download via Proxy

Se estiver atrás de um proxy:

wget -e use_proxy=yes -e http_proxy=http://proxy.com:8080 https://exemplo.com/arquivo.zip

12. Acesso a Páginas com Cookies

Para autenticar sessões antes do download:

wget --load-cookies=cookies.txt https://exemplo.com/arquivo.zip

13. Definir Número de Tentativas

Para aumentar o número de tentativas:

wget --tries=10 https://exemplo.com/arquivo.zip

14. Download Agendado via Cron

Edite o crontab:

crontab -e

E adicione:

0 2 * * * wget -c https://exemplo.com/arquivo.zip -O /caminho/arquivo.zip

Isso fará o download automaticamente todos os dias às 2h da manhã.

15. Conversão de Links para Uso Offline

Para garantir que os links internos funcionem:

wget --convert-links -r https://exemplo.com/

16. Baixar Apenas Arquivos Específicos

Para baixar apenas imagens JPEG e PNG:

wget -r -A "*.jpg,*.png" https://exemplo.com/

17. Definir Tempo Entre Requisições

Para evitar bloqueios em acessos rápidos:

wget --wait=5 --random-wait -r https://exemplo.com/

18. Baixar Arquivos Protegidos por Captcha

um site exigir captcha, use um navegador para obter a URL direta e então utilize:

wget https://exemplo.com/arquivo-direto.zip

19. Log de Download

Para salvar um log detalhado:

wget -o log.txt https://exemplo.com/arquivo.zip

20. Parar e Retomar um Download com WGET

Para pausar um download, pressione CTRL + C e depois retome com:

wget -c https://exemplo.com/arquivo.zip

Conclusão

O wget é uma ferramenta essencial para quem trabalha com Linux e precisa gerenciar downloads de maneira eficiente. Com ele, você pode baixar arquivos de forma simples ou complexa, automatizar tarefas, evitar bloqueios e otimizar sua conexão.

Agora que você domina o wget, experimente diferentes opções para adaptar os downloads às suas necessidades! ?


FAQ

Pergunta e respostas frequentes sobre o conteúdo.

O WGET é uma ferramenta de linha de comando usada para baixar arquivos da internet no Linux.

Use o comando `sudo apt update && sudo apt install wget`.

Execute `wget --version` no terminal.

Use `wget URL_DO_ARQUIVO`.

Use `wget -r URL_DO_SITE`.

Use `wget -c URL_DO_ARQUIVO`.

Crie um arquivo com URLs e execute `wget -i lista.txt`.

Use `wget --user=usuario --password=senha URL`.

Use `wget --mirror -p --convert-links -P pasta URL`.

Use `wget --limit-rate=100k URL`.

Use `wget -e use_proxy=yes -e http_proxy=http://proxy.com:8080 URL`.

Use `wget --load-cookies=cookies.txt URL`.

Use `wget --tries=10 URL`.

Adicione `0 2 * * * wget -c URL -O /caminho/arquivo` no crontab.

Use `wget --convert-links -r URL`.

Use `wget -r -A "*.jpg,*.png" URL`.

Use `wget --wait=5 --random-wait -r URL`.

Use `wget -o log.txt URL`.

Pause com `CTRL + C` e retome com `wget -c URL`.

Use `wget --user-agent="Mozilla/5.0" URL`.

Use `wget -r --no-parent URL`.

Use `wget -nc URL`.

Use `wget -P /caminho/destino URL`.

Use `wget -N URL`.

Use `wget -R "*.gif,*.exe" URL`.

Use `wget --timeout=30 URL`.

Use `wget -4 URL` para IPv4 e `wget -6 URL` para IPv6.

Compare seu hash com `sha256sum arquivo`.

Use `wget --no-check-certificate URL`.

Use `wget --timestamping URL`.


Giancarlo Gil Ottaviani Raduan
Me pague um café no NuBank do Giancarlo Gil Ottaviani Raduan

Especialista linux, desenvolvedor web full-stack, PHP no sangue, graduando em Direito, pai da Lais e esposo da Simone


Talvez você goste destes outros tutoriais