De acordo com as Leis 12.965/2014 e 13.709/2018, que regulam o uso da Internet e o tratamento de dados pessoais no Brasil, ao me inscrever na newsletter do portal DICAS-L, autorizo o envio de notificações por e-mail ou outros meios e declaro estar ciente e concordar com seus Termos de Uso e Política de Privacidade.

wget - Conheça as opções ou então dê seus pulos!

Colaboração: Raul Libório

Data de Publicação: 25 de Julho de 2008

Dessa vez quero contar um 'causo' que aconteceu com um amigo de um amigo meu, pois é... aconteceu comigo mesmo. Conhecer as várias opções de um certo programa é as vezes difícil, já que alguns tem dezenas, mas não são úteis pra gente.

Mas o causo foi assim... Estava eu a busca de músicas de uma banda chamada "Bloc Party", quando deu um stalo na cabeça!: "Por que não procurar no site da banda?!" Assim fiz. Chegando lá, WOW!!! 63 MÚSICAS! Mas... isso siginifica baixar 63 músicas, o que não é divertido ¬¬

Solução: SCRIPT :D

Criei uma solução que tinha a seguinte função:

  1. Baixe o código-fonte da página;
  2. Remova as tags;
  3. Coloque os links para os MP3's em outra lista;
  4. Baixe os arquivos da lista.

Simples assim :)

  #!/bin/bash
  # Baixa musicas da net :D
  SITE="http://www.blocparty.net/mp3.html"
  PAGINA=$( echo $SITE | cut -f4 -d/ )
  
  rm $PAGINA
  rm lista.txt
  
  #  ------- Script
  
  # -- Baixando a pagina
  wget $SITE
  
  # -- Lipando o codigo-fonte
  for linha in $( cat $PAGINA | sed 's/>/ > \n/g;s/a href=//;s/href=//g'|cut -d'"' -f2 |sed '/[ ]/d;/.mp[3$]/!d' )
  do
        # -- Obtendo apenas os links diretos para os arquivos em MP3
        echo -e $linha | sed '/.mp3/!d;/png/d;/gif/d;/jpg/d;/download/d' >> lista.txt
  
  done
  # -- Laco pra realizar o download das musicas
  for musica in $( cat lista.txt )
  do
        wget $musica
        echo -e "\v arquivo $musica baixado com sucesso"
  done
  
  exit 0

O código-fonte desse site é bizarro, o webdesigner fez com certeza de sacanagem! Não identou o código e nem deu espaço na parte onde tinha as músicas!

Mas enfim, coloquei pra o script pra rodar e fui dormir. Quando acordei... WOW!! 63 Músicas! Fiquei super feliz!

Alguns dias depois, lendo o site do Aurélio, me deparo com um comando:

  wget -m -L http://......

Eu pensei.... será que poderia ter resolvido com um comando? Foi então que lendo com mais cuidado o HELP do 'wget' que achei essa combinação:

  wget --ignore-tags=img -r "http://www.blocparty.net/mp3.html

Faz quase a mesma coisa, a diferença é que esse ainda cria uma pasta com a url do site e guarda as músicas lá.

Lição do dia:

Se for usar algum comando em algum script, LEIA COM ATENÇÃO o seu help. Poderá encurtar seus scripts em várias linhas. (o meu caiu de 28 pra 1 linha)

Adicionar comentário

* Campos obrigatórios
5000
Powered by Commentics

Comentários

Nenhum comentário ainda. Seja o primeiro!


Veja a relação completa dos artigos de Raul Libório