martes, 1 de abril de 2008

Gestor de descargas Wget

GNU Wget es una aplicación que nos permite la descarga de archivos desde la consola. Su nombre viene de Word Wide Web y get, y permite descargas mediante los protocolos http, https y ftp. Como curiosidad, decir que está escrito en C.
Parámetros que admite:

-c posibilita el resumen de una descarga

–user-agent=”" identifica a wget como el contenido de las comillas , en este caso no envía identficador

-r descarga recursiva , además copia la estructura completa y nos la crea en el destino de la descarga

-p se combina con “-r” para que aun copiando al estructura solo lo haga desde el directorio padre en el que se inicia

–tries= , -t intentos antes de mostrar mensaje de error

–limit-rate= limita el uso de ancho de banda para la descarga

–wait= pausa entre fichero y fichero

Ejemplos:

wget –wait=20 –limit-rate=20K -r -p –user-agent=”Mozilla” -t 20 http://www.luispuente.net

Decargar una página web o un archivo
$ wget http://ubuntusur.org $ wget http://ubuntusur.org/archivo.pdf

Descargar un archivo intentando t veces, reintentando si se corta la transferencia -c, identificando un navegador normal -u, señalando no ser un robot -erobots=off.
$ wget -t 0 -c -U “Iceweasel” -erobots=off http://ubuntusur.org/archivo.pdf

Reanudar una descarga interrumpida
$ wget -c http://ubuntusur.org/archivo.pdf

Contar con mayor información de la descarga
$ wget -d http://ubuntusur.org/archivo.pdf

Descargar una página web completa (imágenes, sonido, javascript, etc.)
$ wget -p http://ubuntusur.org

Descargar todo un sitio web
$ wget -r http://ubuntusur.org

Descargar completamente un sitio y convertir los enlaces para verlos en forma local
$ wget -t 0 -c -U “Mozilla” -erobots=off -r -k http://ubuntusur.org

Descargar solamente las imagenes *.jpg de una página
$ wget -t 0 -c -U “Mozilla” -erobots=off -r -k -A *.jpg http://ubuntusur.org

Descargar desde un sitio ftp
$ wget ftp://ftp.ubuntusur.org/archivo.pdf


Más información.

No hay comentarios: