Quizá en alguna ocasión hayamos pensado en cómo podríamos descargar una web entera. La verdad es que resulta sencillísimo con la herramienta wget de GNU/Linux. Abre un terminal y escribe lo siguiente (donde www.example.com debe ser sustituído por la web que desees descargar):

wget -rkp -l6 -np -nH -N http://www.example.com/

A continuación explicaré un poco qué hace cada opción:

  • -rkp indica a wget que la descarga sea recursiva, descargando la página que haya tras cada link. Pero… ¿la recursividad no podría hacer que descargásemos medio internet?, pues no porque para ello está la siguiente opción:
  • -l6 hace que la recursividad sólo descienda 6 niveles. Para permitir llegar a X niveles habría que poner -lX.
  • -np es para evitar la recursión hacia atrás.
  • -nH hace que wget descargue todo en el directorio actual, sin crear directorios Host.
  • -N, por último, le indica a wget que utilice time-stamping. Esto sirve para intentar evitar que un mismo archivo se descargue varias veces (en webs dinámicas suele ocurrir frecuentemente).

Resulta curioso, ¿verdad?. Con este sencillo comando podremos hacer copias de seguridad de cualquier web, para podre visualizarlas después sin conexión a internet.

Espero que os resulte útil.

(Visto aquí)