Home · Kontakt · Impressum
contents index previous up next
Next: 20.5 Die Tastatur Up: 20.4 Internet Previous: 20.4 Internet

Unterabschnitte



20.4.1 wget

Jeder kennt sicherlich das Problem eine große Datei herunterzuladen. Gerade wenn man bei 99,99% angekommen ist, bricht der Download ab und man muß wieder von vorne beginnen. Das Kommandozeilentool wget ermöglicht einen abgebrochenen Download wieder aufzunehmen. Und nicht nur das. Auch komplette Seiten mit Bildern und sogar ganze Homepages können zum Offline-Lesen heruntergeladen werden. Da es über die Shell gestartet wird, steht einer zeitgesteuerten Nutzung mit den Dämonen atd (13.1) und crond (13.2.1) auch nichts im Wege. So kann wget als Download-Manager wie auch als Offline-Reader eingesetzt werden.

wget [OPTIONEN] [URL]

GNU Wget unterstützt die Protokolle HTTP, HTTPS, und FTP sowie die Arbeit mit HTTP Proxies.

Optionen
-V Version (--version)
-b Arbeitet im Hintergrund (--background)
-c Abgebrochenen Download wieder aufnehmen ( --continue)
-r Folgt den Links (--recursive)
-k Konvertiert Links um fürs Offline-Lesen (--convert-links)
-p Alle Elemente (z. B. Bilder) einer Webseite werden ebenfalls heruntergeladen (--page-requisites)
-l TIEFE Gibt die Tiefe der Verfolgung an (--level=TIEFE)
-m Erstellt exakte Kopie der Seite (--mirror)
-H Folgt auch Links zu anderen Hosts (--span-hosts)
-np Folgt nicht den Links ins Elternverzeichnis (--no-parent)
-t VERSUCHE Anzahl der Downloadversuche (--tries=Versuche)
-A MUSTER Lädt nur Dateien, die das MUSTER enthalten (--accept MUSTER)
 

20.4.1.1 Beispiele

20.4.1.1.1 Download abgebrochen

Sie wollen die große Datei http://www.fibel.org/download/lfo-0.4.pdf (1,5 MB) herunterladen.
wget http://www.fibel.org/download/lfo-0.4.pdf
Bricht der Download ab, können Sie durch Eingabe des gleichen Befehle den Download fortsetzen.
wget http://www.fibel.org/download/lfo-0.4.pdf
Explizit können Sie wget mit der Option -c dazu auffordern, den Rest einer Datei zu laden.
wget -c http://www.fibel.org/download/lfo-0.4.pdf
Dabei schaut wget nach, ob eine Datei lfo-0.4.pdf existiert und beginnt dann den restlichen Teil vom Server zu laden. Dies funktioniert natürlich nur bei Servern, die dies auch unterstützen.

20.4.1.1.2 Download über schlechte Leitung

Bei einer schlechten Leitung erfordert es oft mehrere Versuche um eine Datei komplett herunterzuladen. Daher kann wget angewiesen werden, den Download öfter zu versuchen.
wget -t 45 http://www.fibel.org/download/lfo-0.4.pfd.org

20.4.1.1.3 Download einer Seite inklusive Bilder

Wollen Sie nicht nur die reine HTML-Seite herunterladen, sondern auch alle anderen Elemente, die zur Darstellung dazugehören, dann kommt der Schalter -p ins Spiel.
wget -p http://www.fibel.org/index.html

20.4.1.1.4 Offline-Version einer Homepage erstellen

Sie haben im Netz eine interessante Webpräsenz entdeckt und wollen diese mit ihrer gesamten Struktur auf Ihrer Platte speichern. Das erreichen Sie durch folgenden Befehl:
wget -rkpl 5 http://www.oleswelt.de/rezepte/
Das -r sorgt dafür, daß auch die verlinkten Seiten heruntergeladen werden. Über wie viele Webseiten den Links gefolgt werden soll, kann mit dem Schalter -l und der Angabe der Tiefe geregelt werden. Der Schalter -k sorgt dafür, daß absolute Links in relative Links umgewandelt werden. Wurde die Seite nicht mit heruntergeladen, so wird ein absoluter Link mit mit Protokoll und Domain-Name (z. B. aus apfelmus.html wird http://www.oleswelt.de/rezepte/apfelmus.html) erzeugt.

20.4.1.1.5 Spiegelung einer Homepage erstellen

Eine Spiegelung (Mirror) ist eine exakte Kopie einer Homepage um sie zusätzlich auf einem oder mehreren Servern anzubieten. Dies erfolgt in der Regel um die Last bei stark frequentierten Webpräsenzen zu verteilen.
wget -m 5 http://www.oleswelt.de/rezepte/
Entspricht den Schaltern -r -N -l inf -nr.

20.4.1.1.6 Nur bestimmte Dateien herunterladen

Um z. B. nur die JPEG-Bilder aus einem FTP-Server-Verzeichnis herunterzuladen, kommt der Schalter -A ins Spiel.
wget -rl 1 -np -A .jpg,.jpeg ftp://ftp.heidibilder.de/pic/


contents index previous up next
Next: 20.5 Die Tastatur Up: 20.4 Internet Previous: 20.4 Internet
  © 2004 by IT-Dozent Ole Vanhoefer · Zum Seitenanfang