index.html übergehen

Post Reply
Message
Author
Kunigunde

index.html übergehen

#1 Post by Kunigunde »

Hi all!

Ich habe eine Frage zum Internet.
Wenn man eine Seite findet die bei T-Online gehostet ist, dann ist die Homepage-URL meist folgendermaßen aufgebaut:
http://home.t-online.de/home/<name>/
Wenn sich nun eine Datei mit dem Namen "index.htm" oder "index.html" in diesem "Verzeichnis" befindet, so wird diese Datei automatisch geladen und man kann nicht das Verzeichnis an sich sehen.

Nun möche ich jedoch von dieser URL alle Seiten und Bilder downloaden. Deswegen muß ich auf sämtliche Links klicken, die bei index.html erscheinen, gucken ob dort weitere Links sind, die dort gehostet sind, alle Bilder einzeln abspeichern, etc.

Gibt es irgendeine Möglichkeit index.html zu übergehen und so ins "Verzeichnis" zu wechseln?
Oder kann man sich dort per FTP als Anonymous einloggen?
Immerhin komm ich doch an die Dateien so oder so dran (sie sind ja nicht bzgl. des Lesezugriffs geschützt), warum sollte ich sie dann nicht auch alle auf einmal sehen können?

Peter

Re: index.html übergehen

#2 Post by Peter »

Wenn ich dich richtig verstanden habe, solltest du dir mal wget reinziehen, damit kann man http && ftp Seiten rekursiv runterladen, es besteht auch eine Option alles bis zu einer bestimmten Link-Tiefe zu holen... Hier der Link auf die Docu:
http://www.gnu.org/manual/wget/html_mono/wget.html

pwk.linuxfan

Jochen

Re: index.html übergehen

#3 Post by Jochen »

wget ist dabei auch Deine einzige Möglichkeit. Dass Du die index.html-Datei erhältst, wird am Webserver so konfiguriert. Der könnte Dir zwar auch ein Verzechnis-Listing anbieten, aber das wollte der Admin dort halt nicht. Und man kommt tatsächlich nur drum herum, wenn man sämtlichen Links in der html-Seite folgt.

iceface
Posts: 58
Joined: 18. Jan 2001 16:02

Re: index.html übergehen

#4 Post by iceface »

Hi Kunigunde,
Alternativprogramm währe pavuk:
http://www.idata.sk/%7Eondrej/pavuk/
rene

Post Reply