Page 1 of 1

Login-Seiten mit wget runterladen

Posted: 06. Aug 2008 18:20
by wittmann
Hallo,

ich würde gerne automatisiert einen Login auf die Seite http://www.lokalisten.de machen. Wenn man auf die Seite raufgeht, erfolgt ein redirect auf die Seite "http://www.lokalisten.de/web/showHome.do" .
Ich bin mittels zweier Shell befehle vorgegangen:

1.) wget --save-cookies=cookie.txt --keep-session-cookies --post-data "j_username=peter&passwd=mueller" http://www.lokalisten.de/web/showHome.do
und
2.) wget --referer= http://www.lokalisten.de/web/showHome.do --cookies=on --load-cookies=cookie.txt --keep-session-cookies --save-cookies=cookie.txt http://www.lokalisten.de/web/showuser/s ... ntId=48406

Der erste Befehl soll die Cookies auslesen und für den 2. Befehl bereitstellen. Der 2. Befehl soll eine Seite, die man nur als angemeldeter Nutzer sieht downloaden.

Heruntergeladen wird aber immer nur die Login-Page. Kann jemand sagen, wie man einen solchen automatisierten Login hinkriegt ? Tipps / Infos / andere Howtos im Netz wären sehr nett.

Gruß

Michael

Posted: 06. Aug 2008 21:14
by Janka
Die Seite benutzt ziemlich viel Javascript. Funktioniert sie überhaupt, wenn du in deinem normalen Browser Javascript mal abschaltest?

Janka

Posted: 07. Aug 2008 10:59
by wittmann
Dank dir für Feed Back...

also die Seite funktioniert auch ohne Javascript, wenn auch nicht in vollem Umfang. Man kann sich auch einloggen.

Was ist genau das Prob mit Javascript ?

Posted: 07. Aug 2008 12:34
by Janka
Wenn die Seite Javascript benutzt, um zum Beispiel einige Felder beim Drücken auf den Login-Knopf vorzubelegen, könnte es sein, dass man sich ohne nicht korrekt einloggen kann. Und wget kann ja kein Javascript.

Aber das hast du ja jetzt überprüft.

Janka

Posted: 07. Aug 2008 16:07
by Scory
Das funktioniert so nicht - Du sendest die Post-Daten an die falsche Seite. Du mußt die Login-Daten an das Formular senden, welches im <Form>-Tag als "action=..." angegeben ist - und das ist nicht die Hauptseite, sondern das Script "/j_security_check" (s. Quellcode Deiner Seite).

Außerdem sendest Du die falschen Daten, die input-Felder heißen "j_username" (das ist das richtige Feld in Deinem Request), und "j_password" (das ist falsch bei Dir, Du nennst es "passwd").

Falls aber das Login-Script auch den HTTP_REFERER abfragt, hast Du so gut wie keine Chance.

Posted: 07. Aug 2008 18:33
by Janka
Den HTTP_REFERER gibt der Browser vor. Das kann wget simulieren.

Janka

Posted: 08. Aug 2008 17:44
by wittmann
Danke erstmal für die shnellen Infos ... !

ich habs jetzt wie folgt versucht:
wget --save-cookies=cookie.txt --keep-session-cookies --post-data "j_username=meinuser&j_password=meinpassed" http://www.lokalisten.de/j_security_chec
und dann
wget --referer=http://www.lokalisten.de/j_security_check --cookies=on --load-cookies=cookie.txt --keep-session-cookies --save-cookies=cookie.txt http://www.lokalisten.de/web/showuser/s ... ntId=48406
Aber es fruchtet nicht... Schätze das ich an Javascript nicht vorbeikomm. Gibt es eventuell andere Mechanismen / Möglichkeiten um Javascript auszuhebeln ? Mechnize -Modul unter Python ?

Danke nochmal + schönes WE

Gruß

MIchael

Posted: 08. Aug 2008 21:44
by Scory
Du bist so grausam oberflächlich, dass ich keine Lust mehr habe - mein letzter Hinweis:

> http://www.lokalisten.de/j_security_chec

Da fehlt ein 'k' am Ende.