- Registriert
- 19 Sep. 2007
- Beiträge
- 1.363
Hallo
Als HiWi bekommt man ja auch manchmal sehr undankbare Aufgaben.
Ich soll von einer Webseite sehr viele (so 5000) Dokumente herunterladen.
Nach etwas Suchen und Fragen, auch hier im Forum wurde mir der Tipp mit cURL gegeben.
Mein erster Versuch auf dem RaspberryPi schlug fehl,
daher hier nochmal ordentlich zusammengefasst und im richtigen Forum:
Von der URL: https://www.regelleistung.net/ext/data
sollen tägliche Datensätze (also beide Datumsfelder den selben Tag) für mindestens ein Jahr heruntergeladen werden.
Dann das Ganze noch für jeden ÜBN und jede Datenart.
Der POST Request (hier als GET Ausgabe) sieht wie folgt aus:
Mit cURL bekomme ich immer nur Fehlermeldung: couldn´t connect to host.
Bin mir aber auch nicht sicher ob die Schreibweise so richtig ist:
Ist hier vielleicht jemand, der sich damit auskennt und mir weiterhelfen kann?
Wenn das mit einer Zeile funktioniert und das Dokument gespeichert wird,
würde ich einfach die benötigten Zeilen mit Ecxel oder nem Editor erstellen
und dann abarbeiten lassen.
Die berechtigte Frage, warum ich dort nicht anfrage und um die Daten Bitte:
Das wurde schon gemacht.
Aber, da es sich bei der Veröffentlichung dieser Daten nicht um eine Herzensangelegenheit der Netzbetreiber,
sondern um eine gesetzliche Verpflichtung handelt,
fühlte sich wohl erst keiner zuständig und dann wurde nur noch auf die "transparente Internetseite" verwiesen.
Daher muss jetzt der HiWi ran...
Gruß Kolja
Als HiWi bekommt man ja auch manchmal sehr undankbare Aufgaben.
Ich soll von einer Webseite sehr viele (so 5000) Dokumente herunterladen.
Nach etwas Suchen und Fragen, auch hier im Forum wurde mir der Tipp mit cURL gegeben.
Mein erster Versuch auf dem RaspberryPi schlug fehl,
daher hier nochmal ordentlich zusammengefasst und im richtigen Forum:
Von der URL: https://www.regelleistung.net/ext/data
sollen tägliche Datensätze (also beide Datumsfelder den selben Tag) für mindestens ein Jahr heruntergeladen werden.
Dann das Ganze noch für jeden ÜBN und jede Datenart.
Der POST Request (hier als GET Ausgabe) sieht wie folgt aus:
Code:
https://www.regelleistung.net/ext/data/?from=27.10.2015&to=27.10.2015&download=true&_download=on&tsoId=4&dataType=MRL
Mit cURL bekomme ich immer nur Fehlermeldung: couldn´t connect to host.
Bin mir aber auch nicht sicher ob die Schreibweise so richtig ist:
Code:
curl --data "from=27.10.2015&to=27.10.2015&download=true&_download=on&tsoId=4&dataType=MRL" https://www.regelleistung.net/ext/data/
Ist hier vielleicht jemand, der sich damit auskennt und mir weiterhelfen kann?
Wenn das mit einer Zeile funktioniert und das Dokument gespeichert wird,
würde ich einfach die benötigten Zeilen mit Ecxel oder nem Editor erstellen
und dann abarbeiten lassen.
Die berechtigte Frage, warum ich dort nicht anfrage und um die Daten Bitte:
Das wurde schon gemacht.
Aber, da es sich bei der Veröffentlichung dieser Daten nicht um eine Herzensangelegenheit der Netzbetreiber,
sondern um eine gesetzliche Verpflichtung handelt,
fühlte sich wohl erst keiner zuständig und dann wurde nur noch auf die "transparente Internetseite" verwiesen.
Daher muss jetzt der HiWi ran...
Gruß Kolja