Websites als PDF "drucken"?

vert

New member
Registriert
21 Nov. 2009
Beiträge
359
Ich bin auf der Suche nach einem tool um websites als PDF auszudrucken, bevorzugt auf Linux, bzw. Multiplatform.

Theoretisch kann das ja jeder browser (crtl+P, als pdf drucken), aber Firefox produziert in 90% der Fälle völlig nutzlosen output. Teils werden die blöden frames (die aber keine frames sind, frames wären ja OK!) die inzwischen auf 99% aller websites sind auf jeder Seite gedruck und überdecken dann den Inhalt, formatierungen sind meist völlig zerschossen und unleserlich, Links sind nicht klickbar, Bilder verschwinden, das PDF ist gerne mal ein grob aufgelöstes Bild worin ich keine Text auswählen kann etc. Die einzigen Seiten wo firefox guten output produziert, sind reine HTML seiten, also ca. 0.1% des Internets.

Die Dinge die mir am wichtigsten sind, sind:

- Lesbarer output (halbwegs "schönes" Format und aller Inhalt ist da)
- Funktionierende Links (entweder klickbare links (die möglichkeit gibt pdf ja eigentlich her) oder ein konstrukt wie link(www.link.tld/foo.html) )
- irgendwo im Dokument muss der volle Link der Seite wo es herkommt drin sein

Aktuell behelfe ich mir mit Opera wo ich auf so ziemlich jeder Seite mit einem Rechtsklick "save as PDF…" angeboten komme und die ganze Seite als ein PDF speichern kann, allerdings ohne Seitenumbrüche. Würde mich prinzipiell nicht stören (ausser wenn es dann doch auf papier gedruckt werden soll), aber bei größeren Seiten stört es gerne mal meinen PDF reader. Gnome PDF mag dann z.b. nicht mehr zoomen, und wenn die ausgedruckte Seite länger ist als auf dem Bild, oder der Text kleiner, dann ist das ein Problem.
Screenshot from 2020-04-10 09-37-24.jpg
KDE Okular kann noch zoomen, scheint aber bei solchen ellenlangen PDFs gerne zu memory leaken und bringt mir das System gerne Minutenland zum hängen. Ist also auch suboptimal.

Abgesehen davon, sind links nicht klickbar oder auch sonstwie nicht erhalten (aber text ist immerhin text) und die URL fehlt.

Kennt jemand eine Lösung für das Problem?
 
Früher gab es mal ein Addon namens Fireshot, das konnte das ganz gut. Ich weiss aber nicht, ob es weiter gepflegt wird.

Gruss, maculae
 
Ist/war das nicht eher für screenshots die dir gesamte Seite abdecken? Hätte also wenn es denn PDF könnte, das gleiche Problem wie Opera. Aber ich finde das addon eh nimmer, ist also eine müßige Diskussion.
 
Um das Problem mit den zu großen Opera PDFs zu lösen? Ist halt windows only und hilft mir damit nicht wirklich weiter.
Hatte ich bei meiner Suche auch schon gefunden, aber das ist nur ein frontend für einen onlinedrucker, was ich irgendwie sinnlos finde. Noch dazu laut bewertungen eh genausoschlecht wie der defaultdrucker, also sehe ich keinen Grund das auszuprobieren.
 
Vielleicht mal mit skalieren der Websites spielen bei save as pdf im browser.. das könnte helfen.
ich hab dein problem schon begriffen aber ist schwierig darauf einzugehen.

websites verhalten sich unterschiedlich, vor allem beim drucken, manche haben extra einen stylesheet fürs drucke aber die meisten halt nicht, daher ist das ergebnis mal brauchbarer, mal weniger.
 
Und wenn Du dir einen PostScript-fähigen Druckertreiber installierst? Der hat zumindest den Vorteil, daß er die Seite so ausdrucken sollte, wie sie ist.
Bei Tools, die einen PDF-Treiber installieren wäre ich mir nicht sicher, ob diese auch noch die eine oder andere "Optimierung" durchführen. - Ohne
es allerdings aktuell ausprobiert zu haben.
 
Zuletzt bearbeitet:
Vielleicht mal mit skalieren der Websites spielen bei save as pdf im browser.. das könnte helfen.
Ja, teilweise kann ich wenn ich erstmal in "Print Preview" rumschraube minimalst noch etwas verbessern, aber der eigentliche Druckdialog bietet nix sinnvolles, bzw. wirksames.
websites verhalten sich unterschiedlich, vor allem beim drucken, manche haben extra einen stylesheet fürs drucke aber die meisten halt nicht, daher ist das ergebnis mal brauchbarer, mal weniger.
Opera ist in meinen Tests bislang IMMER brauchbar, aber hat halt keine Seitenumbrüche (und keinen Header mit der URL…). Sollte ja eigentlich kein Hexenwerk sein die Seite zu zerlegen und header (und/oder) footer einzubauen. Problematisch könnte denke ich die erkennung wo denn nun der Seitenumbruch sein soll sein, damit nicht Buchstaben halbiert werden (von Hurenkindern und Schusterjungen mal abgesehen), aber das könnte man auch lösen wenn man es einfach ignoriert, dafür aber einfach einen overlap gibt (was ja alle browser beim "scrollen" mittels Leertaste eh schon irgendwo implementiert haben).
Deswegen wundert mich warums das nicht gibt, bzw. warum ich nix zu gefunden habe.
Und wenn Du dir einen PostScript-fähigen Druckertreiber installierst? Der hat zumindest den Vorteil, daß er die Seite so ausdrucken sollte, wie sie ist.
Bei Tools, die einen PDF-Treiber installieren wäre ich mir nicht sicher, ob diese auch noch die eine oder andere "Optimierung" durchführen. - Ohne es allerdings aktuell ausprobiert zu haben.
Ich habe aktuell keinerleit tools installiert. Firefox nutzt den default "print to file" dialog (Laut Properties im PDF "cairo 1.9.5", ist das ein "Drucker" vom System oder von Firefox?) und Opera hat das eingebaut und unter Rechtsklick zur Verfügung (Laut Properties "Skia/PDF m80", gehe also davon aus dass das von Opera kommt).
Ich schau mal was ich so druckertreibermässig für CentOS finde. hat CUPS eigentlich auch einen PDF Drucker?
 
Muß es unbedingt PDF sein oder würde dir das MHT-Format auch weiterhelfen?
 
Ich würde noch den OSIRT Browser in den Raum werfen (nur Windows). Der ist eigentlich für die Strafverfolgung entwickelt worden und bietet die Möglichkeit, Seiten wahlweise als Bild oder PDF zu speichern.
 
  • ok1.de
  • thinkstore24.de
  • Preiswerte-IT - Gebrauchte Lenovo Notebooks kaufen
Zurück
Oben