Scan von Buch in "echtes" PDF umwandeln

bassplayer

New member
Registriert
8 Juni 2009
Beiträge
1.322
Hallo zusammen,

ich bin auf der Suche nach einem Programm, dass mir ein Fachbuch das mir als PDF (Scan) vorliegt in ein "echtes" durchsuchbares und sauberes PDF umwandelt. Die Schwierigkeit liegt vor allem in Formeln und Diagrammen, die ebenso wie Absätze und Fettschrift etc. berücksichtigt werden sollten. Durch den Scan sind leider ganz leichte Verzerrungen vorhanden. Ich habe mal ein Beispiel angehängt, damit Ihr seht worum es sich dreht...
Hat jemand eine Idee?

Für Linux wäre natürlich die Krönung, Mac ginge aber auch. Zu einem Windows-Rechner hätte ich auch Zugang.

Grüße und danke :)
bassplayer
 
Das ist kostenfrei kaum möglich (falls ja, würde ich Luftsprünge machen ;)).

Ich habe am Institut nur mit Adobe Acrobat Professional gearbeitet. Sehr teuer, aber sehr gute Korrektur und OCR.

Vielleicht hilft dir für ein kurzzeitiges Projekt auch die 30-Tage Testversion, die voll funktionsfähig sein soll... hoffentlich ohne Wasserzeichen.

http://software-portal.faz.net/ie/35483/Adobe_Acrobat_Professional
 
Ich kenne und nutze nur Acrobat...- damit (nach dem Capture-Modul) ist es ohne Probleme möglich. Alles Testversionen oder "Freeware", oder andere Programme haben immer eine Einschränkung... - also sparen und Acrobat kaufen... (man kann nicht immer alles für lau bekommen und muss auch mal was anlegen)
 
Gute OCR-Programme für Linux kosten ein Heidengeld, dafür könntest du einige Fachbücher kaufen (OCR Shop, Abby). An deiner Stelle würde ich mir FineReader für Windows bei Ebay holen, kostet so ab 30€.
 
jemand Fragen, der Acrobat hat...

Oder du fragst, ob einer die Datei mit Acrobat für dich OCRt und dir wieder zukommen lässt :)
Ich selbst besitze Acrobat 8.1.7 Pro :)

Fehlermeldung: Dein Scan liegt unter 72 dpi Auflösung, somit hat selbst Acrobat Probleme daraus vernünftigen Text zu extrahieren... Wenn du es neu einscannen kannst, dann mit 300 dpi!
 
finereader ist exzellent, finde ich (gibt ne 30-Tage-Testversion), omnipage auch sehr gut!
 
Danke für Eure Tipps! :)
Ich kann das Buch leider nicht neu einscannen, da es von unserem Prof bereitgestellt wird. Ich werde es einfach mal mit den Testversionen probieren! Zuerst mit Acrobat, dann mit finereader. Allerdings kann ich dann erst am Wochenende zu Werke gehen, da ich momentan "nur" meine Ubuntu-Rechner da habe ;)
Ich habe grundsätzlich nichts gegen das Kaufen von Software, nur Acrobat kann bzw. möchte ich mir nicht kaufen. Schließlich brauche ich es nur für dieses eine Projekt. Wenn es nicht klappen sollte, geht auch nicht die Welt unter. :)

Grüße
bassplayer
 
[quote='T42-Freund a.k.a. Padex',index.php?page=Thread&postID=844254#post844254]Ich selbst besitze Acrobat 8.1.7 Pro :)[/quote]

Du solltest mal die letzten Updates einspielen ;)

@bassplayer:

Da Du offenbar Student bist, kauf Dir den Acrobat. Kann man immer mal gebrauchen und kostet "nur" 100 Euro für Studenten.
 
Wieviele Leute brauchen das Buch denn? Vielleicht könnt Ihr Euch zusammentun und jeder tippt nur ein paar Seiten ab.
 
Oh, Abtippen is nicht - es sind ca. 400 Seiten. Meinen Kommilitonen ist diese kleine Verbesserung bestimmt keine Arbeit geschweige denn Geld wert. Außerdem bräuchte man dafür ja echt Ewigkeiten, allein wegen der Formeln und Schaubilder. Ich kann leider nicht flüssig LaTeX ;)
Ich werde es am Wochenende einfach probieren. Und wenn es mit den Testversionen nicht hinhaut, dann muss ich mich mit den Scans zufrieden geben. (Oder das Buch für 70 € kaufen, wobei es dann auch nicht durchsuchbar ist...)

Grüße
bassplayer
 
Acrobat 9 Pro Extended kann auch nicht wirklich was damit anfangen, hätte es gerne für dich gemacht.

Grüßle

Edith sagt gerade, sende mir mal einen Teil des Scans
 
Vorschlag: Erst mit >75 DPI als PDF drucken und dann die OCR drüber laufen lassen.
 
  • ok1.de
  • ok2.de
  • thinkstore24.de
  • Preiswerte-IT - Gebrauchte Lenovo Notebooks kaufen

Werbung

Zurück
Oben