[Gelöst] Problem: Text aus einer PDF kopieren

PoLaKa_89

New member
Registriert
5 Okt. 2009
Beiträge
972
Hallo Leute....

Ich habe ca. 200 Datein aus denen ich den Text brauch. Das Problem ist ich kann aus irgendeinem Grund den Text nicht kopieren.

Hat jemand eine schnelle Lösung da?

Eine Bsp. Datei hänge ich an => LINK

Danke schonmal :)
 
Ich hätte vermutet, dass die PDF Datei einen Schutz hat - sprich markieren und kopieren wurde deaktiviert. Aber in den Seiteneigenschaften steht, dass die Entnahme von Inhalten zulässig ist - also kein Schutz eingeschaltet. Dann würde ich jetzt ad hoc auf folgendes tippen - eine PDF Datei wird ja immer vom Original heraus erstellt. Beim Original ist der Text kein text - sondern es ist ein Bild.
---
Sprich der Text und das Bild drüber wurden irgendwann mal als Grafik kopiert, in ein Textverarbeitungsprogramm kopiert und später als PDF "gedruckt". Dann kann man so wie in Deiner Datei ersichtlich, den Text nicht markieren... ist ja ein Bild(text).
 
Guten Abend ;)

Habe mir gerade mal dein File angeschaut - da es über die Sicherheitseinstellungen nicht gegen Kopieren etc. geschützt ist und die Texterkennung vom Adobe Pro etwas erkennt, würde ich darauf tippen, dass deine "Texte" in Wirklichkeit Bilder sind.

Wenn du ebenfalls den Adobe Pro nutzt, probier es mal mit der dort vorhandenene OCR-Erkennung. Dann sollte es gehen.

Grüße und viel Erfolg,
Marcel
 
Okey das ist möglich. Die Datei wurde mittels Scribus erstellt.

Nun sind aber nur noch die PDFs vorhanden und es ist zeitlich bis morgen früh 7h nicht möglich das alles ab zu schreiben. Also vielleicht ein Plan B??

Edit: Habe leider nur den Reader...
 
Ok, wir sind schon mal 2 Leute die auf Bilder tippen. Dürfte wohl auch so sein. Das schnellste was mir einfällt - nehme es als Bild heraus, wenn OCR nicht in Frage kommt. Installiere kostenlos das Tool "Hardcopy" und kopiere den Text als Bild auch wieder raus. Ansonsten würde mir auch nur OCR einfallen.
 
Hm, entweder findest du spontan genug Leute mit Adobe Pro auf die du die Files aufteilen kannst oder du probierst es mal mit Freeware Versionen von OCR-Programmen. Google mal nach "Omnipage Freeware" - da sollte sich ganz legal auch eine etwas ältere Version finden. In der Regel arbeitet die Software recht gut.

Wie viele Seiten haben deine Dateien denn in Summe?
 
[quote='Mornsgrans',index.php?page=Thread&postID=874168#post874168]Vielleicht hilft auch das hier:
http://www.winload.de/download/110591/Grafik,Desktop/Schrift/FreeOCR.2.6.html
Soll auch aus PDF-Dateien den Text erkennen.[/quote]

:) Ein HOCH aufs TP-Forum!!!!!!! :)

Die Lösung von Mornsgrans hat funktioniert! Danke euch allen...

So die Nachtschicht beginnt... Also wir werden uns heute zwischendurch wohl hören.

DANKE DANKE DANKE nochmal!!!!
 
PDFGrabbersollte da weiterhelfen, das liest Text per OCR aus PDF-Dateien. Allerdings ist ein Dokument wie Dein Beispiel, das fast ausschließlich Eigennamen enthält, für eine OCR-Software auch eine ziemliche Herausforderung...
Gruss, maculae

Edit: Der Helpdesk war schneller... ;) ;)
 
testversion von acrobat pro (funktioniert 30 Tage) - dann die Dateien per batch ocr-en lassen. (Dokumente - OCR in mehreren Dateien - Dateien oder Ordner auswählen)
 
  • ok1.de
  • ok2.de
  • thinkstore24.de
  • Preiswerte-IT - Gebrauchte Lenovo Notebooks kaufen

Werbung

Zurück
Oben