Das papierlose Büro

eddigob

Member
Themenstarter
Registriert
10 Nov. 2013
Beiträge
74
Moin Moin Allerseits,

ich möchte / bin gerade dabei mein Heimbüro auf "papierlos" umzustellen. Dafür fehlt mir a) noch die ein oder andere Software und b) ist ein wenig Diskussion und Input von außen, ja auch immer gut :thumbup:

Betriebssystem: Windows

Traumszenario:
1. Brief kommt an, wird geöffnet und mit einem Dokumentenscanner (ix500) gescannt
2. Dokument wird per WLAN autmatisch im .Inbox Ordner abgelegt
3. Nun sollte eine Routine das Dokument per OCR (Acrobat?) durchsuchbar machen
3.1 Ein Traum wäre nun eine Software die automatisch das Datum in Briefen erkennt und dieses als YYMMTT vor den Dateinamen schreibt
3.1 Weiter wäre es extrem Hilfreich wenn die Software ebenfalls, vordefinierte, Keywords wie "Sparkasse" auslesen könnte um nun automatisch den Dateinamen zu "YYMMTT - Sparkasse" zu ändern.
3.2 Zur Kontrolle bleibt die Datei im .Inbox Ordner und wird nun, händisch, in den finalen Ordner verschoben

Was wohl realistischer ist:
3. muss per Hand erledigt werden

Was dabei sehr hilfreich wäre:
> Eine Software überwacht den .Inbox Ordner und startet automatisch die OCR Erkennung sobald eine Datei hinzugefügt wird
> Ist dies abgeschlossen, wird die Datei in .InboxOCR verschoben
> .InboxOCR wird ebenfalls überwacht. Sobald eine Datei in diesem landet, öffnet sich eine weitere Software, zeigt die neu hinzugefügten Dokumente an, Schlägt letztvergebene Tags und Zielordner vor, und erleichtert so die Verschlagwortung und das editieren des Dateinamens
Gibt es auch Quasi schon: http://pdfscanmanager.blogspot.de/ allerdings würde ich mich über eine etwas optisch ansprechnedere Oberfläche sehr freuen (ja mir ist so etwas wichtig ;) ) Kennt jemand vll eine Alternative?

Die eigentliche Archivierung und Backupstrategie:
> Findet auf der lokalen Festplatte statt
> Tägliches Backup durch Areca auf interne Backupfestplatte
> Monatliches Backup durch Areca auf eine externe Festplatte
> Ebenfalls ist ein monatliches Backup auf eine Netwerkfestplatte bei Freunden/Eltern angestrebt. Hier bin ich mir über die bestmögliche realisierung noch nicht ganz im klaren. Idee: eine einfache WD Mycloud Festplatte. Doch wie verschlüssle ich meine Daten effektiv auf dieser?


Sooo, und nun sind Anregungen gern gesehen. Habt Ihr selbst Erfahrungen, würdet Ihr etwas anders machen? Kennt Ihr heiße Softwaretipps?

Unter Mac scheint der Markt ja etwas solider zu sein was die Software anbelangt (Hazel, devonthink ...). Gute Startups wie Doo.net sind leider wieder eingestampft worden. Und den Cloudboom möchte ich nicht wirklich gerne mitmachen, wenn es um solch sensible Daten geht (paperorganizerapp.com, foxdox etc.)

Gruß,
eddi
 
Persönlich kann ich leider nicht viel zum Thema beitragen, auch wenn ich es durchaus spannend und reizvoll finde, aber mein eigenes "Büro" ist (leider) noch alles andere als papierlos... ;)

Ich wollte dich nur auf zwei interessante c't-Beiträge aufmerksam machen, falls du sie noch nicht kennen solltest:
- Ganz ohne Druck - Papierlos im Büro und Alltag - ein Selbstversuch (c't 5/2014) (Artikel mittlerweile kostenfrei verfügbar)
- Gut aufgehoben - Rechtliche Grenzen des papierlosen Büros (in der aktuellen c't 7/2015 bzw. einzelner Artikel als PDF für 2,50 EUR)
 
Was ich hier lese ist der papierlose Posteingang,was kommt danach: Der Dokumentenschredder?

Wie möchtest du den Postausgang realisieren, wenn der Empfänger zum Beispiel keine E-Mail hat,
oder ein papierliches Dokument vorgeschrieben wird? Fragen über Fragen...
 
hey jonny, danke den ersten Artikel kannte ich noch nicht.
Und genau Jakob, für 0815 schreiben der Bank, Rechungen und sonstiges kommt nach dem Scan der Schredder.
Seltene, wichtige Schreiben, die als original Vorliegen müssen, werden nach dem Schema "YY-####", vor dem Scan, fortlaufend Nummeriert, und dann einfach hintereinander abgeheftet.

Was ich primär bekämpfen möchte sind sich durchbiegende Realböden durch Leizordner ;)

Wer unbedingt einen Brief möchte, was heutzutage - zumindest bei mir - max 1 - 2 mal pro Jahr vorkommt, bekommt einen Brief. ;)
 
Als Privatmann geht das ja, aber wie ist das mit geschäftlichen Unterlagen; früher musste man
die doch mindestens 10 Jahre aufbewahren, hat sich das geändert?
 
Ich hatte das mit Omnipage probiert - deren automatisierte Ordnerüberwachung und Erkennung funktioniert ziemlich gut. Abbyy Finereader war nicht so gut - auch die Automatik war eher merkwürdig. Beide erfordern etwas Einrichtungsaufwand.

Was die Erkennung selber angeht. Adressblöcke und deutlicher Text ohne Sonderzeichen in guter Qualität (Druck, keine Kopie) wird so zuverlässig erkannt dass ein Durchsuchen des PDFs nach Stichworten funktioniert. Eine komplette Übernahme von Volltext in andere Anwendungen ohne Nachbearbeitung allerdings nicht. Dafür sind zuviele Fehlerkennungen bei Satzzeichen etc. vorhanden. Ob sich dies durch Lernen verbessert mag ich nicht zu beurteilen.

Je nach Einstellung bieten beide Anwendungen verschiedene Modi der Kopie - Scan mit unsichtbarer Überlagerung des Textes (mein Favorit), sichtbare Überlagerung des Textes durch schwarze Konturen (mochte ich eher nicht), Ersatz durch eine Computerschriftart sowie Volltext ohne "Kopie". Was man am Ende nutzt ist jedem selbst überlassen, ich habe ersteres genommen (am Besten lesbar inkl. des Textkomforts).

Im Vergleich beider Anwendungen habe ich mich für Omnipage entschieden obwohl es etwas teurer ist.
 
Ich werfe noch ein paar Fragen in den Raum:
  • Speicherformat
    • NurText: Was passiert mit Grafiken?
    • PDF: Ist dieses Dateiformat in Zukunft noch lesbar (Abhilfe: PDFa)
  • Handling
    • Was passiert, wenn Dokumente irrtümlich doppelt gescannt werden?
    • Was passiert, wenn es zwei Dokumentversionen gibt?
;)
 
Zuletzt bearbeitet:
Ich werfe noch ein paar Fragen in den Raum:
  • Speicherformat
    • NurText: Was passiert mit Grafiken?
    • PDF: Ist dieses Dateiformat in Zukunft noch lesbar (Abhilfe: PDFa)
  • Handling
    • Was passiert, wenn Dokumente irrtümlich doppelt gescannt werden?
    • Was passiert, wenn es zwei Dokumentversionen gibt?
;)
Besser als PDF ist TIFF, mehrseitig, komprimiert - nur eignet sich nicht jedes TIFF-Format-taugliche Programm zum Anzeigen der Seiten 2 ff (Ab Office 2007 als separater Download im Rahmen des SharePoint Designer 2007 kostenlos erhältlich
Doppelt gescannt = doppelt archiviert
Mehrere Versionen = alle archivieren (Revisionsverlauf)
 
multi-page TIFF ist wirklich nicht schlecht. Zumindest IrfanView und alte ACDsee-Versionen können die gut handeln. Problem nur: durchsuchbar sind die nicht...
 
Hmm, ja. Neuerdings haben wohl die aktuellsten Multifunktionsgeräte eine Scansoftware, diescannen und OCR in einem Rutsch durchführen und somit durchsuchbare PDFs erstellen - das ging mir oben durch den Sinn, morns
 
Ich handhabe das folgendermaßen:

Ein Brief kommt herein und wird im Canon MX850 als s/w in PDF gescannt. Dann überprüfe ich das PDF, ob alles wichtige lesbar ist. Ist dem so, paßt das.
Wenn nicht, dann muß ich das nochmal separat einscannen und dann ein PDF draus machen.
Im ersten Fall läuft auch ein OCR drüber, was die PDFs durchsuchbar macht.

Wichtige Dokumente, wie Lohnsteuerbescheid etc wird im original weiter abgeheftet. Alles andere fliegt weg.
 
Der Artikel in der letztigen CT war leider auch sehr cloudlastig.

Morgen kommt der Canon ScanFront 220. Dann wird erstmal dessen Konfigurierbarkeit ausgetestet.
Zielformat soll PDF sein. An PDF/a hatte ich auch schon gedacht, im Hinterkopf hatte ich jedoch, dass diese dann nicht mehr editierbar seien. Okay, kurz gegoogeled, man kann sie weiterhin editieren. Falscher Alarm.

Dann ist der Ablauf nun erst einmal wie folgt geplant:

1. Scan als PDF > .Inbox
2. Je nach fehlerrate entweder OCR schon durch den Scanner, oder nachträglich durch Acrobat
3. Wandlung in PDF/a die Archivfestigkeit noch etwas zu steigern
4. Verschlagwortung, Umbenennung und Verschieben in den finalen Ordner mit tagspaces (www.tagspaces.org)

ich hoffe, dass ich damit einiges mit filejuggler automatisieren kann (www.filejuggler.com).

Aber das lasse ich jetzt einfach mal auf mich zukommen :thumbsup:
 
Spannende Geschichte, würde mein (fast) Papierloses studieren gut Ergänzen ;) .
Bitte Berichte auch weiterhin vom vorrankommen und der Umsetzung!
Vielleicht für dich noch ganz lesenswert (auch wenn es in eine etwas andere Richtung ging, vielleicht sind ja ein paar Anregungen dabei) http://blog.microle.de/papier-experiment/


gruß vom Haasen
 
Spannender Blog, das ist dann wohl die "Hardliner" Form :D

So, Scanner da und ich bin begeistert. :thumbsup:

> Brief der Bank XY kommt an und wird in den Scanner gelegt
> Scan wird über den Scanner ausgelößt und landet dann automaitsch im "Inbox"-Ordner [OCR, Farbe, 200dpi, Dateiname durch den Scanner: YYYYMMTTHHMMSS.pdf, resultierende Dateigröße ~200-400kb]
> Nun öffne ich TagSpaces (Inbox Ordner ist bereits hinterlegt, ebenso Vorgeschlagene und geordnete Tags)
> Doppelklick auf die neue PDF, ich bekomme sie als Vorschau angezeigt, ich sehe > alles okay > Doppelklick auf den "Bank XY" Tag > Tag wird durch Tagspaces in den Dateinamen geschrieben [Dateiname nun: YYYYMMTTHHMMSS_[BankXY]] > eventuell zusätzlich noch einen/mehr inhaltsbeschreibende Tags
> Ich wechsle zurück in den "Inbox"-Ordner > Rechtsklick auf die Datei > "Run rule on files" > "Ablegen" (Hier kommt filejuggler ins Spiel, der nach vorher erstellten Regeln nun die Datei anhand des im Namen vorkommenden "BankXY" in den Ordner "Aktenschrank/Banken/BankXY" verschiebt. passiert vollautomatisch durch filejuggler sobald der Tag "BankXY" in den Dateinamen geschrieben wurde

Die Ablage ist nun noch eine Sachen von ~30 Sekunden, wobei das Handling von viel mehr Dokumenten dann pro Dokument noch viel weniger Zeit beansprucht.
 
Zuletzt bearbeitet:
mittels pdftotext kann der Inhalt eines PDF-Dokumentes in eine txt-Datei extrahiert werden, um etwa Inhalte noch zu indizieren.
 
Zuletzt bearbeitet:
Auf den GLT wird Karl Voit einen Vortrag darueber halten "[h=2]Vortrag: Wie man sein Papierleben digitalisiert[/h]". Orgmode wird dabei sicherlich auch eine Rolle spielen.

Ich berichte, wie ich ungefährt 40.000 Seiten Papier gescannt und mit OCR bearbeitet habe. Weiters beschreibe ich mein Ablagesystem und gebe hilfreiche Tipps zu der verwendeten Hard- und Software.
Die Aufgabe ist komplexer, als man sich das zuerst vorstellt. Ein geeigneter Scanner findet sich auch nicht so schnell. Da ist oft am falschen Platz gespart und unnötige Hardware gekauft.
OCR und Linux, das ist so eine Sache. Zahlreiche Tools helfen beim Scannen und Nachbearbeiten. Um ein möglichst gutes Ergebnis zu bekommen, musste ich auf Linux verzichten. Mein Workflow funktioniert unter OS X und Windows.

https://glt15-programm.linuxtage.at/events/26.html
 
Zuletzt bearbeitet:
  • ok1.de
  • ok2.de
  • thinkstore24.de
  • Preiswerte-IT - Gebrauchte Lenovo Notebooks kaufen

Werbung

Zurück
Oben