Dokumentenmanagement für papierloses Büro

ede-server

New member
Registriert
29 Dez. 2010
Beiträge
39
Hallo,
ich möchte für meinen Haushalt ein papierloses Büro einführen und somit Ordnung im Arbeitszimmer schaffen. Hierfür sollen Dokumente eingescannt und elektronisch verarbeitet und abgelegt werden. Die Originaldokumente kommen in eine „Monatsmappe“ und landen im Keller in einem Karton. Jedoch ist für mir die elektronische Verarbeitung und Ablage noch nicht ganz geklärt. Ich stehe zwischen 4 Optionen: 1 Lokal und Benennung der Ordner und PDFs manuell, 2 Ablage auf NAS und manueller Benennung der Dateien, 3 Lokal und mit Anwendungssoftware (PaperPort, ecoDMS etc.) oder 4 auf NAS und mit Anwendungssoftware (Bsp. EcoDMS als VM oder Docker)

Vorteil von Option 1 ist die unabhängig vom Betriebssystem und der Anwendungssoftware.
Vorteil einer Option mit NAS ist der Zugriff von mehreren Endgeräten ortsunabhängig.

Ich würde gerne die Dokumente verschlagworten und auch diese Schlagworte mehrfach belegen. Bsp. die Rechnung für eine KFZ Inspektion soll dem Schlagwort Rechnung, dem Schlagwort Auto und dem Schlagwort 2018 zuordenbar sein.
Ferner ist mir eine einfache Suchkomponente der gescannten OCR Dokumente wichtig. Eine zusätzliche Navigation per Schlagwort (Bsp. zeige mir alle Rechnungen von 2017 und 2018 an) wäre ideal.
Vorteil einer lokalen und manuellen Lösung ist, dass die Dokumentenablage einfach mitgesichert werden kann und die Dokumente rasch kopiert und nicht vorher aus dem DMS/Anwendungssoftware extrahiert werden müssen.
Welche Anwendungssoftware für Windows verwendet ihr hierzu?
 
Hi!

Ich habe für den selben Zweck nen ix500 Scanner angeschafft und nutze die mitgelieferte ScanSnap Software. Alle Dokumente werden als komplett durchsuchbare PDF abgelegt und händisch benannt nach Jahr Monat Tag Familienmitglieder Thema Stichworte und dann grob in lokalen Ordnern abgelegt und gesichert. Klappt prima und ist eigentlich nur am Anfang einmal aufwändig.

Gruß
Nommo
 
Ich nutze ecoDMS - allerdings habe ich sie mir gekauft. Die kostenlose Version schränkt leider zu stark ein - speziell das selbstständige Erkennen. Wenn du schnell bist kannst du alle Vorlagen einpflegen bevor der Testzeitraum abläuft, du kannst sie danach nur nicht mehr ändern.
"Verschlagwortung" macht ecodms so nicht, es basiert auf Volltext, Ordnern und Kategorien. Eine Suche nach Rechnung 2018 würde über die Dokumentenart "Rechnung" sowie Zeitraum "2017" problemlos funktionieren. Weitere Merkmale (Dropdown, Check, Freitext etc.) kannst du aber beliebig anlegen. Dann ginge auch "Schlagwort" - allerdings sieht das ecodms so nicht vor. Am besten mal die Testversion als VM aufsetzen und die Dokumentation dazu lesen.

Ein definitiver Vorteil gegenüber manueller Ablage ist, daß du Abläufe bauen kannst - sprich Wiedervorlage oder Vorlage bzgl. Bedingungen ("Rechnung + unbezahlt" zB.)
 
ecoDMS habe ich als Testversion in einem Docker auf meiner NAS installiert und greife mit dem Client vom Notebook aus zu. Ein wenig umständlich, aber es funktioniert auch mit VPN. Allerdings ist der ecoDMS Client mit der HD Ready Auflösung meines X230 kaum zu gebrauchen.
Parallel habe ich mal die Testversion von Office-N-PDF ausprobiert. Die Anwendung ist wesentlich schneller als ecoDMS und die Vergabe von Metadaten funktioniert einwandfrei. Allerdings kostet die Standardversion auch 80 Euro.
 
Du kannst ecoDMS (welche Version hast du getestet? 18.04 ist wohl nun besser) im Browser nutzen, zudem gibt/gav es eine App welche gringere Auflösungen besser nutzt.
Für mich war ein Grund für ecoDMS die Formularerkennung bzw. manuelle Erstellung dieser. Das funktioniert recht gut und kann mit regulären Ausdrücken gut ergänzt werden. Halt automatische "Verschlagwortung". Aber man sollte das Handbuch wirklich lesen - dann erschließt sich einiges. Von der Geschwindigkeit her kann ich nicht klagen. Ich habe keine Hänger oder ähnliches.
 
Ich nutze paperless - eine einfache open-source Lösung - seit kurzem dafür. Installiert ist das auf einem FreeNAS. Gefüttert wird über einen Fujitsu ix500, der über einen RaspberryPI scannt und OCR macht. Von da aus werden die PDFs automatisch per rsync in den "consume" Ordner von Freenas kopiert.
Bin gerade dabei das Setup in einem Blog-Post genauer zu dokumentieren - wird noch ein paar Tage dauern bis ich damit fertig bin.
 
Ich häng mich hier einfach mal an das Thema ran, ist bei mir auch Überfällig....
 
Hallo darthvader,

gibt es für FreeNAS kein direktes Docker?
Warum der Umweg über RancherOS?

Aus Sicherheitsgründen, weil Docker root benötigt?

Hast Du mehr Erfahrungen mit RancherOS?

MfG

xsid
 
Zuletzt bearbeitet:
FreeNAS basiert auf FreeBSD, dessen Docker Implementierung noch nicht ausgereift ist, siehe https://wiki.freebsd.org/Docker - auch scheint es da aktuell nur wenig Entwicklung zu geben. Selbst wenn man das installieren wollte, müßte man auf BSD Ebene "rumschrauben" und sich damit ggf. Probleme bei künftigen Upgrades von FreeNAS einhandeln.
Für mich steht im Vordergrund dass das NAS stabil ist. Durch RancherOS in einer VM habe ich eine saubere Trennung und es scheint die schlankeste Möglichkeit zu sein auf FreeNAS mit Docker-Images zu hantieren. Bis dato beschränkt sich meine Erfahrung mit RancherOS auf die beschriebene Installation.
 
OT
Vorteil von RancherOS ist auch der "gehärtete" Linuxkernel, Du erhöhst die Sicherheit.

https://linoxide.com/containers/linux-container-operating-systems/


Hast sich dein System bewährt?

Warum hast Du FreeBSD gewählt und nicht z. B. OpenMediaVault, mit OpenMediaVault könntest Du das System verschlanken?

Du schreibst: es scheint die schlankeste Möglichkeit zu sein auf FreeNAS mit Docker-Images

Hast Du nun FreeNAS oder FreeBSD? Das ist ein wenig durcheinander gekommen.
 
Zuletzt bearbeitet:
Ich habe seit längerer Zeit FreeNAS. Mir gefällt dessen Stabilität und das verwendete ZFS einfach sehr gut. Als NAS kommt mir nichts anderes mehr ins Haus.

Da FreeNAS ja auf FreeBSD aufsetzt war wohl grund der Verwirrung. Seitens FreeNAS Dokumentation wird empfohlen das System z.B. per SSH nicht zu "versauen" indem man zusätzliche Pakete installiert, wild rumkonfiguriert oder ähnliches. FreeNAS wird im wesentlichen nur über die GUI gemanagt.

Paperless habe ich noch nicht mit großen Datenbeständen getestet. Für meine ca. 100 Dokumente derzeit tut es sehr gut.
 
Hallo darthvader,

https://blog.armbruster-it.de/wp-content/uploads/2018/12/paperless.jpg

was für ein OS hast Du auf dem Raspberry PI installiert?
Mit welcher Schnittstelle wurde der Scanner angeschlossen?

Wie löst Du den Scanprozess mit Windows aus?

Warum hast Du gerade den hochwertigen Fujitsu Scanner ix500 gewählt?

https://paperless.readthedocs.io/en/latest/scanners.html

Code:
Brand 	Model 	Supports 	Recommended By
  	  	                FTP    NFS     SMB 	 
Brother 	ADS-1500W 	yes 	no 	yes 	danielquinn
Brother 	MFC-J6930DW 	yes 	  	  	ayounggun
Fujitsu 	ix500 	        yes 	  	yes 	        eonist

OpenMediaVault und FreeNAS werden von gleichen Entwickler zur Verfügung gestellt.
Die Hardwareanforderung bei OpenMediaVault sind geringer, die Treiberauswahl ist grüßer.

Wie viele HDDs hast Du in deinem FreeNAS eingebaut, was für ein Software-RAID System hast Du gewählt und warum?
Warum hast Du einen NFS Server gewählt?

Als VM Host verwendest Du bhyve?
https://wiki.freebsd.org/bhyve

Hast Du dir dein System persönlich ausgetüftelt?

Ist dein NAS vom Internet aus zugänglich, welchen DynDNS Provider hast Du gewählt?

https://github.com/danielquinn/paperless/blob/master/README-de.md

Dein System scheint sehr professionell, wo gedenkst Du es einzusetzen, 100 Seiten sind doch bisher nur ein Test?

MfG

xsid
 
Zuletzt bearbeitet:
was für ein OS hast Du auf dem Raspberry PI installiert?
https://www.openhab.org/docs/installation/openhabian.html, da ich für Heimautomatisierung mit OpenHAB arbeite. OpenHABian setzt auf Debian Stable auf.
Mit welcher Schnittstelle wurde der Scanner angeschlossen?
USB
Wie löst Du den Scanprozess mit Windows aus?
Gar nicht. Scannen wird über den "Scan" Knopf am Scanner selbst ausgelöst. Und Windows kommt mir nicht ins Haus :)
Warum hast Du gerade den hochwertigen Fujitsu Scanner ix500 gewählt?
Mag arrogant klingen: Pfusch kann ich mir nicht leisten.
Ich habe mir eine Reihe von Testberichten angesehen und bin zum Schluss gekommen, dass das ein solides Gerät ist. Ich kaufe lieber hochwertig und nutzt meine Hardware dafür deutlich länger. Z.B habe ich als Drucker einen Epson EPL-N2000 im Einsatz den ich 1995 (!) als gebrauchtes Gerät gekauft habe.
OpenMediaVault und FreeNAS werden von gleichen Entwickler zur Verfügung gestellt.
Die Hardwareanforderung bei OpenMediaVault sind geringer, die Treiberauswahl ist grüßer.

Wie viele HDDs hast Du in deinem FreeNAS eingebaut, was für ein Software-RAID System hast Du gewählt und warum?
Warum hast Du einen NFS Server gewählt?

FreeNAS habe ich wegen ZFS gewählt. Das macht mir insgesamt einen solideren und flexibleren Eindruck. Mit größerer Treiber-Verfügbarkeit hast Du recht. Ich habe bei der Auswahl der Hardware darauf geachtet, dass alles unterstützt wird.
Außerdem wollte ich ein wenig BSD Erfahrung sammeln, da sonst bei mir nur Linux verwendet wird.

Ich habe 2 x SSD mit je 128 G und 4 x 6 TB HDD drin, Mainboard ist https://www.asrockrack.com/general/productdetail.asp?Model=C2550D4I#Specifications, Die vier Festplatten sind als RaidZ2 mit je einer SSD als Cache und Log konfiguriert.
NFS setze ich ein, weil es schnell ist. Da ich defacto der einzige Nutzer bin, brauche ich auch keine Kerberos-Infrastruktur für die Authentifizierung - das wäre mit Kanonen auf Spatzen geschossen.
Als VM Host verwendest Du bhyve?
Ja, FreeNAS nutzt bhyve für Virtualisierung. Das ist IMO der Schwachpunkt an BSD - bhyve kann kein USB passthrough. D.h. ich kann nicht den Scanner direkt am NAS betreiben.

Hast Du dir dein System persönlich ausgetüftelt?
Ja, basierend auf vielen Blog-Posts, FreeNAS docs und Youtube-Videos.
Ist dein NAS vom Internet aus zugänglich, welchen DynDNS Provider hast Du gewählt?
Nur über VPN.
Dein System scheint sehr professionell, wo gedenkst Du es einzusetzen, 100 Seiten sind doch bisher nur ein Test?
Danke, ist wirklich nur nur als persönliches Digitalarchiv gedacht. Klar kann man das auch kleiner aufziehen. Muss aber nicht ;-)
 
Zuletzt bearbeitet:
*wow

Für mich sieht das nach einer professionellen Lösung aus.

2 x SSD mit je 128 G und 4 x 6 TB HDD

Mit wecher SSD bootest Du dein System, oder warum 2 x SSD?

Zitat: Da ich defacto der einzige Nutzer bin, brauche ich auch keine Kerberos-Infrastruktur für die Authentifizierung - das wäre mit Kanonen auf Spatzen geschossen.


Das alles für 100 Seiten :)

https://wiki.freebsd.org/Docker

Gibt es für dein FreeNAS System Docker?
Vielleicht ist es damit möglich auf den Raspberry-PI zu verzichten?
Ok, durch OpenHAB hast Du den sowieso.


So ganz trival ist dein System nicht, schon allein um Paperless-Docker zu konfigurieren gehört eine Menge Know-How dazu.
 
Zuletzt bearbeitet:
Nun ja, bei den 100 Seiten wird's nicht bleiben. Das ist das was ich im Moment drin habe. Wird wohl mal so Richtung 10.000 gehen. Aber ja, kann man auch als Overkill betrachten. Für mich aber auch ein nettes kleines Lern-Projekt.
 
Hallo darthvader,

Du verwendest die OCR Software https://github.com/rocketraman/sane-scan-pdf.
Wie gut funktioiert das mit dieser OCR?

Wie groß werden deine Dateien?

Hast Du auch anstelle von *.pdf an *.djvu gedacht, weil diese Dateien kleiner werden?

https://de.wikipedia.org/wiki/DjVu

Zitat: Aber ja, kann man auch als Overkill betrachten. Für mich aber auch ein nettes kleines Lern-Projekt.

Nach BSD mit ZFS habe ich auch schon öfters geschielt.

https://blog.armbruster-it.de/wp-content/uploads/2018/12/paperless.jpg

Ist der Pfeil consumer ----> volume paperless/consumer evtl. richtungsfalsch?

Wie lange hast Du an dem System gearbeitet, mal so eben ist das bestimmt nicht gewesen?

MfG

xsid
 
Zuletzt bearbeitet:
sane-scan-pdf nutzt Tesseract, ich bin damit recht zufrieden.

Die Größe bleibt sehr überschauber: ca 50kb pro Seite.

djvu habe ich mir nicht angesehen, pdf ist ein universelles Format. Wenn ich ein Dokument z.B. dem Steuerberater schicken muss kommt der mit pdf sicher hin.

Der Pfeil ist absichtlich so, da der Consumer ja auf das Volume zugreift (per inotify).
 
  • ok1.de
  • thinkstore24.de
  • Preiswerte-IT - Gebrauchte Lenovo Notebooks kaufen
Zurück
Oben