Dokumentenmanagement für papierloses Büro

Hallo darthvader,

würdest Du uns hier, mir einen Beispielscan und die dazugehörige Verschlagwortung zeigen?
Am besten Buchsatz mit enthaltenen Bildern.

Wie händelst Du das mit Quittungen?

Danke.

MfG

xsid
 
Zuletzt bearbeitet:
Ich schicke Dir einen gescannten Prospekt per PN. Ich scanne nur schwarz/weiß - könnte man aber ändern. Für meinen Anwendungsfall brauche ich keine Farbe.
Quittungen hatte ich bis dato noch keine. Ich würde die einfach ganz normal verarbeiten. OCR wird da aber fehlschlagen, wenn's handgeschieben ist.
Paperless macht einiges an "Magie" basierend auf Dateinamen und enthaltenen Wörtern, siehe https://paperless.readthedocs.io/en/latest/guesswork.html.
 
An die Leute mit einem ix500. Ich lege meine PDFs damit direkt auf mein synology. Leider sind die Dokumente danach nicht durchsuchbar. Habt ihr einen Tipp?
 
Gerade erst gelesen... Sind die denn vorher durchsuchbar? Bzw. wenn du einen anderen Zielort angibst? Die Option in Treiber ist ausgewählt das auch direkt beim Scannen OCR stattfinden soll? Das findet sich unter Rechtsklick auf das Symbol im Tray - Einstellungen Scantaste - dann glaube ich unter Datei in einem erweiterten Menü, dort kann man auswählen ob nur die erste Seite oder jede Seite OCR bekommen soll
 
Zuletzt bearbeitet:
Ich hänge mich hier auch mal ran, auch wenn ich im Moment wie ein Schwein vorm Uhrwerk stehe.

Gibt es einfachere Varianten als die hier beschriebenen bzw Varianten bei dem man nicht im Besitz eines Scanners sein muss und dies auf Arbeit tun kann? Scanner, RasPi, FreeNAS - das klingt doch alles reichlich aufwändig für mich.
 
Hallo darthvader,

danke für dein PDF File, anstelle mit pdftotext, kann man mit gscan2pdf Verschlagwortung auch öffen.
Mit welchem Filemanager, Software kann ich die durch OCR erkannte Begriffe suchen, finden, so eine Art "Suchmaschine" für das eigene System?

@Paul Ogorzow
Die Lösung von darthvader eine Lösung für die Arbeit, sehr durchdacht und betriebsssicher.
Du nimmst einfach die Dateiein mit nach Hause.

@Nommo
Wie gut funktioniert die Synologylösung?
Genügt die Leistung vom Synlogo-NAS für die OCR Erkennung?

Welche OCR Lösungen sind als High-End zu betrachten?


MfG

xsid
 
Zuletzt bearbeitet:
google +1

sehr interessant, erinnert mich an Win NT und Server 2003 in einem anderen Zusammenhang.
Kann man sich so etwas zertifizieren lassen?
Falls ja, welche Zertifikate kommen da in Betracht.
 
@xsid Ich war das nicht mit der Synolog, das war matt-Eagle! Die Software läuft unter Windows, ehrlich gesagt keine Ahnung, ob die OCR auf ner Synology zu realisieren wäre, ich mache das einfach Lokal und sichere dann in der Cloud

Gruß
Nommo
 
An die Leute mit einem ix500. Ich lege meine PDFs damit direkt auf mein synology. Leider sind die Dokumente danach nicht durchsuchbar. Habt ihr einen Tipp?

Im Tray hast du die Einstellunsoptionen. Dort Rechtsklick und "Einstellungen der Scan Taste". Dort kannst du einstellen (Reiter):

1. Scan nach Datei (keine Anwendung)
2. Speicherort und Name
3. Farbe und Auflösung
4. Dateiart - dort auf PDF stellen und dann "in durchsuchbare Datei wandeln".

Dann hast du deine erkannte PDF.

Ich persönlich mochte die Erkennungsrate nicht sonderlich (auch von sanepdf nicht), deswegen gehe ich den Umweg über einen automatisierten Agenten von Omnipage, welcher die gescannten PDFs noch begradigt, Hintergrund/Rand/Lochungen entfernt und dann entsprechend die Texterkennung durchführt. Die Scanoptionen scannen also in einen temporären Ordner, erst Omnipage verschiebt es in den Zielordner (einmal allgemeiner Sammelordner ohne Kategorisierung und einmal Zielordner für Dokumentenmanagment). Damit habe ich immer zwei Kopien - für den Fall der Fälle.
 
Wäre es eigentlich möglich , wenn man zusammenpackt, alles zentral in 3 Dateien zu haben? -> Anwendung, Datenbank, Konfiguration
 
Hallo darthvader,

danke für dein PDF File, anstelle mit pdftotext, kann man mit gscan2pdf Verschlagwortung auch öffen.
Mit welchem Filemanager, Software kann ich die durch OCR erkannte Begriffe suchen, finden, so eine Art "Suchmaschine" für das eigene System?

Dafür habe ich in meinem Setup paperless: datenbank mit suchindex.
Welche OCR Lösungen sind als High-End zu betrachten?
Im OSS Umfeld ist Tesseract wohl state of the Art. Man kann das auch noch sehr feingranular trainieren, dass die Erkennung besser wird. Wie schon gesagt ich habe darauf verzichtet - mir ist das bereits gut genug.
Mir ist auch noch Nuance OmniPage bekannt.
 
Hallo darthvader,

alles richtig gemacht:

https://curius.de/blog/13-betriebssysteme/open-source/376-freenas-oder-openmediavault

Fazit

Man sollte sich von der BSD-Basis nicht abschrecken lassen. FreeNAS ist das mächtigere System und durch die integrierte Entwicklung ein deutlich besser aufeinander abgestimmtes System. Der Preis ist der relativ hohe Ressourcenbedarf, weshalb insbesondere schwache Heimserversysteme oftmals nur openmediavault als NAS zulassen.

OpenMediaVault also nur, wenn die Hardware für FreeNAS nicht geeeignet ist oder z. B. Docker, Nextcloud genutzt werden soll.

Wie lange hast Du an deinem "optimalen" System von der ersten Idee bis betriebsfähigen System gebraucht?

Was gefällt dir an deinem System noch nicht so richtig, wo sieht Du Verbesserungpotential?

Für ein reines FOSS System sehe da heute theorethisch kein Verbesserungspotential.
Dein System ist echt ausgeglügelt, super.

Wie sieht es mit dem Stromverbrauch aus, läuft dein System ständig?

Blog: This NAS runs 24×7 anyway.

Hardware: The hardware consists of a Quad-Core Intel Atom CPU board, 2 SSDs and 4 x 6 TB HDDs.

Was hat dein System komplett gekostet?

MfG

xsid
 
Zuletzt bearbeitet:
Hallo darthvader,
alles richtig gemacht:
https://curius.de/blog/13-betriebssysteme/open-source/376-freenas-oder-openmediavault
OpenMediaVault als nur, wenn die Hardware für FreeNAS nicht geeeignet ist oder z. B. Docker, Nextcloud genutzt werden soll.

Wie lange hast Du an deinem "optimalen" System von der ersten Idee bis betriebsfähigen System gebraucht?
Mit FreeNAS habe ich vor etwa 2 Jahren angefangen. Das initiale Lernen und Setup hat damals ca 3-4 Tage gedauert. Dann hatte ich das System selbst am Laufen, die Netzwerkshares.
In paperless und RachnerOS habe ich mich im Herbst eingelesen und erst mal lokal auf dem Laptop ein wenig experimentiert. Den Scanner habe ich vor ca 2 Monaten gekauft.
Da ich immer mal wieder abends etwas rumgebastelt habe kann ich den Zeitansatz schlecht in einer einzigen Zahl angeben.
Was gefällt dir an deinem System noch nicht so richtig, wo sieht Du Verbesserungpotential?
Mir fehlt noch ein automatisches, verschlüsseltes Backup der NAS Daten in die Cloud - liegt teils daran, dass FreeNAS das erst seit 11.2 direkt kann und da mein DSL recht schmal ist.
Für ein Backup auf externe Festplatte und Lagerung an einem anderen Ort fehlt mir anscheinend die nötige Disziplin.
Was etwas nervt, ist dass das Mainboard kein suspend/resume beherrscht. Da das NAS nicht ständig läuft dauert das Booten ca 2 min vom Einschalten bis zur Verfügbarkeit der VMs.

Für ein reines FOSS System sehe da heute theorethisch kein Verbesserungspotential.
Dein System ist echt ausgeglügelt, super.
Danke.
Wie sieht es mit dem Stromverbrauch aus, läuft dein System ständig?
Gemessen habe ich das nie wirklich, es wird aber trotz der sparsamen Hardware deutlich mehr sein als bei einer kleinen Synology. Insbesondere der fehlende suspend/resume nervt hier.
FreeNAS ist im Tagesmittel zu ca. 50% eingeschaltet. Der Raspberry läuft 24x7, d.h. ich kann auch Dokumente Scannen wenn das NAS aus ist. Die fehlenden Scans werden per cron dann nachgezogen.
 
Wie hoch ist der Warnungs und Reparatur Aufwand?
Wie Hart ist das System?
 
Wie hoch ist der Warnungs und Reparatur Aufwand?
Wie Hart ist das System?

Wartung: hin und wieder FreeNAS updates einspielen, geht per UI.
Reparatur: bis dato nicht nötig. Festplatten austauschen bedeutet Kiste runterfahren, 4 schrauben, Platte raus, Platte rein. Das Gehäuse habe ich bewusste ohne Plattenschlitten von vorne gewählt. Eine komplett schwarze Box gefällt mir einfach besser.

Hart: Das Gehäuse ist aus Metall, also schon hart :) Im Ernst: FreeNAS setzt auf FreeBSD auf, das ich als recht sicher erachte. Zumal die Kiste nur per VPN zugänglich ist.
 
Der Wartungsaufwand ist bei diesem System geringer als bei Windows. Synology, QNap.
Zudem hat darthvader volle Kontrolle über das System.
Zukunftssicher ist es auch.

Durch RaidZ2 und ZFS ist darthvader auch gegen Hardwaredefekt bestens gerüstet.
"Bombensicher" ist das System, wie ein Ziegelstein.

FreeBSD ist so ziemlich das sicherste freie OS.

https://de.wikipedia.org/wiki/FreeBSD
https://de.wikipedia.org/wiki/Berkeley_Software_Distribution

Ein professionelles System würde ich sagen.

Und das alles für 100 Seiten. :)


Auf Grund der Flexibilität und den Hardwareanforderungen tendiere ich eher zu OpenMediaVault.


-------------------------------------------------------------------
Der TE hat bestimmt an etwas anderes gedacht, erheblich kleiner die Lösung.

Beispiel:

https://www.elo.com/de-de/produkte/elo-produkte/elooffice.html

https://shop.elooffice.com/

So ein System nervt jedoch, weil Windows, herstellerabhängig und Updatekosten entstehen!


------------------------------------------------------------------


https://www.pro-linux.de/artikel/2/1892/dokumente-digitalisieren-und-zukunftssicher-aufbewahren.html

Paperless:

https://paperless.readthedocs.io/en/latest/

gscan2pdf:

https://sourceforge.net/projects/gscan2pdf/

OMV mit Debian, Nachinstallation:

http://kabasumo.de/wordpress/blog/2015/03/01/openmediavault-omv-installieren-mit-debian-minimal/

https://wiki.debian.org/InstallOpenMediaVaultOnDebian

Code:
deb http://packages.openmediavault.org/public arrakis main



- - - Beitrag zusammengeführt - - -

Hallo darhtvadar,

evtl. kann EncFS deine Cloudverschlüsselung lösen:

https://wiki.ubuntuusers.de/Howto/EncFS_in_der_Cloud/

- - - Beitrag zusammengeführt - - -






Mir fehlt noch ein automatisches, verschlüsseltes Backup der NAS Daten in die Cloud - liegt teils daran, dass FreeNAS das erst seit 11.2 direkt kann und da mein DSL recht schmal ist.




Hallo darhtvadar,

evtl. kann EncFS deine Cloudverschlüsselung lösen:

https://wiki.ubuntuusers.de/Howto/EncFS_in_der_Cloud/

EncFS ist auf Grund seiner "Datei-weisen" Verschlüsselung für diesen Einsatz prädestiniert, da dadurch nur jeweils geänderte Dateien synchronisiert werden und sich so der Datenstrom in Grenzen hält.

Stand April 2018: Sieben von zehn im Audit aufgezeigten Schwachstellen sind im EncFS-Bugtracker bis heute offen (Übersicht) und für eine irgendwann geplante Version 2.0 zurückgestellt. Die aktuelle Version ist 1.9.4 aus Januar 2018 (Changelog). Der Entwickler wies im August 2017 darauf hin, keine Zeit für größere Änderungen zu haben, und äußerte sich positiv zu dem von EncFS inspirierten Projekt gocryptfs.


Besser gocryptfs anschauen:

https://github.com/rfjakob/gocryptfs

https://nuetzlich.net/gocryptfs/

oder

https://rclone.org/

Übersicht:

https://nuetzlich.net/gocryptfs/comparison/



Meinhierlieblingslink:
https://blog.armbruster-it.de/2019/01/running-paperless-on-freenas/#more-632
 
Zuletzt bearbeitet:
Hallo xsid,

gibt's das auch zufällig für Windows?

OCRmyPDF scheint tesseract für die OCR Erkennung zu nutzen. Das hatte ich auch ausprobiert, das Ergebnis war aber das ich eine txt Datei erhielt in der einfach nur der Text rein geklatscht wurde. Die original Rechnung war nicht mehr zu erkennen.
Demnach braucht man wohl ein Programm wie OCRmyPDF, welches sich dann an der tesseract Erkennung bedient, richtig?
 
  • ok1.de
  • thinkstore24.de
  • Preiswerte-IT - Gebrauchte Lenovo Notebooks kaufen
Zurück
Oben