Dokumentenmanagement für papierloses Büro

ede-server · 29 Dez. 2018

Hallo,
ich möchte für meinen Haushalt ein papierloses Büro einführen und somit Ordnung im Arbeitszimmer schaffen. Hierfür sollen Dokumente eingescannt und elektronisch verarbeitet und abgelegt werden. Die Originaldokumente kommen in eine „Monatsmappe“ und landen im Keller in einem Karton. Jedoch ist für mir die elektronische Verarbeitung und Ablage noch nicht ganz geklärt. Ich stehe zwischen 4 Optionen: 1 Lokal und Benennung der Ordner und PDFs manuell, 2 Ablage auf NAS und manueller Benennung der Dateien, 3 Lokal und mit Anwendungssoftware (PaperPort, ecoDMS etc.) oder 4 auf NAS und mit Anwendungssoftware (Bsp. EcoDMS als VM oder Docker)

Vorteil von Option 1 ist die unabhängig vom Betriebssystem und der Anwendungssoftware.
Vorteil einer Option mit NAS ist der Zugriff von mehreren Endgeräten ortsunabhängig.

Ich würde gerne die Dokumente verschlagworten und auch diese Schlagworte mehrfach belegen. Bsp. die Rechnung für eine KFZ Inspektion soll dem Schlagwort Rechnung, dem Schlagwort Auto und dem Schlagwort 2018 zuordenbar sein.
Ferner ist mir eine einfache Suchkomponente der gescannten OCR Dokumente wichtig. Eine zusätzliche Navigation per Schlagwort (Bsp. zeige mir alle Rechnungen von 2017 und 2018 an) wäre ideal.
Vorteil einer lokalen und manuellen Lösung ist, dass die Dokumentenablage einfach mitgesichert werden kann und die Dokumente rasch kopiert und nicht vorher aus dem DMS/Anwendungssoftware extrahiert werden müssen.
Welche Anwendungssoftware für Windows verwendet ihr hierzu?

detheo · 7 Juli 2022

Ich muss meine Aussagen von oben anpassen. Paperless-ng ist scheinbar EOL und wird nun von anderen Leuten als Paperless-ngx weitergeführt. Hab eben mal schnell die Migration gemacht. Ging super easy in weniger als 5 Minuten.

xsid · 8 Juli 2022

@darthvader
Hallo, bist Du hier noch aktiv, gibt Neues zu deinem System?

Scanner

Scanner Test Canon vs Plustek (Katastrophen im Vergleich)

Code:

https://www.youtube.com/watch?v=PRqxgG972Bk

Docker Container kann man auch mit Windows benutzen.

Paperless-ngx: Der Wechsel (Update 2022-06)

Paperless-ngx: Der Wechsel (Update 2022-06)

Paperless-ng ist tot. Lang lebe Paperless-ngx.

paperless.codeberg.page

Anleitung

Paperless-ng – Dokumentenverwaltung mittels Traefik und Docker installieren | goNeuland

Hier zeige ich euch, wie ihr die Dokumentenverwaltung paperless-ng mittels Docker und Traefik auf eurem Server installiert. Update 05.03.2022 Erstellung dieser Anleitung. Paperless-ng wird nicht mehr weiterentwickelt. Daher solltet ihr diese Anleitung NICHT mehr verwenden und auf den Nachfolger...

goneuland.de

Ein Interessanter Thread:

Wechsel von ecoDMS zu Paperless-ngx, Erfahrungsberichte

Hallo Ich nutzen nun schon seit längerer Zeit ecoDMS (im Docker) für meine Dokumenten-Verwaltung (Privathaushalt) und bin grundsätzlich recht zufrieden. Alle Prozesse sind etabliert und funktionieren. Wenns läuft, dann läufts... Wie ich kürzlich gelesen habe, ist mal wieder ein Update auf...

www.synology-forum.de

mectst · 8 Juli 2022

Aiphaton schrieb:
Ja, es ist eine Lösung für ein NAS oder Serverbasiert. Hat einiges an Vorteilen (z.B. theoretisch als Cloud-Lösung nutzbar, da anderes OS nicht betroffen von den gleichen Viren etc.) - aber ja, man braucht halt ein NAS oder ein Raspberry oder irgendetwas in dieser Richtung.

Ob man in Zeiten des angesagten Stromsparens ein NAS/Server/RasPi wirklich ständig laufen haben muss, muss wohl jeder für sich ausmachen. Für meine Dokumentenverwaltung sehe ich momentan auch nicht die Notwendigkeit, diese unbedingt per Cloud bereitstellen zu müssen.
Ein NAS hätte ich zwar, ist aber ein völlig veraltetes Zyxel, das seit sicher mehr als 5 Jahren EOL hat. Ich nutze das als Archiv und als Teil meiner Backup-Strategie, was nach wie vor super klappt. Dementsprechend selten ist es aber auch eingeschaltet (und sowieso komplett vom Internet getrennt). Allein schon wegen Stromverbrauch muss es nicht ständig laufen und ein ewiges An/Aus, wenn man mal mit seinen Dokumenten arbeiten will, ist dann auch eher lästig.
Ob auf dem alten Teil sowas überhaupt läuft ist ebenso fraglich und selbst wenn das klappen sollte, vermute ich stark, dass es ziemlich zäh sein dürfte. Damals waren die NAS halt überwiegend als NAS und ggf. noch als Medienserver gedacht und bei Consumer-Geräten sind freie Ressourcen für anderes nicht vorgesehen gewesen. Mit neueren NAS ist das sicher anders, aber solange ich keinen Bedarf an eigener Cloud-Kapazität habe und das olle Stück seinen damals zugedachten Zweck noch voll erfüllt, muss ich auch nicht in neue Hardware investieren.

Grüße Thomas

xsid · 8 Juli 2022

Aiphaton schrieb:
Ja, es ist eine Lösung für ein NAS oder Serverbasiert. Hat einiges an Vorteilen (z.B. theoretisch als Cloud-Lösung nutzbar, da anderes OS nicht betroffen von den gleichen Viren etc.) - aber ja, man braucht halt ein NAS oder ein Raspberry oder irgendetwas in dieser Richtung.

Die Aussage ich nicht ganz richtig, man kann einen virtuellen Server mit Docker auch local betreiben.

Eine Fritz!Box 7590 mit USB HDD ist als Speicherort auch sehr gut geeignet.

Scanner recommendations — Paperless-ngx 1.7.1 documentation

mectst · 8 Juli 2022

xsid schrieb:
man kann einen virtuellen Server mit Docker auch local betreiben.

Ein Linux als virtuelle Maschine geht sicher auch, das stimmt. Aber auch das ist für eine einzelne Anwendung ja schon eine riesen Keule.

Grüße Thomas

xsid · 9 Juli 2022

@mectst

Konfigurieren von Docker unter Windows

docs.microsoft.com

mectst · 9 Juli 2022

Danke für den Link, ähnliches hatte ich per Google auch schon gefunden. Jetzt muss nur noch das Wetter schlecht genug werden, damit mein Spieltrieb groß genug wird.

Grüße Thomas

enrico · 9 Juli 2022

Ich kann da für Endnutzer auch mal Paperwork => https://openpaper.work/de/ empfehlen.

Leider hat dieses Programm nicht das gleiche Standing, was so Branding/Youtube-Repräsentanz für einen guten Eindruck angeht, aber sonst läuft es super, finde ich.

Eigenbeschreibung der Seite:

Dokumente zu sortieren ist die Arbeit einer Maschine.
Scannen und importieren Sie Ihre persönlichen Dokumente mit Paperwork und finden Sie sie mit einem Fingerschnipsen wieder.

Zum Vergrößern anklicken....
Noch mehr von Ubuntuusers:

Paperwork ist ein in Python 3 verfasstes Programm zur Digitalisierung, Indexierung und Archivierung von Dokumenten aller Art. Die Vorlagen werden eingescannt (SANE-fähiger Scanner nötig) oder vorhandene Bilddateien importiert. Mittels tesseract-ocr werden sie mit einer durchsuchbaren Textebene versehen, die Seitenausrichtung wird dabei automatisch erkannt und die Seite ggf. aufrecht gedreht. Das Programm bietet ein automatisches Indexierungs- und Suchsystem, das alle erkannten Wörter beinhaltet, zusätzlich können die Dokumente mit weiteren "Labels" und Schlagwörtern versehen werden. Die Vorlagen werden als .jpeg-Dateien mit dazugehörigen hOCR-Dateien gespeichert.

Zum Vergrößern anklicken....
Youtube-Seite des Entwicklers: https://www.youtube.com/user/jflesch2/videos

xsid · 9 Juli 2022

https://openpaper.work/de/ hat nur 1 Entwickler, das ist für mich ein Ausschlusskriterium.

Geirrt habe ich mich:

GitHub - openpaperwork/paperwork: Personal document manager (Linux/Windows) -- Moved to Gnome's Gitlab

Personal document manager (Linux/Windows) -- Moved to Gnome's Gitlab - openpaperwork/paperwork

github.com

Contributors to openpaperwork/paperwork

Personal document manager (Linux/Windows) -- Moved to Gnome's Gitlab - Contributors to openpaperwork/paperwork

github.com

Sogar in den Debianreporsitorys enthalten:

Debian -- Informationen über Paket paperwork-gtk in bullseye

Oder bei Ubuntu:

Ubuntu – Details of package openpaperwork-gtk in jammy

Vergleich:

Code:

https://www.reddit.com/r/selfhosted/comments/shq3df/paperlessng_vs_paperwork/

Paperless-ng vs paperless-ngx - compare differences and reviews? | LibHunt

www.libhunt.com

Paperless:

Paperless-ngx: (Libre-) Office Dateien verwalten

Single Source of Truth

paperless.codeberg.page

xsid · 13 Juli 2022

darthvader schrieb:
sane-scan-pdf nutzt Tesseract, ich bin damit recht zufrieden.

Hallo, welche OCR Software gibt es für Linux und ist außer Tesseract empfehlenswert?

MfG

xsid

Edit:

Ein umfassender Leitfaden zu OCR mit Tesseract, OpenCV und Python – Data Intelligence

OCR = Optische Zeichenerkennung. Mit anderen Worten, OCR-Systeme wandeln ein zweidimensionales Textbild um, das maschinell gedruckt oder handgeschrieben sein kann

zephyrnet.com

Mein Workflow | Matthias Heil

Mir macht nicht nur das akademische Arbeiten an sich Spaß, sondern auch, am *wie* des Arbeitens zu feilen und technische Lösungen für dabei entstehende Probleme zu finden. Dafür nutze ich gerne freie und Open-Source-Software - mir gefällt die darin oft aufscheinende Idee des Teilens und der...

politikundbildung.de

Hilfe:Tesseract-Texterkennung – Wikisource

de.wikisource.org

Terminal Programme:

tesseract-ocr

Tesseract User Manual

Tesseract documentation

tesseract-ocr.github.io

ocrmypdf

OCRmyPDF documentation — ocrmypdf 17.8.0 documentation

OCR-Programme - Vorstellung

Tools 🔧 | MarketSplash

Best tools for digital professionals.

marketsplash.com

Linux Scanner, Anfrage

Linux - Dokumentenscanner für Linux ( debian, arch ) gesucht - Empfehlung !

Guten Tag Kann Jemand einen Dokumentenscanner für Linux empfehlen, welcher auch die nötigen Treiber und eine pragmatische/einfache GUI- mit liefert? Der in die Jahre gekommene Fujitsu ( scanSnap S510 ) tut rudimentär - ist aber von der GUI her nicht der Reisser. Sollte nur pdf, oder...

thinkpad-forum.de

paperless-ngx, Devices:

Scanners & Software — Paperless-ngx 1.10.0 documentation

darthvader hat einen Fujitsu ix500

xsid · 1 Aug. 2022

Die Anleitung ist nicht mehr aktuell (aus 2019):

Running Paperless on FreeNAS - Armbruster IT Blog

This year’s christmas holiday project was to install a “personal archive” tool. My choice is a tool called paperless. This post describes how I deployed to my existing FreeNAS box in order to help others with similar setups and have a documentation on the setup for myself. Motivation From a lot...

blog.armbruster-it.de

Mein Grobplan, nur ganz ganz grob:
FreeNAS, in 2022 in TrueNAS Core aufgegegangen beschränkt bezüglich der Hardwareauswahl.

Scanner: Fujitsu fi-6110

Entwurf:
- OMV 6 installieren
- docker-ce und docker-compose installieren

Code:

https://nerdiy.de/howto-raspberry-pi-docker-container-mit-openmediavault-omv-und-portainer-nutzen/

https://goneuland.de/paperless-ng-dokumentenverwaltung-mittels-traefik-und-docker-installieren/

- paperless-ngx installieren

Code:

 https://paperless-ngx.readthedocs.io/en/latest/setup.html#setup-docker-hub

Entwurf2:
- OMV 6 installieren
- podman installieren

- paperless-ngx Script-Install jdoss Podman + Paperless NGX

Code:

https://github.com/jdoss/ppngx

xsid · 10 Aug. 2022

Hallo,

welche Möglichkeiten gibt es um Emaileingänge (*.eml Dateien) in ein DMS, z. B. paperless-ngx einzupflegen
Bzw. wie organisiere ich so etwas?

Bei EloOffice war so etwas möglich.

MfG
xsid

quest · 11 Aug. 2022

Hallo!

xsid schrieb:
Emaileingänge (*.eml Dateien) in ein DMS

Wie ich gerade gesehen und gelernt habe, bietet Thunderbird an, EML-Dateien als HTML, (reinen) Text oder auch als Text mit Binärdaten (BASE64-codiert) zu speichern. Daraus schließe ich, dass es nicht das eine EML-Dateiformat gibt.

Im Zweifelsfall würde ich die Mail als PDF im DMS speichern. Ein Skript könnte ein PDF erstellen, das per REST-API im DMS gespeichert und ggf. um ein paar Metadaten angereichert wird.

Leider kann die API nicht den Mail-Inhalt als Text für die Volltextsuche aufnehmen, wenn ich mir die Doku anschaue. (Schon etwas "schräg", wenn man dann den Textinhalt per OCR erfassen muss.)

xsid · 12 Aug. 2022

@quest und alle User

Wie handhabt man so etwas in der Praxis?

MfG
xsid

quest · 12 Aug. 2022

Eine recht aufwandsarme Möglichkeit ist, einen PDF-Drucker zu installieren. Jede zu archivierende Mail würde man dann ausdrucken und wie andere Dokumente im DMS speichern.

xsid · 21 Aug. 2022

Hm, machst Du das?

Code:

https://blog.armbruster-it.de/2019/01/running-paperless-on-freenas/

Kennt jemand eine aktuellere Anleitung für Debian 11?

Der Abschnitt "Scanning on the RaspberryPI2", besonders die Scripte sind wichtig.
Das ist vermutlich mit einem Debian 11 Bulleye x86 eins zu eins umsetzbar.

/etc/scandb/scripts/sane-scan-pdf.script

Code:

logger -t "scanbd: $0" "Begin of $SCANBD_ACTION for device $SCANBD_DEVICE"

scanner=$(echo "$SCANBD_DEVICE" | cut -d ':' -f 1)
SANE_CONFIG_DIR=/etc/scanbd /usr/local/bin/scan -d -s A4 --unpaper --ocr --deskew --crop -v \
   --skip-empty-pages -o "/tmp/`date +%Y%m%d%H%M%SZ` - generic.pdf" 2>&1
rsync -av --remove-source-files /tmp/*pdf rsync://rancheros/volume

logger -t "scanbd: $0" "End   of $SCANBD_ACTION for device $SCANBD_DEVICE"

/etc/scanbd/scanbd.conf

Code:

action scan {
    filter = "^scan.*"
    numerical-trigger {
        from-value = 1
        to-value   = 0
    }
    desc   = "Scan to file"
    script = "sane-scan-pdf.script"
}

Schade das @darthvader hier nicht mehr aktiv ist. :-(

scanbd

Scanner Button Daemon - ArchWiki

Einzugsscanner am RPI

Einzugsscanner am RPI

Um wichtige Briefe immer gleich zu archivieren, habe ich mir einen alten Fujitsu fi-5110C geleistet. Der läuft nun autark an...

workpress.plattform32.de

DMS 2021 – wider dem Papierkrieg

Ich hatte mir schon lange vorgenommen Papierdokumente endlich mal "vernünftig" abzulegen. Dank Corona konnte ich mich mit Dokument-Management-Systemen beschäftigen und...

workpress.plattform32.de

Anleitung für DMS Paperless auf Homeserver

Papierloses Büro mit DMS Paperless-ngx auf Homeserver

Installiere Paperless-ngx mit Docker auf deinem Homeserver und verwandle dein Büro in ein papierloses System. Die komplette Anleitung für dein DMS-Setup.

deployn.de

Hinweise, Erklärugen: Paperless-ngx auf Ubuntu 22.04 LTS Server installieren

Paperless-ngx (v.1.7.0) auf Ubuntu 22.04lts Server installieren – www.fotoandnet.de

www.fotoandnet.de

Docspell

GitHub - eikek/docspell: Assist in organizing your piles of documents, resulting from scanners, e-mails and other sources with miminal effort.

Assist in organizing your piles of documents, resulting from scanners, e-mails and other sources with miminal effort. - eikek/docspell

github.com

Docspell – Simple Document Organizer

Docspell is a Document Management System (DMS), a system that asists in organizing your piles of documents, resulting from scanners, e-mails and other sources with miminal effort.

docspell.org

Docspell – Simple Document Organizer

Docspell is a Document Management System (DMS), a system that asists in organizing your piles of documents, resulting from scanners, e-mails and other sources with miminal effort.

docspell.org

Docspell can read many file types. ZIP and EML (e-mail file format) files are extracted and their contents imported.

Docspell auf Ubuntu 22.04lts installieren – www.fotoandnet.de

www.fotoandnet.de

Code:

https://stadt-bremerhaven.de/dokumentenverwaltung-paperless-ng-mit-docker-auf-einem-synology-nas-installieren/comment-page-2/

Josch
11. Februar 2022 um 17:17 Uhr

Zwei Punkte:
1. Docspell speichert alles in einer DB. D.h. für Menschen, die ihre Originale sichtbar in einem Filesystem wünschen, ist das nichts. Es gibt aber ein Export Befehl, der alle Dokumente mit Metadaten exportieren kann. Das verdoppelt die Daten natürlich und ist kein 100% Ersatz. Es gibt eine FAQ zu docspell, die beschreibt, warum man lieber in der DB bleibt:
https://docspell.org/docs/faq/#where-are-my-files-stored
2. Es gibt ein Script, dass Paperless-Dokumente importiert. so kann man beides mal ausprobieren, ohne die bereits mühsam importierten Dokumente nochmal zu verschlagworten:
https://github.com/eikek/docspell/issues/358
Das wird vermutlich auch für paperless-ng funktionieren.
Grundsätzlich bleibt aber meine Einschätzung bestehen, dass docspell deutlich mehr Ressourcen benötigt, als paperless-ng. Aber dafür hat man mehr Flexibilität. Was auch nicht vernachlässigbar ist: Docspell ist weiterhin in Entwicklung und ist nicht von einer Person abhängig.
Beste Grüße!

Wer hat Erfahrung mit Docspell?

xsid · 29 Aug. 2022

Hallo, wer von euch hat Papperless-ngx ausprobiert oder verwendet es?

Hallo, wer von euch hat Dospell ausprobiert oder verwendet es?

Beides habe ich installiert, die Erleuchtung für die Auswahl eines beiden Systeme habe ich bis jetzt nicht.

detheo · 29 Aug. 2022

Paperless-ngx verrichtet bei mir auf nem UNRAID NAS seine Dienste ohne jegliche Probleme und das seit etwa einem Jahr (erst -ng und seit kurzem dann auf -ngx migriert). Docspell kenne ich nicht.

xsid · 29 Aug. 2022

Docspell
kann z. B. auch mit *.eml Emaildateien und einige ander gängige Dateiformate umgehen.

Paperless-ngx
Wieso hattest Du dich damals für Paperless-ngx enschieden?
Kann ich dir Paperless-ngx wegnehmen und Du kommst trotzdem mit Filemanager an deine *.pdf Dateien?
Kann Paperless-ngx auf einer HDD alle vorhandenen *.pdf Files automatisch einlesen?

Aiphaton · 29 Aug. 2022

Ich bin "noch" bei paperless-ng. Ja, du kommst immer an alle Dokumente ran - sind in einem Ordner (documents) enthalten. Also Original (in der Originalversion) oder als PDF (halt verarbeitet, d.h. mit OCR etc.). Man würde halt die Sortierung/Katalogisierung verlieren.

Weshalb Paperless? Läuft schön in nem Container, ist OS und kostenlos. Hat eigentlich alle relevanten Funktionen.

xsid schrieb:
Kann Paperless-ngx auf einer HDD alle vorhandenen *.pdf Files automatisch einlesen?

Nein, soll es auch garnicht. Es gibt ein Ordner ("Consume"), wo alle Daten reinkommen sollen - von da zieht sich Paperless die Dateien und speichert sie dann entsprechend als Original + als OCR ein.

Docspell sieht tatsächlich ziemlich interessant aus. Gerade der Support für viele Dokumente ist spannend. Schlussendlich aber auch die Frage, wie gut der Export funktioniert - und wie relevant das überhaupt ist. Ich würde für relevante Dokumente eh PDFs speichern. Aber auch Mailversand klingt spannend. Probier es doch einfach mal aus und berichte dann.

Dokumentenmanagement für papierloses Büro

Member

Active member

Active member

Scanner Test Canon vs Plustek (Katastrophen im Vergleich)​

Paperless-ngx: Der Wechsel (Update 2022-06)​

Paperless-ngx: Der Wechsel (Update 2022-06) Paperless-ng ist tot. Lang lebe Paperless-ngx. paperless.codeberg.page

​

Well-known member

Active member

Well-known member

Active member

Well-known member

Active member

Active member

Active member

Active member

Active member

Member

Active member

Member

Active member

​

Active member

Active member

Active member

Well-known member

Werbung

Wir schützen deine Privatsphäre

Scanner Test Canon vs Plustek (Katastrophen im Vergleich)

Paperless-ngx: Der Wechsel (Update 2022-06)

Paperless-ngx: Der Wechsel (Update 2022-06)

Paperless-ng ist tot. Lang lebe Paperless-ngx.

paperless.codeberg.page