Dokumentenmanagement für papierloses Büro

Ich muss meine Aussagen von oben anpassen. Paperless-ng ist scheinbar EOL und wird nun von anderen Leuten als Paperless-ngx weitergeführt. Hab eben mal schnell die Migration gemacht. Ging super easy in weniger als 5 Minuten.
 
@darthvader
Hallo, bist Du hier noch aktiv, gibt Neues zu deinem System?

Scanner

Scanner Test Canon vs Plustek (Katastrophen im Vergleich)​

Code:
https://www.youtube.com/watch?v=PRqxgG972Bk

Docker Container kann man auch mit Windows benutzen.

Paperless-ngx: Der Wechsel (Update 2022-06)​

Anleitung

Ein Interessanter Thread:

 
Zuletzt bearbeitet:
Ja, es ist eine Lösung für ein NAS oder Serverbasiert. Hat einiges an Vorteilen (z.B. theoretisch als Cloud-Lösung nutzbar, da anderes OS nicht betroffen von den gleichen Viren etc.) - aber ja, man braucht halt ein NAS oder ein Raspberry oder irgendetwas in dieser Richtung.
Ob man in Zeiten des angesagten Stromsparens ein NAS/Server/RasPi wirklich ständig laufen haben muss, muss wohl jeder für sich ausmachen. Für meine Dokumentenverwaltung sehe ich momentan auch nicht die Notwendigkeit, diese unbedingt per Cloud bereitstellen zu müssen.
Ein NAS hätte ich zwar, ist aber ein völlig veraltetes Zyxel, das seit sicher mehr als 5 Jahren EOL hat. Ich nutze das als Archiv und als Teil meiner Backup-Strategie, was nach wie vor super klappt. Dementsprechend selten ist es aber auch eingeschaltet (und sowieso komplett vom Internet getrennt). Allein schon wegen Stromverbrauch muss es nicht ständig laufen und ein ewiges An/Aus, wenn man mal mit seinen Dokumenten arbeiten will, ist dann auch eher lästig.
Ob auf dem alten Teil sowas überhaupt läuft ist ebenso fraglich und selbst wenn das klappen sollte, vermute ich stark, dass es ziemlich zäh sein dürfte. Damals waren die NAS halt überwiegend als NAS und ggf. noch als Medienserver gedacht und bei Consumer-Geräten sind freie Ressourcen für anderes nicht vorgesehen gewesen. Mit neueren NAS ist das sicher anders, aber solange ich keinen Bedarf an eigener Cloud-Kapazität habe und das olle Stück seinen damals zugedachten Zweck noch voll erfüllt, muss ich auch nicht in neue Hardware investieren.

Grüße Thomas
 
Ja, es ist eine Lösung für ein NAS oder Serverbasiert. Hat einiges an Vorteilen (z.B. theoretisch als Cloud-Lösung nutzbar, da anderes OS nicht betroffen von den gleichen Viren etc.) - aber ja, man braucht halt ein NAS oder ein Raspberry oder irgendetwas in dieser Richtung.

Die Aussage ich nicht ganz richtig, man kann einen virtuellen Server mit Docker auch local betreiben.

Eine Fritz!Box 7590 mit USB HDD ist als Speicherort auch sehr gut geeignet.

 
Zuletzt bearbeitet:
man kann einen virtuellen Server mit Docker auch local betreiben.
Ein Linux als virtuelle Maschine geht sicher auch, das stimmt. Aber auch das ist für eine einzelne Anwendung ja schon eine riesen Keule.

Grüße Thomas
 
Danke für den Link, ähnliches hatte ich per Google auch schon gefunden. Jetzt muss nur noch das Wetter schlecht genug werden, damit mein Spieltrieb groß genug wird. 😁

Grüße Thomas
 
Ich kann da für Endnutzer auch mal Paperwork => https://openpaper.work/de/ empfehlen.

Leider hat dieses Programm nicht das gleiche Standing, was so Branding/Youtube-Repräsentanz für einen guten Eindruck angeht, aber sonst läuft es super, finde ich.
  • Eigenbeschreibung der Seite:
    Dokumente zu sortieren ist die Arbeit einer Maschine.
    Scannen und importieren Sie Ihre persönlichen Dokumente mit Paperwork und finden Sie sie mit einem Fingerschnipsen wieder.
  • Noch mehr von Ubuntuusers:
    Paperwork 🇬🇧 ist ein in Python 3 verfasstes Programm zur Digitalisierung, Indexierung und Archivierung von Dokumenten aller Art. Die Vorlagen werden eingescannt (SANE-fähiger Scanner nötig) oder vorhandene Bilddateien importiert. Mittels tesseract-ocr werden sie mit einer durchsuchbaren Textebene versehen, die Seitenausrichtung wird dabei automatisch erkannt und die Seite ggf. aufrecht gedreht. Das Programm bietet ein automatisches Indexierungs- und Suchsystem, das alle erkannten Wörter beinhaltet, zusätzlich können die Dokumente mit weiteren "Labels" und Schlagwörtern versehen werden. Die Vorlagen werden als .jpeg-Dateien mit dazugehörigen hOCR-Dateien gespeichert.
  • Youtube-Seite des Entwicklers: https://www.youtube.com/user/jflesch2/videos
 
https://openpaper.work/de/ hat nur 1 Entwickler, das ist für mich ein Ausschlusskriterium.

Geirrt habe ich mich:



Sogar in den Debianreporsitorys enthalten:


Oder bei Ubuntu:


Vergleich:

Code:
https://www.reddit.com/r/selfhosted/comments/shq3df/paperlessng_vs_paperwork/





Paperless:

 
Zuletzt bearbeitet:
sane-scan-pdf nutzt Tesseract, ich bin damit recht zufrieden.

Hallo, welche OCR Software gibt es für Linux und ist außer Tesseract empfehlenswert?

MfG

xsid

Edit:



Terminal Programme:

tesseract-ocr

ocrmypdf

OCR-Programme - Vorstellung



Linux Scanner, Anfrage

paperless-ngx, Devices:

darthvader hat einen Fujitsu ix500
 
Zuletzt bearbeitet:
Die Anleitung ist nicht mehr aktuell (aus 2019):

Mein Grobplan, nur ganz ganz grob:
FreeNAS, in 2022 in TrueNAS Core aufgegegangen beschränkt bezüglich der Hardwareauswahl.

paperless.jpg

Scanner: Fujitsu fi-6110

Entwurf:
- OMV 6 installieren
- docker-ce und docker-compose installieren

Code:
https://nerdiy.de/howto-raspberry-pi-docker-container-mit-openmediavault-omv-und-portainer-nutzen/

https://goneuland.de/paperless-ng-dokumentenverwaltung-mittels-traefik-und-docker-installieren/

- paperless-ngx installieren
Code:
 https://paperless-ngx.readthedocs.io/en/latest/setup.html#setup-docker-hub

Entwurf2:
- OMV 6 installieren
- podman installieren

- paperless-ngx Script-Install jdoss Podman + Paperless NGX
Code:
https://github.com/jdoss/ppngx
 
Zuletzt bearbeitet:
Hallo,

welche Möglichkeiten gibt es um Emaileingänge (*.eml Dateien) in ein DMS, z. B. paperless-ngx einzupflegen
Bzw. wie organisiere ich so etwas?

Bei EloOffice war so etwas möglich.

MfG
xsid
 
Hallo!
Emaileingänge (*.eml Dateien) in ein DMS
Wie ich gerade gesehen und gelernt habe, bietet Thunderbird an, EML-Dateien als HTML, (reinen) Text oder auch als Text mit Binärdaten (BASE64-codiert) zu speichern. Daraus schließe ich, dass es nicht das eine EML-Dateiformat gibt.

Im Zweifelsfall würde ich die Mail als PDF im DMS speichern. Ein Skript könnte ein PDF erstellen, das per REST-API im DMS gespeichert und ggf. um ein paar Metadaten angereichert wird.

Leider kann die API nicht den Mail-Inhalt als Text für die Volltextsuche aufnehmen, wenn ich mir die Doku anschaue. (Schon etwas "schräg", wenn man dann den Textinhalt per OCR erfassen muss.)
 
Eine recht aufwandsarme Möglichkeit ist, einen PDF-Drucker zu installieren. Jede zu archivierende Mail würde man dann ausdrucken und wie andere Dokumente im DMS speichern.
 
Hm, machst Du das?

Code:
https://blog.armbruster-it.de/2019/01/running-paperless-on-freenas/

Kennt jemand eine aktuellere Anleitung für Debian 11?

Der Abschnitt "Scanning on the RaspberryPI2", besonders die Scripte sind wichtig.
Das ist vermutlich mit einem Debian 11 Bulleye x86 eins zu eins umsetzbar.

/etc/scandb/scripts/sane-scan-pdf.script
Code:
logger -t "scanbd: $0" "Begin of $SCANBD_ACTION for device $SCANBD_DEVICE"

scanner=$(echo "$SCANBD_DEVICE" | cut -d ':' -f 1)
SANE_CONFIG_DIR=/etc/scanbd /usr/local/bin/scan -d -s A4 --unpaper --ocr --deskew --crop -v \
   --skip-empty-pages -o "/tmp/`date +%Y%m%d%H%M%SZ` - generic.pdf" 2>&1
rsync -av --remove-source-files /tmp/*pdf rsync://rancheros/volume

logger -t "scanbd: $0" "End   of $SCANBD_ACTION for device $SCANBD_DEVICE"


/etc/scanbd/scanbd.conf
Code:
action scan {
    filter = "^scan.*"
    numerical-trigger {
        from-value = 1
        to-value   = 0
    }
    desc   = "Scan to file"
    script = "sane-scan-pdf.script"
}

Schade das @darthvader hier nicht mehr aktiv ist. :-(


scanbd

Einzugsscanner am RPI


Anleitung für DMS Paperless auf Homeserver

Hinweise, Erklärugen: Paperless-ngx auf Ubuntu 22.04 LTS Server installieren


Docspell




Docspell can read many file types. ZIP and EML (e-mail file format) files are extracted and their contents imported.


Code:
https://stadt-bremerhaven.de/dokumentenverwaltung-paperless-ng-mit-docker-auf-einem-synology-nas-installieren/comment-page-2/

Josch
11. Februar 2022 um 17:17 Uhr

Zwei Punkte:
1. Docspell speichert alles in einer DB. D.h. für Menschen, die ihre Originale sichtbar in einem Filesystem wünschen, ist das nichts. Es gibt aber ein Export Befehl, der alle Dokumente mit Metadaten exportieren kann. Das verdoppelt die Daten natürlich und ist kein 100% Ersatz. Es gibt eine FAQ zu docspell, die beschreibt, warum man lieber in der DB bleibt:
https://docspell.org/docs/faq/#where-are-my-files-stored
2. Es gibt ein Script, dass Paperless-Dokumente importiert. so kann man beides mal ausprobieren, ohne die bereits mühsam importierten Dokumente nochmal zu verschlagworten:
https://github.com/eikek/docspell/issues/358
Das wird vermutlich auch für paperless-ng funktionieren.
Grundsätzlich bleibt aber meine Einschätzung bestehen, dass docspell deutlich mehr Ressourcen benötigt, als paperless-ng. Aber dafür hat man mehr Flexibilität. Was auch nicht vernachlässigbar ist: Docspell ist weiterhin in Entwicklung und ist nicht von einer Person abhängig.
Beste Grüße!


Wer hat Erfahrung mit Docspell?
 
Zuletzt bearbeitet:
Hallo, wer von euch hat Papperless-ngx ausprobiert oder verwendet es?

Hallo, wer von euch hat Dospell ausprobiert oder verwendet es?

Beides habe ich installiert, die Erleuchtung für die Auswahl eines beiden Systeme habe ich bis jetzt nicht.
 
Paperless-ngx verrichtet bei mir auf nem UNRAID NAS seine Dienste ohne jegliche Probleme und das seit etwa einem Jahr (erst -ng und seit kurzem dann auf -ngx migriert). Docspell kenne ich nicht.
 
Docspell
kann z. B. auch mit *.eml Emaildateien und einige ander gängige Dateiformate umgehen.

RW1Mf6y.jpg



Paperless-ngx
Wieso hattest Du dich damals für Paperless-ngx enschieden?
Kann ich dir Paperless-ngx wegnehmen und Du kommst trotzdem mit Filemanager an deine *.pdf Dateien?
Kann Paperless-ngx auf einer HDD alle vorhandenen *.pdf Files automatisch einlesen?
 
Zuletzt bearbeitet:
Ich bin "noch" bei paperless-ng. Ja, du kommst immer an alle Dokumente ran - sind in einem Ordner (documents) enthalten. Also Original (in der Originalversion) oder als PDF (halt verarbeitet, d.h. mit OCR etc.). Man würde halt die Sortierung/Katalogisierung verlieren.

Weshalb Paperless? Läuft schön in nem Container, ist OS und kostenlos. Hat eigentlich alle relevanten Funktionen.

Kann Paperless-ngx auf einer HDD alle vorhandenen *.pdf Files automatisch einlesen?
Nein, soll es auch garnicht. Es gibt ein Ordner ("Consume"), wo alle Daten reinkommen sollen - von da zieht sich Paperless die Dateien und speichert sie dann entsprechend als Original + als OCR ein.

Docspell sieht tatsächlich ziemlich interessant aus. Gerade der Support für viele Dokumente ist spannend. Schlussendlich aber auch die Frage, wie gut der Export funktioniert - und wie relevant das überhaupt ist. Ich würde für relevante Dokumente eh PDFs speichern. Aber auch Mailversand klingt spannend. Probier es doch einfach mal aus und berichte dann.
 
  • ok1.de
  • thinkstore24.de
  • Preiswerte-IT - Gebrauchte Lenovo Notebooks kaufen
Zurück
Oben