Follow along with the video below to see how to install our site as a web app on your home screen.
Anmerkung: This feature may not be available in some browsers.
https://www.youtube.com/watch?v=PRqxgG972Bk
Ob man in Zeiten des angesagten Stromsparens ein NAS/Server/RasPi wirklich ständig laufen haben muss, muss wohl jeder für sich ausmachen. Für meine Dokumentenverwaltung sehe ich momentan auch nicht die Notwendigkeit, diese unbedingt per Cloud bereitstellen zu müssen.Ja, es ist eine Lösung für ein NAS oder Serverbasiert. Hat einiges an Vorteilen (z.B. theoretisch als Cloud-Lösung nutzbar, da anderes OS nicht betroffen von den gleichen Viren etc.) - aber ja, man braucht halt ein NAS oder ein Raspberry oder irgendetwas in dieser Richtung.
Ja, es ist eine Lösung für ein NAS oder Serverbasiert. Hat einiges an Vorteilen (z.B. theoretisch als Cloud-Lösung nutzbar, da anderes OS nicht betroffen von den gleichen Viren etc.) - aber ja, man braucht halt ein NAS oder ein Raspberry oder irgendetwas in dieser Richtung.
Ein Linux als virtuelle Maschine geht sicher auch, das stimmt. Aber auch das ist für eine einzelne Anwendung ja schon eine riesen Keule.man kann einen virtuellen Server mit Docker auch local betreiben.
Dokumente zu sortieren ist die Arbeit einer Maschine.
Scannen und importieren Sie Ihre persönlichen Dokumente mit Paperwork und finden Sie sie mit einem Fingerschnipsen wieder.
Paperwork ist ein in Python 3 verfasstes Programm zur Digitalisierung, Indexierung und Archivierung von Dokumenten aller Art. Die Vorlagen werden eingescannt (SANE-fähiger Scanner nötig) oder vorhandene Bilddateien importiert. Mittels tesseract-ocr werden sie mit einer durchsuchbaren Textebene versehen, die Seitenausrichtung wird dabei automatisch erkannt und die Seite ggf. aufrecht gedreht. Das Programm bietet ein automatisches Indexierungs- und Suchsystem, das alle erkannten Wörter beinhaltet, zusätzlich können die Dokumente mit weiteren "Labels" und Schlagwörtern versehen werden. Die Vorlagen werden als .jpeg-Dateien mit dazugehörigen hOCR-Dateien gespeichert.
https://www.reddit.com/r/selfhosted/comments/shq3df/paperlessng_vs_paperwork/
sane-scan-pdf nutzt Tesseract, ich bin damit recht zufrieden.
https://nerdiy.de/howto-raspberry-pi-docker-container-mit-openmediavault-omv-und-portainer-nutzen/
https://goneuland.de/paperless-ng-dokumentenverwaltung-mittels-traefik-und-docker-installieren/
https://paperless-ngx.readthedocs.io/en/latest/setup.html#setup-docker-hub
https://github.com/jdoss/ppngx
Wie ich gerade gesehen und gelernt habe, bietet Thunderbird an, EML-Dateien als HTML, (reinen) Text oder auch als Text mit Binärdaten (BASE64-codiert) zu speichern. Daraus schließe ich, dass es nicht das eine EML-Dateiformat gibt.Emaileingänge (*.eml Dateien) in ein DMS
https://blog.armbruster-it.de/2019/01/running-paperless-on-freenas/
logger -t "scanbd: $0" "Begin of $SCANBD_ACTION for device $SCANBD_DEVICE"
scanner=$(echo "$SCANBD_DEVICE" | cut -d ':' -f 1)
SANE_CONFIG_DIR=/etc/scanbd /usr/local/bin/scan -d -s A4 --unpaper --ocr --deskew --crop -v \
--skip-empty-pages -o "/tmp/`date +%Y%m%d%H%M%SZ` - generic.pdf" 2>&1
rsync -av --remove-source-files /tmp/*pdf rsync://rancheros/volume
logger -t "scanbd: $0" "End of $SCANBD_ACTION for device $SCANBD_DEVICE"
action scan {
filter = "^scan.*"
numerical-trigger {
from-value = 1
to-value = 0
}
desc = "Scan to file"
script = "sane-scan-pdf.script"
}
Docspell can read many file types. ZIP and EML (e-mail file format) files are extracted and their contents imported.
https://stadt-bremerhaven.de/dokumentenverwaltung-paperless-ng-mit-docker-auf-einem-synology-nas-installieren/comment-page-2/
Josch
11. Februar 2022 um 17:17 Uhr
Zwei Punkte:
1. Docspell speichert alles in einer DB. D.h. für Menschen, die ihre Originale sichtbar in einem Filesystem wünschen, ist das nichts. Es gibt aber ein Export Befehl, der alle Dokumente mit Metadaten exportieren kann. Das verdoppelt die Daten natürlich und ist kein 100% Ersatz. Es gibt eine FAQ zu docspell, die beschreibt, warum man lieber in der DB bleibt:
https://docspell.org/docs/faq/#where-are-my-files-stored
2. Es gibt ein Script, dass Paperless-Dokumente importiert. so kann man beides mal ausprobieren, ohne die bereits mühsam importierten Dokumente nochmal zu verschlagworten:
https://github.com/eikek/docspell/issues/358
Das wird vermutlich auch für paperless-ng funktionieren.
Grundsätzlich bleibt aber meine Einschätzung bestehen, dass docspell deutlich mehr Ressourcen benötigt, als paperless-ng. Aber dafür hat man mehr Flexibilität. Was auch nicht vernachlässigbar ist: Docspell ist weiterhin in Entwicklung und ist nicht von einer Person abhängig.
Beste Grüße!
Nein, soll es auch garnicht. Es gibt ein Ordner ("Consume"), wo alle Daten reinkommen sollen - von da zieht sich Paperless die Dateien und speichert sie dann entsprechend als Original + als OCR ein.Kann Paperless-ngx auf einer HDD alle vorhandenen *.pdf Files automatisch einlesen?