Diskussions- und Newsboard der Linux Interessen Gruppe Suletuxe
allgemeine Kategorie => Welches Linux-Programm verwende ich anstelle von xyz (Windows)? => Thema von: Sebastian am 28. Mai 2021, 19:35:13

Titel: Paperless-ng (Ordnung im Dokumenten Chaos)
Beitrag von: Sebastian am 28. Mai 2021, 19:35:13

Hallo Suletuxe ich wollte mal schauen ob es euch noch gibt bei diesem ganzen Corona Wahnsinn hoffe es geht euch allen gut.

Ich bin letztens über ein sehr schönes Open Source DMS (Document Management System) gestoßen namens Paperless-ng (https://paperless-ng.readthedocs.io/en/latest/index.html).

Erstmal vorweg für wen eignet sich Paperless-ng:

Paperless eignet sich meiner Meinung nach an besten für Privathaushalte, da für Unternehmen doch noch wichtige Funktionen fehlen. Wie z.B. mehrere Benutzer verwalten oder aber auch eine Dokumenten Versionierung.

Was ist nun das besondere an Paperless-ng?

Die beste Funktion von Paperless finde ich das es Machine Learning Algorithmen verwendet um Dokumente für einen zu Sortieren. Natürlich brauch Paperless dafür erst mal ein paar Vorlagen das heist am Anfang ist es noch nicht sehr genau bzw. sortiert noch nichts. Aber sobald man Anfängt ein paar Dokumente in das System zu geben wird Paperless bei der Sortierung immer genauer, bis man irgendwann optimalerweiße an einem Punkt angelangt wo man so gut wie nichts mehr Korrigieren muss. Damit nimmt Paperless ein viel Arbeit bei der Sortierung und Archivierung seiner Dokumente ab.

Man muss sich bei der Dokumenten Erkennung aber auch nicht ganz auf den Automatismus verlassen wenn man das nicht möchte. Nach der Auto Erkennung kann man mit Hilfe von Regeln eingreifen indem z.B. noch geprüft wird ob das Wort Rechnung oder Kühlschrank oder was auch immer vorkommt und nur dann wenn auch diese Bedingung erfühlt ist bekommt das Dokument einen gewissen Korrespondenten, Dokumenten Typ oder Tag zugewiesen. Dabei ist man nicht nur auf Wörter begrenzt sonder man kann auch Regulare Ausdrücke verwenden wenn man das den möchte.

Hier noch eine kleine Feature Liste was Paperless sonst noch so kann:


  • Machine Learning Algorithm (Dokumenten Sortierung, Korrespondenten, Dokumenten-Typ, Datum, Tags)
  • OCR Texterkennung (ocrmypdf (tesseract) )
  • Dokumente bei Schieflage begradigen (Unpaper)
  • Dokumente von E-Mail Konten abholen und verarbeiten


  • Dabei ist das ganze so ziemlich Automatisiert. Ein Typischer Workflow kann so aussehen:

    Man gibt seine Dokumente in das Verzeichnis das Paperless auf neue Dokumente überwacht, oder ladet diese über die Webschnittstelle hoch. Paperless führt nun eine Texterkennung der Dokumente durch falls diese noch keinen Text beinhalten, danach weißt Paperless auf Grundlage des erkannten Textes und der vorherigen Dokumente im bestand Korrespondenten, Dokumenten-Typ, Datum und Tags zu. Wenn vorher dabei ein Tag als Posteingangs Tag erkoren wurde bekommen neue Dokumente diesen automatisch zugewiesen. Somit kann man gleich sehen welche Dokumente neu hinzugekommen sind und eventuell noch geprüft werden müssen. Danach entfernt man einfach den Posteingangs Tag von den Dokumenten damit Paperless weis, ok die Dokumente wurden geprüft, und richtig einsortiert damit kann ich sie als Vorlage für neue Dokumente heranziehen.

    Ich persönlich finde die Empfohlene Arbeitsweise (https://paperless-ng.readthedocs.io/en/latest/usage_overview.html#the-recommended-workflow) von Paperless mit Hilfe ASN (archive Serial Numbers) zu arbeiten sehr gut. Die Idee dahinter ist einfach das man seine Dokumente vor den Scan mit einer Laufenden Nummer nummeriert und diese in der Reihenfolge in einen Ordner Abheftet. Wenn man nun ein Dokument im Orginal auf Papier benötigt schaut man in Paperless vorher einfach nach der ASN nach und blättert dann zu dieser Stelle im Ordner. Andere Papiere ohne ASN die man nicht aufbewahren möchte entsorgt man dann einfach.

    Paperless lasse ich bei mir auf einen kleinen Raspberry Pi 4 in einen Docker Container laufen. Wie man das Installiert (https://paperless-ng.readthedocs.io/en/latest/setup.html#installation) bekommt steht gut Dokumentiert in der Dokumentation von Paperless.

Titel: Re:Paperless-ng (Ordnung im Dokumenten Chaos)
Beitrag von: Andreas am 29. Mai 2021, 18:40:21

Hallo Sebastian,

schön von Dir zu lesen! Ja - es gibt uns noch. Leider sind die allermeisten nicht auf ein Arbeiten und Lernen via Internet eingegangen - deswegen ist der Lernabstand mit Sicherheit gewachsen :'(. Aber zu seinem Glück: muss man selber gehen...

Docker? Nicht nötig wer eine Arch-basierte Distribution besitzt:

Titel: Re:Paperless-ng (Ordnung im Dokumenten Chaos)
Beitrag von: Sebastian am 05. September 2022, 19:50:28

Da das paperless-ng Projekt stagniert, der Nachfolger ist davon jetzt paperless-ngx. Eine Migration der Daten nimmt paperless-ngx automatisch beim ersten Starten vor. Ein zurück zu paperless-ng gibt es danach ohne Backup nicht mehr.


Diskussions- und Newsboard der Linux Interessen Gruppe Suletuxe | Powered by YaBB SE
© 2001-2003, YaBB SE Dev Team. All Rights Reserved.