logo

Suletuxe.de
Linux - Nutzer
helfen
Linux - Nutzern

Willkommen, Gast. Bitte Login oder Registrieren.
28. März 2024, 13:35:02
Übersicht Hilfe Suche Login Registrieren

Amateurfunk Sulingen
Diskussions- und Newsboard der Linux Interessen Gruppe Suletuxe  |  allgemeine Kategorie  |  Welches Linux-Programm verwende ich anstelle von xyz (Windows)?  |  Thema: Paperless-ng (Ordnung im Dokumenten Chaos) « zurück vorwärts »
Seiten: [1] nach unten Drucken
   Autor  Thema: Paperless-ng (Ordnung im Dokumenten Chaos)  (Gelesen 4022 mal)
Sebastian
Sr. Member
****

Offline

Einträge: 363





Profil anzeigen
Paperless-ng (Ordnung im Dokumenten Chaos)
« am: 28. Mai 2021, 19:35:13 »

Hallo Suletuxe ich wollte mal schauen ob es euch noch gibt bei diesem ganzen Corona Wahnsinn hoffe es geht euch allen gut.

Ich bin letztens über ein sehr schönes Open Source DMS (Document Management System) gestoßen namens Paperless-ng.

Erstmal vorweg für wen eignet sich Paperless-ng:

Paperless eignet sich meiner Meinung nach an besten für Privathaushalte, da für Unternehmen doch noch wichtige Funktionen fehlen. Wie z.B. mehrere Benutzer verwalten oder aber auch eine Dokumenten Versionierung.

Was ist nun das besondere an Paperless-ng?

Die beste Funktion von Paperless finde ich das es Machine Learning Algorithmen verwendet um Dokumente für einen zu Sortieren. Natürlich brauch Paperless dafür erst mal ein paar Vorlagen das heist am Anfang ist es noch nicht sehr genau bzw. sortiert noch nichts. Aber sobald man Anfängt ein paar Dokumente in das System zu geben wird Paperless bei der Sortierung immer genauer, bis man irgendwann optimalerweiße an einem Punkt angelangt wo man so gut wie nichts mehr Korrigieren muss. Damit nimmt Paperless ein viel Arbeit bei der Sortierung und Archivierung seiner Dokumente ab.

Man muss sich bei der Dokumenten Erkennung aber auch nicht ganz auf den Automatismus verlassen wenn man das nicht möchte. Nach der Auto Erkennung kann man mit Hilfe von Regeln eingreifen indem z.B. noch geprüft wird ob das Wort Rechnung oder Kühlschrank oder was auch immer vorkommt und nur dann wenn auch diese Bedingung erfühlt ist bekommt das Dokument einen gewissen Korrespondenten, Dokumenten Typ oder Tag zugewiesen. Dabei ist man nicht nur auf Wörter begrenzt sonder man kann auch Regulare Ausdrücke verwenden wenn man das den möchte.

Hier noch eine kleine Feature Liste was Paperless sonst noch so kann:


  • Machine Learning Algorithm (Dokumenten Sortierung, Korrespondenten, Dokumenten-Typ, Datum, Tags)
  • OCR Texterkennung (ocrmypdf (tesseract) )
  • Dokumente bei Schieflage begradigen (Unpaper)
  • Dokumente von E-Mail Konten abholen und verarbeiten


Dabei ist das ganze so ziemlich Automatisiert. Ein Typischer Workflow kann so aussehen:

Man gibt seine Dokumente in das Verzeichnis das Paperless auf neue Dokumente überwacht, oder ladet diese über die Webschnittstelle hoch. Paperless führt nun eine Texterkennung der Dokumente durch falls diese noch keinen Text beinhalten, danach weißt Paperless auf Grundlage des erkannten Textes und der vorherigen Dokumente im bestand Korrespondenten, Dokumenten-Typ, Datum und Tags zu. Wenn vorher dabei ein Tag als Posteingangs Tag erkoren wurde bekommen neue Dokumente diesen automatisch zugewiesen. Somit kann man gleich sehen welche Dokumente neu hinzugekommen sind und eventuell noch geprüft werden müssen. Danach entfernt man einfach den Posteingangs Tag von den Dokumenten damit Paperless weis, ok die Dokumente wurden geprüft, und richtig einsortiert damit  kann ich sie als Vorlage für neue Dokumente heranziehen.

Ich persönlich finde die Empfohlene Arbeitsweise von Paperless mit Hilfe ASN (archive Serial Numbers) zu arbeiten sehr gut. Die Idee dahinter ist einfach das man seine Dokumente vor den Scan mit einer Laufenden Nummer nummeriert und diese in der Reihenfolge in einen Ordner Abheftet. Wenn man nun ein Dokument im Orginal auf Papier benötigt schaut man in Paperless vorher einfach nach der ASN nach und blättert dann zu dieser Stelle im Ordner. Andere Papiere ohne ASN die man nicht aufbewahren möchte entsorgt man dann einfach.

Paperless lasse ich bei mir auf einen kleinen Raspberry Pi 4 in einen Docker Container laufen. Wie man das Installiert bekommt steht gut Dokumentiert in der Dokumentation von Paperless.
Gespeichert

Andreas
Administrator
*****

Offline

Einträge: 1135



Linux von Innen

Profil anzeigen
Re:Paperless-ng (Ordnung im Dokumenten Chaos)
« Antwort #1 am: 29. Mai 2021, 18:40:21 »

Hallo Sebastian,

schön von Dir zu lesen! Ja - es gibt uns noch. Leider sind die allermeisten nicht auf ein Arbeiten und Lernen via Internet eingegangen - deswegen ist der Lernabstand mit Sicherheit gewachsen  . Aber zu seinem Glück: muss man selber gehen...

Docker? Nicht nötig wer eine Arch-basierte Distribution besitzt:
 2021-05-29_20-37.png
« Letzte Änderung: 30. Mai 2021, 07:50:04 von Andreas »
Gespeichert

Wissen ist das einzige Gut, das mehr wird, wenn man es teilt - wenn es Menschen gibt, die es weitergeben, und es Menschen gibt, die bereit sind, dieses Geschenk auch unter eigenem Einsatz anzunehmen.


Freiheit zu erkämpfen reicht nicht. Man muss sie auch verteidigen.

Sebastian
Sr. Member
****

Offline

Einträge: 363





Profil anzeigen
Re:Paperless-ng (Ordnung im Dokumenten Chaos)
« Antwort #2 am: 05. September 2022, 19:50:28 »

Da das paperless-ng Projekt stagniert, der Nachfolger ist davon jetzt paperless-ngx. Eine Migration der Daten nimmt paperless-ngx automatisch beim ersten Starten vor. Ein zurück zu paperless-ng gibt es danach ohne Backup nicht mehr.
Gespeichert

Seiten: [1] nach oben Drucken 
Diskussions- und Newsboard der Linux Interessen Gruppe Suletuxe  |  allgemeine Kategorie  |  Welches Linux-Programm verwende ich anstelle von xyz (Windows)?  |  Thema: Paperless-ng (Ordnung im Dokumenten Chaos) « zurück vorwärts »
Gehe zu: 


Login mit Username, Passwort und Session Länge

 Es wird die Verwendung "Blink"-basierter Browser und mindestens 1024x768 Pixel Bildschirmauflösung
für die beste Darstellung empfohlen
 
freie Software für freie Menschen!
Powered by MySQL Powered by PHP Diskussions- und Newsboard der Linux Interessen Gruppe Suletuxe | Powered by YaBB SE
© 2001-2004, YaBB SE Dev Team. All Rights Reserved.
- modified by Andreas Richter (DF8OE)
Valid XHTML 1.0! Valid CSS!