Du tippst Rechnungen ab. Jeden Tag. Seit Jahren. Rechnungsnummer, Datum, Betrag, Lieferant – alles von Hand ins System. Und wenn du mal eine vergisst, merkst du es erst, wenn die Mahnung kommt. Das muss nicht sein. Es gibt eine Lösung, die auf deinem eigenen Server läuft, keine monatlichen Kosten verursacht und deine Daten dort lässt, wo sie hingehören: bei dir.
Was ist Paperless-ngx?
Paperless-ngx ist ein Open-Source-Dokumentenmanagementsystem. Das klingt sperrig, heißt aber im Kern: Du wirfst Dokumente rein, und das System sortiert, durchsucht und archiviert sie für dich.
Das Besondere daran:
- Komplett self-hosted – läuft auf deinem eigenen Server oder NAS
- OCR eingebaut – erkennt Text in gescannten PDFs und Fotos automatisch
- Volltextsuche – finde jede Rechnung in Sekunden, egal wie alt
- Tags, Korrespondenten, Dokumenttypen – automatische Klassifizierung nach deinen Regeln
- Keine laufenden Kosten – keine Cloud-Abos, keine Nutzer-Limits
Das Projekt wird aktiv weiterentwickelt, hat eine große Community und ist seit Jahren produktiv im Einsatz – auch bei mir. Ich verwalte damit mehrere tausend Dokumente, und die Suche dauert nie länger als eine Sekunde.
So funktioniert die automatische Rechnungsverarbeitung
Der Ablauf ist einfacher, als du denkst. Hier die einzelnen Schritte:
1. Dokument landet im System
Du kannst Rechnungen auf verschiedenen Wegen einliefern:
- Per E-Mail: Paperless-ngx überwacht ein Postfach und zieht Anhänge automatisch rein
- Per Scanner: Scan-to-Folder, Paperless überwacht den Ordner
- Per Drag & Drop: Einfach im Webinterface hochladen
- Per App: Foto mit dem Handy, direkt hochladen
2. OCR-Erkennung
Sobald das Dokument im System ist, startet die OCR-Engine. Paperless nutzt Tesseract für die Texterkennung. Unterstützt werden über 100 Sprachen, auch Deutsch mit Umlauten funktioniert zuverlässig. Zusätzlich kommen Tika und Gotenberg zum Einsatz – Tika extrahiert Text aus komplexen Dateiformaten, Gotenberg konvertiert Office-Dokumente in durchsuchbare PDFs.
3. KI-Klassifizierung
Hier wird es spannend. Mit paperless-gpt lässt sich eine KI-Schicht darüberlegen. Das Modell analysiert den erkannten Text und:
- Erkennt den Lieferanten automatisch
- Ordnet den Dokumenttyp zu (Rechnung, Angebot, Lieferschein)
- Vergibt passende Tags (Material, Dienstleistung, wiederkehrend)
- Extrahiert Rechnungsnummer, Datum und Betrag
Das Ganze läuft lokal – kein Dokument verlässt deinen Server.
4. Fertig
Nach 3-5 Sekunden ist die Rechnung vollständig erfasst, kategorisiert und durchsuchbar archiviert. Du kannst sie jederzeit über die Volltextsuche wiederfinden, nach Tags filtern oder nach Datum sortieren.
Vorher/Nachher: Der Unterschied in Zahlen
| Kriterium | Manuell | Mit Paperless-ngx + KI |
|---|---|---|
| Zeit pro Rechnung | 10-15 Minuten | 3-5 Sekunden |
| Fehlerquote | 5-8 % (Tippfehler) | unter 1 % |
| Durchsuchbarkeit | Nur wenn sauber abgelegt | Volltextsuche über alles |
| Wiederfinden | Ordner durchsuchen, 2-5 Min. | Sofort, unter 1 Sekunde |
| DSGVO-konform | Kommt auf den Ablageort an | Ja, alles auf eigenem Server |
| Kosten pro Monat | Deine Arbeitszeit | 0 € (Strom für den Server) |
| Skalierung | Mehr Rechnungen = mehr Arbeit | Mehr Rechnungen = gleicher Aufwand |
Bei 20 Rechnungen pro Woche sparst du über 4 Stunden pro Woche. Das sind mehr als 200 Stunden im Jahr. Rechne das mal auf deinen Stundensatz um.
Was du dafür brauchst
Die gute Nachricht: Du brauchst keine teure Infrastruktur.
Hardware:
- Ein kleiner Server, NAS oder sogar ein Raspberry Pi 4 reicht für den Einstieg
- Für KI-Klassifizierung: Ein Server mit mindestens 8 GB RAM, besser 16 GB
- Oder ein bestehender Homeserver / VPS – wenn du schon einen hast, läuft Paperless dort einfach mit
Software:
- Docker – Paperless-ngx wird als Container ausgeliefert, Installation in Minuten
- Paperless-ngx – das Hauptsystem
- paperless-gpt – optional, für die KI-gestützte Klassifizierung
- Tika + Gotenberg – für erweiterte Dokumentenformate
Setup-Zeit:
- Grundinstallation: 30-60 Minuten wenn du Docker kennst
- Mit KI-Klassifizierung und Feintuning: 2-3 Stunden
- Oder du lässt dir helfen und hast alles an einem Nachmittag produktiv laufen
DSGVO: Warum Self-Hosted hier Pflicht ist
Rechnungen enthalten personenbezogene Daten. Namen, Adressen, Bankverbindungen, Steuernummern. Wenn du die in eine US-Cloud lädst – egal ob Google Drive, Dropbox oder ein SaaS-Dokumentensystem – dann gelten die Regeln des Cloud-Anbieters. Und die sitzen in den USA.
Das bedeutet:
- Du brauchst einen Auftragsverarbeitungsvertrag (AVV) mit dem Anbieter
- Du musst die Übermittlung in Drittstaaten rechtfertigen können
- Seit dem Schrems-II-Urteil ist die Rechtsgrundlage für US-Transfers wackelig
- Dein Datenschutzbeauftragter (falls du einen hast) wird dir unangenehme Fragen stellen
Mit Paperless-ngx auf deinem eigenen Server:
- Keine Datenübermittlung – alles bleibt auf deiner Hardware
- Kein AVV nötig – du bist selbst der Verantwortliche
- Volle Kontrolle – du bestimmst, wer Zugriff hat
- Löschung garantiert – du löschst selbst, kein Hoffen auf Cloud-Anbieter
Das ist nicht paranoid. Das ist die Rechtslage. Und mit Self-Hosting erfüllst du sie, ohne dafür einen Anwalt zu brauchen.
Für wen sich das lohnt
Nicht jeder braucht ein Dokumentenmanagementsystem. Aber wenn du dich in einer dieser Kategorien wiederfindest, lohnt sich der Blick:
- Handwerksbetriebe – viele Eingangsrechnungen von Lieferanten, Materialbestellungen, Subunternehmer-Abrechnungen
- Steuerberater und Buchhalter – Mandantenbelege digital verwalten, durchsuchbar machen
- Kleine Unternehmen (5-50 Mitarbeiter) – ab 10 Rechnungen pro Woche rechnet sich die Automatisierung
- Freiberufler – weniger Papierkram, mehr Zeit für Projekte
- Jeder mit einem Schuhkarton voller Belege – der Scanner wird dein neuer Freund
Die Faustregel: Wenn du mehr als 10 Rechnungen pro Woche bearbeitest, holt sich das System in unter einem Monat rein.
Häufige Fragen
Funktioniert das auch mit handgeschriebenen Rechnungen?
Grundsätzlich ja, aber mit Einschränkungen. Die OCR-Engine Tesseract kann Handschrift erkennen, allerdings schwankt die Qualität stark. Gedruckte Rechnungen werden mit über 99 % Genauigkeit erkannt, bei Handschrift liegt die Quote eher bei 70-85 %. Für handgeschriebene Notizen auf gedruckten Rechnungen funktioniert es gut. Komplett handgeschriebene Rechnungen solltest du vorher prüfen. In der Praxis sind die meisten Rechnungen heute gedruckt oder als PDF – da gibt es keine Probleme.
Kann ich Paperless-ngx mit meiner Buchhaltungssoftware verbinden?
Ja. Paperless-ngx hat eine vollständige REST-API. Du kannst Dokumente abrufen, Metadaten auslesen und in andere Systeme übertragen. Über Workflow-Tools wie n8n lässt sich das ohne Programmierung automatisieren: Rechnung kommt rein, wird erkannt, Daten gehen automatisch in DATEV, Lexware, SevDesk oder was du nutzt. Auch ein Export als CSV für den Steuerberater ist mit wenigen Klicks möglich.
Was kostet die Einrichtung?
Die Software selbst ist kostenlos – Open Source, keine Lizenzgebühren, keine Nutzer-Limits. Was du brauchst, ist ein Server (ab ca. 5 €/Monat als VPS, oder eigene Hardware) und einmalig Zeit für die Einrichtung. Wenn du das selbst machst, kostet es dich einen Nachmittag. Wenn du Unterstützung willst, sprich mich an – ich richte dir das System ein, inklusive KI-Klassifizierung und Anbindung an deine bestehende Infrastruktur.
Wie sicher sind meine Daten?
So sicher, wie du deinen Server betreibst. Paperless-ngx unterstützt verschlüsselte Verbindungen (HTTPS), Benutzer-Authentifizierung und Berechtigungsmanagement. Da alles auf deiner Hardware läuft, hast du die volle Kontrolle über Backups, Zugriffsbeschränkungen und Netzwerk-Sicherheit. Kein Cloud-Anbieter kann gehackt werden und deine Rechnungen leaken, weil es keinen Cloud-Anbieter gibt.
Erlebe es live
Wie das in der Praxis aussieht, siehst du in unseren interaktiven Demos:
- Rechnungsverarbeitung mit KI – Live-Demo – Sieh in Echtzeit, wie KI eine Rechnung in Sekunden verarbeitet
- KI-Dokumentensortierung ausprobieren – Erlebe, wie KI einen ganzen Dokumentenstapel automatisch klassifiziert und ablegt
Du willst sehen, wie das in der Praxis aussieht? Probier es selbst aus in unserer Live-Demo – kein Login, kein Risiko, einfach ausprobieren. Wenn du wissen willst, wie Automatisierung im Handwerk insgesamt funktioniert, lies weiter bei Büroarbeit im Handwerk automatisieren. Und falls du neugierig bist, was sich sonst noch alles mit Self-Hosting machen lässt: 65 Docker-Container – was ich damit mache gibt dir einen Überblick über das, was bei mir im Alltag läuft.