Gibt es eine KI, die meine Dateien und E-Mails aufräumt? Nein, sie kann es auch nicht geben. Aber das ist auch nicht schlimm: Es gibt einfachere Wege.
Was bedeutet Aufräumen?
Jetzt kommen die ersten Anfragen an unser Unternehmen, ob man nicht auch KI nutzen könnte, um Dokumentenbestände zu sortieren. Die Kunden haben die Hoffnung, dass elektronische Praktikanten ihnen die mühselige Arbeit abnehmen.
Es gibt tatsächlich Programme und Dienste, die versprechen, Dokumente und E-Mails zu sortieren. Aber ihre Funktionen sind sehr begrenzt. Sie können erkennen, ob eine E-Mail zu einem Newsletter gehört oder ob sich aus einer Nachricht Aufgaben ergeben. Das ist manchmal hilfreich.
Aber Aufräumen bedeutet mehr: Wir wollen Kontext herstellen. Wir haben so viele Dokumente und Nachrichten, weil wir Arbeit zu erledigen haben. Wir wollen Vorgänge, Aufträge oder Projekte abschließen. Aufräumen bedeutet mehrere Dinge:
- Dokumente und Nachrichten werden dem richtigen Vorgang (Auftrag, Projekt) zugeordnet.
- Wir erkennen, was die nächsten Aufgaben sind.
- Wir unterscheiden kurzlebige Vorgangsdokumente von langlebigen Wissensdokumenten.
- Erledigte Dinge werden archiviert.
![]() |
| Bild mit Google Gemini erzeugt. |
Auf diese Weise schaffen wir Ordnung und wir erkennen, was als Nächstes zu tun ist. Warum kann eine KI da nicht helfen?
KI muss spezifisch trainiert werden
KI-Systeme werden in einer Trainingsphase mit sinnvollen Daten gefüttert. Man stellt der KI Ausgangsdaten und Ergebnisdaten vor. Die Trainer zeigen der KI eine Datei und den Vorgang, zu dem sie gehört. Das wiederholen sie für alle Dateien in den Trainingsdaten. Je nach System oder Algorithmus stellt die KI eine passende Verbindung her. Diese Verbindungen werden später benutzt, um neue Situationen richtig einzuschätzen.
Da jede Ablage unterschiedlich ist, müsste jedes Unternehmen seine eigene KI trainieren. Dieser Aufwand, selbst wenn er sich nur auf wenige Personen bezieht, ist nicht wirtschaftlich. Zudem haben wir wahrscheinlich eine signifikante Fehlerrate.
Ungeklärt ist noch, was bei neuen Vorgängen und Prozessen passiert, die die KI nicht kennt. Ordnet sie neue Dokumente dann alten Vorgängen zu? Muss die KI nachtrainiert werden?
Jetzt kann man ja einwenden, dass die großen Sprachmodelle von Chat-GPT und Co. schon gut trainiert seien. Schauen wir uns das einmal an.
Große Sprachmodelle sind wahrscheinlich keine Lösung
Zunächst haben wir ein Problem mit der Vertraulichkeit. Ich rate ausdrücklich davon ab, den gesamten Datenbestand an einen einen externen Dienstleister wie OpenAI oder Anthropic zu geben. Die Chatbots dieser Hersteller müssen ja nicht nur die Metadaten, sondern auch die Inhalte der Dateien lesen, um die Vorgänge zu erkennen.
Dann müssen wir also eigene Chatbots im Unternehmen aufbauen. Wenn man die bisher nicht hat, muss man mit ein paar Tausend Euro Anschaffungskosten rechnen. Auf die eigenen KI-Maschinen kann man fertige Sprachmodelle laden.
Der eigene Chatbot braucht jetzt zwei Listen:
- eine Liste von Prozessen, Wissensordnern und Vorgängen, denen Dokumente und Nachrichten zugeordnet werden sollen.
- Dokumente und Nachrichten, die zuzuordnen sind. Da Dateiname und Dateipfad vielleicht nicht aussagekräftig sind, muss der Chatbot, die Dateien lesen können.
Idealerweise macht der Chatbot folgende Vorschläge:
- Er findet die richtigen Vorgänge und Wissensordner zu den Dateien.
- Er verschiebt sie vielleicht sogar schon oder erstellt dafür ein Skript.
Aber es bleiben zwei Fragen:
- Woran erkennt der Chatbot, ob ein Vorgang noch aktuell ist?
- Welche Unterstruktur soll in einem Vorgang angelegt werden?
Man sieht also, dass selbst bei fertigen Sprachmodellen praktische Fragen übrig bleiben. Wir müssen den Chatbots mit den großen LLMs sehr spezifische Aufträge geben. Dabei können wir nie sicher sein, ob das Modell den besonderen Unternehmenskontext kennt.
(Das Bild zu diesem Beitrag wurde von einer KI erzeugt. Und auch da wird nicht nach Vorgängen, sondern nur nach Dokumentenart und Kontext sortiert.)
Wie reagieren die Anwender, wenn alle Dateien sortiert sind?
Nehmen wir an, es gäbe tatsächlich eine KI, die perfekt sortieren könnte (z. B. die Mac-Version von Claude Cowork). Jetzt löst ein Anwender das Sortieren aus und der entsprechende KI-Agent räumt das Netzwerklaufwerk auf.
Das endet im Chaos, weil alle anderen Anwender nun nach ihren Dateien suchen. Vielleicht wurden die Dateien sogar umbenannt. Dann reicht nicht einmal die Kenntnis des alten Dateinamens.
Wenn das Trainieren eigener Modelle und das Benutzen fertiger Modelle nicht sinnvoll sind, was kann man dann tun?
Wir fangen von vorn an
Wenn wir einen Schritt zurücktreten, sehen wir das eigentliche Problem: Wir müssen zu allen Dateien einen Kontext herstellen. Wenn die Maschine keine Informationen über den Kontext (sprich den Vorgang) hat, muss sie raten. Wir Menschen können das besser. Wir erinnern uns an die Geschichten, die nicht in den Dateien stehen.
Es geht viel schneller, eine neue vorgangsorientierte Ablage aufzubauen. Dabei kann uns die KI wieder unterstützen. Sie soll den ersten Vorschlag für einen Aktenplan machen. Das funktioniert erstaunlich gut. Aber der Aktenplan muss von den Mitarbeitern geprüft werden.
Anschließend legen wir die neuen Ordner an. Alle Mitarbeiter machen sich mit den neuen Ablageprinzipien vertraut und fangen an, neue Vorgänge anzulegen. Aus dem alten Dokumentenbestand werden nur die Dateien kopiert, die man für die laufenden Vorgänge braucht. Das geht deutlich schneller als das Trainieren der KI auf einer unsortierten Ablage.
Fassen wir zusammen:
- Eine KI kann auf einer unsortierten Ablage keinen Kontext für Dateien herstellen.
- Das Trainieren einer KI dauert länger als das Aufbauen einer neuen, vorgangsorientierten Ablage.
Nur die Menschen können den Kontext zu den Dateien herstellen.
Sie wollen mehr über die gemeinsame Ablage lernen? Dazu gibt es eine Überblicksseite, die wichtige Artikel aus diesem Blog in eine Reihenfolge bringt.

Kommentare
Kommentar veröffentlichen