Vier Use-Cases, die sich wirklich auszahlen.
Nach Analyse von 20 Kanzleien liefern vier KI-Use-Cases konsistent messbaren Wert. Der Rest ist meistens Marketing. Beginnen Sie mit diesen; sie lehren Sie, was KI in Ihrer Kanzlei kann und nicht kann, bevor Sie größer wetten.
Posteingang-Klassifizierung + Routing
LLM klassifiziert eingehende Mail (Mandant, Gericht, Marketing, intern) und routet. Nahe-Null-Risiko, hohes Volumen, sofortiger Payoff. 4-Wochen-Rollout typisch.
Dokumenten-Zusammenfassung
LLM fasst eingehende Dokumente (Verträge, Briefe, Berichte) vor Partner-Review zusammen. Partner liest 200 Wörter statt 20 Seiten; detailliert nur wenn nötig.
Fristen-Extraktion (mit Pflicht-Human-Review)
LLM extrahiert Fristen aus beA-Nachrichten und E-Mails. Mensch bestätigt, bevor etwas nach DATEV/RA-MICRO geschrieben wird. Spart Stunden wöchentlich, Null-Risiko wenn Review-Gate durchgesetzt ist.
Content-Drafting mit Freigabe
LLM entwirft LinkedIn-Posts, Blog-Artikel, Newsletter. Partner reviewt gegen vordefinierte Kriterien in <5 min. Siehe Content-Automation-Leitfaden für Tiefe.
Vier Use-Cases. Kein Mysterium. Alles andere ist Marketing, das so tut, als wäre es Produkt.
Was nicht funktioniert (und warum).
Viele KI-für-Legal-Produkte behaupten Fähigkeiten, die sie nicht zuverlässig liefern. Hier, was wir getestet und scheitern gesehen haben — zumindest mit aktuellen Modellen. Das kann sich ändern, aber Skepsis ist der richtige Default.
Autonome Rechtsberatung
KI gibt bindende Rechtsberatung ohne Human-Review: noch zu unzuverlässig. Halluzinationen zu häufig, Zitate zu unzuverlässig, Kontext zu leicht misszuverstehen. Human-in-the-Loop ist Pflicht.
Vertragsverhandlungs-Bots
KI verhandelt Vertragstermine mit der anderen KI: beeindruckende Demos, schwache Praxis. Verhandlung hängt von Strategie, Mehrdeutigkeit, Machtdynamik — Dinge, die LLMs schlecht handhaben.
End-to-End-Fall-Vorhersage
KI sagt Fall-Outcomes vorher: einige spezialisierte Tools funktionieren für enge Domänen (Patent-Litigation in USA), aber allgemeine Vorhersage ist unzuverlässig und nicht wert zu wetten für die meisten Kanzleien.
KI-Paralegals ohne Supervision
Das Marketing sagt „vollautonom". Die Realität: sie brauchen Supervision wie jede Junior-Arbeitskraft. Behandeln Sie sie als Beschleunigung, nicht Ersatz.
Compliance: BRAO, DSGVO,
Mandatsgeheimnis.
Legal-Profis operieren unter strengeren Daten-Regeln als die meisten Branchen. KI-Deployment muss alle drei Achsen gleichzeitig respektieren — voll machbar, nur nicht zufällig.
BRAO / Anwaltsregeln
Keine Beratung ohne Supervision. Keine vergleichenden Behauptungen. Keine garantierten Outcomes. Der Generierungs-Prompt erzwingt das zur Output-Zeit; die Review-Checkliste verifiziert zur Sign-off-Zeit.
DSGVO
Nur-EU-Endpoints. No-Training-Vereinbarungen. 30-Tage-Datenretention max. Personen-Daten-Minimierung (nur was nötig). Audit-Log für jeden KI-Call. Recht auf Löschung implementierbar.
Mandatsgeheimnis
Mandats-Level-Daten verlassen die Kanzlei-Infrastruktur nur wenn absolut nötig. Wenn es muss (für Extraktion), via EU-Endpoints mit klaren Löschtermen. Nie an US-Residenz-Services ohne explizite Vereinbarung.
Modelle und Endpoints
— Stand 2026.
Die KI-Landschaft verschiebt sich monatlich, aber die stabilen Wahlen für EU-basierte Kanzleien 2026 sind:
Unser Default: Claude für High-Stakes-Arbeit, GPT-4o für Volumen, Mistral für EU-nativ, Llama für self-hosted. Wahl hängt von Risiko-Profil und Latenz-Toleranz ab — nicht von „welches ist am besten\".
- Anthropic Claude 3.5 Sonnet via AWS Frankfurt — beste Instruction-Following, starkes Deutsch.
- Azure OpenAI GPT-4o in Frankfurt-Region — robust, breites Ökosystem, etwas schwächer bei deutschem Nuance.
- Mistral Large via Mistral API (Frankreich-Hosting) — voll EU-nativ, solide Qualität für die meisten Aufgaben.
- Llama 3 self-hosted (für sensible Extraktion) — läuft auf Ihrem Server, keine externen API-Calls.
- Vermeiden: US-gehostete API ohne Datenresidenz-Vereinbarung. Vermeiden: On-Device-Tools, die nach Hause telefonieren.
Governance, der Kanzleien vertrauen.
KI in einer Kanzlei muss regierbar sein — auditierbar, reversibel, reviewbar. Vier Mechanismen, die „Black Box" in „nachvollziehbares System" verwandeln:
Audit-Log pro Call
Jeder KI-Call wird geloggt: Prompt, Input, Output, wer angefordert, Zeitstempel. Aufbewahrt in EU-gehosteter Postgres für 12 Monate. Exportierbar.
Human-in-the-Loop bei bindenden Outputs
Alles, was nach DATEV, beA oder an Mandanten geht ohne Human-Review: nein. Reviews sind geloggt — wer freigegeben, wann, gegen welche Kriterien.
Rollback-Fähigkeit
Jede automatisierte Entscheidung muss reversibel sein. Eine falsch geschriebene Frist kann wieder ausgetragen werden. Ein falsch getaggtes Dokument umgetaggt. Alles via UI, kein Engineer nötig.
Quartals-Review der False Positives/Negatives
Jedes Quartal reviewen Partner eine Stichprobe von KI-Entscheidungen. Was lag falsch? Was wurde übersehen? Erkenntnisse zurück in Prompts und Review-Kriterien.
Wie man startet — Jahr eins.
Wenn Sie gerade beginnen, hier der Jahr-Eins-Plan, der bei den Kanzleien funktioniert hat, denen wir geholfen haben. Widerstehen Sie der Versuchung, alles auf einmal zu machen; jeder Schritt braucht Zeit, Gewohnheit zu werden.
- Monat 1–2: Posteingang-Klassifizierung + Routing. Low-Risk, High-Volume. Lehrt die Kanzlei, was KI tut und nicht tut.
- Monat 3–4: Dokumenten-Zusammenfassung. Partner erleben Zeitersparnis direkt. Baut Vertrauen auf.
- Monat 5–7: Fristen-Extraktion mit Pflicht-Review. Höhere Einsätze; rechtfertigt die Review-Disziplin.
- Monat 8–12: Content-Drafting mit Freigabe. Fügt Wert ohne Risiko hinzu. Oft das für Mandanten sichtbarste KI-Feature.
- Nach Jahr 1: Bewertung, ob weitere Use-Cases hinzugefügt werden — basierend auf tatsächlichen Ergebnissen, nicht Demos.