Vier Use-Cases, die sich wirklich auszahlen.

Nach Analyse von 20 Kanzleien liefern vier KI-Use-Cases konsistent messbaren Wert. Der Rest ist meistens Marketing. Beginnen Sie mit diesen; sie lehren Sie, was KI in Ihrer Kanzlei kann und nicht kann, bevor Sie größer wetten.

01

Posteingang-Klassifizierung + Routing

LLM klassifiziert eingehende Mail (Mandant, Gericht, Marketing, intern) und routet. Nahe-Null-Risiko, hohes Volumen, sofortiger Payoff. 4-Wochen-Rollout typisch.

02

Dokumenten-Zusammenfassung

LLM fasst eingehende Dokumente (Verträge, Briefe, Berichte) vor Partner-Review zusammen. Partner liest 200 Wörter statt 20 Seiten; detailliert nur wenn nötig.

03

Fristen-Extraktion (mit Pflicht-Human-Review)

LLM extrahiert Fristen aus beA-Nachrichten und E-Mails. Mensch bestätigt, bevor etwas nach DATEV/RA-MICRO geschrieben wird. Spart Stunden wöchentlich, Null-Risiko wenn Review-Gate durchgesetzt ist.

04

Content-Drafting mit Freigabe

LLM entwirft LinkedIn-Posts, Blog-Artikel, Newsletter. Partner reviewt gegen vordefinierte Kriterien in <5 min. Siehe Content-Automation-Leitfaden für Tiefe.

Vier Use-Cases. Kein Mysterium. Alles andere ist Marketing, das so tut, als wäre es Produkt.

Was nicht funktioniert (und warum).

Viele KI-für-Legal-Produkte behaupten Fähigkeiten, die sie nicht zuverlässig liefern. Hier, was wir getestet und scheitern gesehen haben — zumindest mit aktuellen Modellen. Das kann sich ändern, aber Skepsis ist der richtige Default.

01

Autonome Rechtsberatung

KI gibt bindende Rechtsberatung ohne Human-Review: noch zu unzuverlässig. Halluzinationen zu häufig, Zitate zu unzuverlässig, Kontext zu leicht misszuverstehen. Human-in-the-Loop ist Pflicht.

02

Vertragsverhandlungs-Bots

KI verhandelt Vertragstermine mit der anderen KI: beeindruckende Demos, schwache Praxis. Verhandlung hängt von Strategie, Mehrdeutigkeit, Machtdynamik — Dinge, die LLMs schlecht handhaben.

03

End-to-End-Fall-Vorhersage

KI sagt Fall-Outcomes vorher: einige spezialisierte Tools funktionieren für enge Domänen (Patent-Litigation in USA), aber allgemeine Vorhersage ist unzuverlässig und nicht wert zu wetten für die meisten Kanzleien.

04

KI-Paralegals ohne Supervision

Das Marketing sagt „vollautonom". Die Realität: sie brauchen Supervision wie jede Junior-Arbeitskraft. Behandeln Sie sie als Beschleunigung, nicht Ersatz.

Compliance: BRAO, DSGVO,
Mandatsgeheimnis.

Legal-Profis operieren unter strengeren Daten-Regeln als die meisten Branchen. KI-Deployment muss alle drei Achsen gleichzeitig respektieren — voll machbar, nur nicht zufällig.

01

BRAO / Anwaltsregeln

Keine Beratung ohne Supervision. Keine vergleichenden Behauptungen. Keine garantierten Outcomes. Der Generierungs-Prompt erzwingt das zur Output-Zeit; die Review-Checkliste verifiziert zur Sign-off-Zeit.

02

DSGVO

Nur-EU-Endpoints. No-Training-Vereinbarungen. 30-Tage-Datenretention max. Personen-Daten-Minimierung (nur was nötig). Audit-Log für jeden KI-Call. Recht auf Löschung implementierbar.

03

Mandatsgeheimnis

Mandats-Level-Daten verlassen die Kanzlei-Infrastruktur nur wenn absolut nötig. Wenn es muss (für Extraktion), via EU-Endpoints mit klaren Löschtermen. Nie an US-Residenz-Services ohne explizite Vereinbarung.

Modelle und Endpoints
— Stand 2026.

Die KI-Landschaft verschiebt sich monatlich, aber die stabilen Wahlen für EU-basierte Kanzleien 2026 sind:

Unser Default: Claude für High-Stakes-Arbeit, GPT-4o für Volumen, Mistral für EU-nativ, Llama für self-hosted. Wahl hängt von Risiko-Profil und Latenz-Toleranz ab — nicht von „welches ist am besten\".

  • Anthropic Claude 3.5 Sonnet via AWS Frankfurt — beste Instruction-Following, starkes Deutsch.
  • Azure OpenAI GPT-4o in Frankfurt-Region — robust, breites Ökosystem, etwas schwächer bei deutschem Nuance.
  • Mistral Large via Mistral API (Frankreich-Hosting) — voll EU-nativ, solide Qualität für die meisten Aufgaben.
  • Llama 3 self-hosted (für sensible Extraktion) — läuft auf Ihrem Server, keine externen API-Calls.
  • Vermeiden: US-gehostete API ohne Datenresidenz-Vereinbarung. Vermeiden: On-Device-Tools, die nach Hause telefonieren.

Governance, der Kanzleien vertrauen.

KI in einer Kanzlei muss regierbar sein — auditierbar, reversibel, reviewbar. Vier Mechanismen, die „Black Box" in „nachvollziehbares System" verwandeln:

01

Audit-Log pro Call

Jeder KI-Call wird geloggt: Prompt, Input, Output, wer angefordert, Zeitstempel. Aufbewahrt in EU-gehosteter Postgres für 12 Monate. Exportierbar.

02

Human-in-the-Loop bei bindenden Outputs

Alles, was nach DATEV, beA oder an Mandanten geht ohne Human-Review: nein. Reviews sind geloggt — wer freigegeben, wann, gegen welche Kriterien.

03

Rollback-Fähigkeit

Jede automatisierte Entscheidung muss reversibel sein. Eine falsch geschriebene Frist kann wieder ausgetragen werden. Ein falsch getaggtes Dokument umgetaggt. Alles via UI, kein Engineer nötig.

04

Quartals-Review der False Positives/Negatives

Jedes Quartal reviewen Partner eine Stichprobe von KI-Entscheidungen. Was lag falsch? Was wurde übersehen? Erkenntnisse zurück in Prompts und Review-Kriterien.

Wie man startet — Jahr eins.

Wenn Sie gerade beginnen, hier der Jahr-Eins-Plan, der bei den Kanzleien funktioniert hat, denen wir geholfen haben. Widerstehen Sie der Versuchung, alles auf einmal zu machen; jeder Schritt braucht Zeit, Gewohnheit zu werden.

  • Monat 1–2: Posteingang-Klassifizierung + Routing. Low-Risk, High-Volume. Lehrt die Kanzlei, was KI tut und nicht tut.
  • Monat 3–4: Dokumenten-Zusammenfassung. Partner erleben Zeitersparnis direkt. Baut Vertrauen auf.
  • Monat 5–7: Fristen-Extraktion mit Pflicht-Review. Höhere Einsätze; rechtfertigt die Review-Disziplin.
  • Monat 8–12: Content-Drafting mit Freigabe. Fügt Wert ohne Risiko hinzu. Oft das für Mandanten sichtbarste KI-Feature.
  • Nach Jahr 1: Bewertung, ob weitere Use-Cases hinzugefügt werden — basierend auf tatsächlichen Ergebnissen, nicht Demos.

Häufige Fragen.

01Welche KI-Modelle empfehlen Sie für Kanzlei-Arbeit?+
Claude 3.5 Sonnet und GPT-4-Klasse-Modelle über EU-Endpoints. Beide handhaben deutsche Rechtstexte gut. Für hochriskante Aufgaben (Fristen-Extraktion, beratungs-ähnliche Outputs) bevorzugen wir Claude für seine Instruction-Following. Für Volumen-Aufgaben (Klassifizierung, Zusammenfassung) funktioniert beides.
02Sind unsere Daten sicher bei diesen Modellen?+
Ja — über EU-Endpoints (Azure OpenAI in Frankfurt, Anthropic via AWS Frankfurt) mit No-Training-Vereinbarungen. Daten bleiben in der EU, werden nicht für Training genutzt, nach 30 Tagen gelöscht. Für maximale Sicherheit können wir auch Open-Source-Modelle (Llama, Mistral) für spezifische Aufgaben self-hosten.
03Welche KI-Use-Cases zahlen sich zuerst in einer Kanzlei aus?+
1) Klassifizierung und Routing von Posteingangs-Nachrichten. 2) Dokumenten-Zusammenfassung vor Partner-Review. 3) Fristen-Extraktion aus beA und E-Mail (mit Pflicht-Human-Review). 4) Content-Drafting mit menschlicher Freigabe. Diese vier decken die meisten realen Vorteile ab.
04Was ist mit Halluzinationen in Legal-KI?+
Das Risiko ist real und wir designen drumherum. Drei Kontrollen: (1) strukturierte Outputs erzwungen — keine Freiform-Behauptungen; (2) Quellen-Zitate für jede faktische Behauptung erforderlich; (3) Pflicht-Human-Review für alles rechtlich Bindende. Halluzination beim Review heißt „ablehnen und neu", nicht „publizieren".
05Müssen Anwälte Prompt-Engineering lernen?+
Nein. Die Prompts sind im Workflow eingebettet — Anwälte reviewen nur Outputs. Ein Partner oder Assistenz, der das Review-UI nutzt, muss nicht wissen, was ein Prompt ist. Das ist absichtlich — KI sollte unsichtbare Infrastruktur sein, keine neue Fähigkeit zu lernen.