Der Nighthog hat sich eine Nacht lang Langdock angesehen — die KI-Plattform aus Berlin, die Multi-Modell-Chat, Agenten und Workflows zusammenführt. Sein Urteil: die kleinen Details machen den Unterschied.

Langdock im Test: KI fürs Unternehmen, ohne dass die Daten in die USA wandern

Ich war skeptisch.

Wirklich skeptisch.

Wenn ein Stück Software mit dem Wort „Enterprise” anfängt, geht meine Stachelborste hoch. Ich habe in den letzten Jahrzehnten zu viele Plattformen gesehen, die das Wort wie ein Versprechen tragen und am Ende ein Folienfeuerwerk sind — eine Hülle aus SSO, RBAC und Compliance-Logos um drei mittelmäßige Features.

Langdock hat mich um drei Uhr morgens umgestimmt. Das gebe ich ungern zu. Aber das ist nicht das erste Mal in diesem Jahr.

Das Problem, das niemand mehr ignorieren kann

Die Geschäftsführer rufen tagsüber an und fragen dasselbe: „Sollen wir ChatGPT für die Firma einkaufen?” Die IT-Verantwortlichen rufen abends an und sagen: „Bitte nicht ChatGPT.”

Beide haben recht.

KI im Arbeitsalltag ist kein Trend mehr, sondern eine Frage der Wettbewerbsfähigkeit. Wer im Marketing keine Bildgenerierung nutzt, wer im Vertrieb nicht zusammenfassen lässt, wer im Support keine semantische Suche über die eigenen Dokumente legt — der schaut zu, wie die Konkurrenz schneller wird.

Aber die andere Seite ist genauso real. Sobald die Sachbearbeitung Kundendaten in den OpenAI-Chat kippt, ist die DSGVO-Verletzung im Kasten. Die Cloud-Act-Frage. Das Training auf Eingaben. Das Auditing-Loch. Und der Datenschutzbeauftragte, der nachts nicht mehr schläft.

Was es braucht: eine Plattform, die KI ins Unternehmen bringt, ohne dass die Daten das Unternehmen verlassen.

Langdock — die Bausteine

Langdock ist eine Berliner Plattform — modell-agnostisch, in der EU auf Azure-Servern gehostet, nach ISO 27001 und SOC 2 Type II zertifiziert. Über 7.000 Unternehmen setzen sie ein, darunter Merck, Personio, Würth, Eppendorf und der Spiegel.

Die Plattform besteht aus fünf Bausteinen, die zusammenarbeiten:

Chat — Multi-Modell-Frontend mit Vision, Bildgenerierung, Websuche, Deep Research, Dokumenten-Editor und Memory. Das, was die meisten als „ChatGPT-Ersatz” verstehen.
Agents — eigene KI-Assistenten mit System-Prompt, Wissensbasis und Form Fields. Das, was die meisten als „eigener Chatbot” verstehen.
Workflows — Multi-Step-Automationen mit 15 Node-Typen: Agent, Action, Code, Condition, Delay, Form-Trigger, Human-in-the-Loop. Das, was an Zapier erinnert, aber mit KI im Kern.
Integrations — über 20 vorkonfigurierte Konnektoren (Microsoft 365, Slack, Teams, Notion, Confluence, ServiceNow, Zoom, Looker, Metabase, Databricks) plus ein MCP-Server-Directory und Custom-Integrations per OAuth.
API — OpenAI-, Anthropic-, Google- und Mistral-kompatible Endpoints mit Audit-Logs und zentraler Abrechnung.

Vier dieser Bausteine sind im Standard-Plan enthalten. Workflows laufen als Add-on getrennt.

Modelle — und warum das EU-Schild zählt

Die Modellauswahl ist die Liste, die ein Admin sehen will:

OpenAI: GPT-5, GPT-5.1, GPT-5.2, GPT-5.4, GPT-5.5, GPT-5 Mini, GPT-5 Pro, o3, o4 Mini, dazu GPT oss 120b zur Selbst-Inspektion
Anthropic: Claude Haiku 4.5, Sonnet 4.5 und 4.6, Opus 4.5, 4.6 und 4.7
Google: Gemini 2.5 Flash, 2.5 Pro, 3 Flash, 3.1 Pro
Meta: Llama 3.3 70B und Llama 4 Maverick
Mistral Large 3, DeepSeek v3.1

Bemerkenswert ist nicht die Liste — die hat jeder Aggregator. Bemerkenswert ist, dass an jedem einzelnen Modell drei kleine Marker hängen: gehostet in der EU, gehostet in den USA, globales Deployment. Wer in der Modellverwaltung einmal hinkonfiguriert hat, sieht das EU-Schild auch beim Modellwechsel im Chat — neben dem Auswahldropdown.

Das ist kein großes Feature. Das ist ein gut gesetzter Punkt am Ende eines Satzes. Aber es erspart einer Sachbearbeiterin, die zwischen GPT-5 und Sonnet 4.6 wechselt, jedes Mal die Frage: „Darf ich das jetzt?”

Ja. Steht dran.

Die Details, die mich überzeugt haben

Drei Dinge sind mir in einer Test-Nacht aufgefallen, die in der Marketing-Broschüre eher unscheinbar daherkommen:

Erinnerungen — anders als Anweisungen. Es gibt zwei Stellen für Personalisierung. Individuelle Anweisungen sind statisch: Rolle, Aufgabengebiet, Tonalitätspräferenz. Einmal eingetragen, wirken sie in jedem Chat. Erinnerungen dagegen entstehen mitten im Chat. Ein Satz wie „Merk dir als Erinnerung, dass ich Kunden im Steuerberatungsumfeld betreue” erzeugt einen sichtbaren Eintrag in der Erinnerungsliste — editierbar, löschbar, durchsuchbar. Das Modell lernt nicht. Aber die Plattform merkt sich, was sie wissen soll. Sauber getrennt.

Optimize-Knopf für System-Prompts. Wer einen Agenten baut, schreibt im Standardfall einen System-Prompt. Wer das öfter macht, weiß: ein guter System-Prompt ist Handwerk. Strukturiert, mit Beispielen, mit Negativ-Definition, mit Output-Format. Bei Langdock steht neben dem Eingabefeld ein Optimize-Button. Drei Sätze hinkritzeln, klicken, fertig strukturierter Prompt. Nicht perfekt. Aber als Startpunkt brauchbar — und für Nicht-Profis ein echter Hebel.

Die App, die niemand erwähnt. Es gibt eine Langdock-Mobile-App für iOS und Android. Chat, Agenten, Websuche, Sprachaufnahme mit Transkription. Workflows fehlen — was Sinn ergibt, denn eine Multi-Step-Automation am Handy zu basteln, ist Selbstgeißelung. Aber für die zwei Minuten im Aufzug, in denen jemand fragt: „Schreib mir bitte die drei Argumente für unser Vertriebsmeeting morgen” — dafür reicht es.

Was es kostet

Business kostet 25 € pro Nutzer und Monat. Business Max — fünfmal höhere Limits — 99 €. Beides bis 1.000 Nutzer, beides mit SSO, SCIM und SAML inklusive. Enterprise verhandelt man individuell, ab 1.000 Nutzern, mit Option auf Single-Tenant oder On-Premise.

Workflows sind ein eigenes Add-on: 539 €/Monat für 40.000 Runs, 1.199 €/Monat für 100.000 Runs. 2.500 Runs sind im Standard inklusive. Die API rechnet token-basiert mit 10 Prozent Aufschlag. Jahresabos sparen 20 Prozent. Alle Preise zuzüglich Mehrwertsteuer. Die aktuell gültigen Preise stehen auf langdock.com — wir empfehlen, dort vor einer Entscheidung kurz nachzusehen.

Das ist nicht günstig — und nicht teuer. Für eine Plattform, die ein halbes Dutzend ChatGPT-Enterprise-Lizenzen, einen Make-Account, einen Custom-RAG-Server und drei Compliance-Audits ersetzt, ist es ehrlich kalkuliert.

Was Langdock nicht ist

Hier bin ich, wie immer, strenger. Ehrlichkeit ist wichtiger als Begeisterung.

Kein Self-Hosting im KMU-Bereich. On-Premise gibt es erst ab 2.000 Nutzern. Wer auf dem eigenen Blech laufen will, schaut sich Ollama, vLLM oder Open WebUI an — nicht Langdock.
Kein Werkzeug für reine Power-User. Wer als einzelne Person mit der Claude- oder OpenAI-API direkt arbeitet, hat in Langdock einen Mehrwert, aber bezahlt für Features (Workspace, Permissions, Audit-Logs), die er nicht braucht.
Kein Ersatz für eigene RAG-Architektur in spezialisierten Fällen. Wer Vektorsuche über zehn Millionen Dokumente mit eigener Embedding-Strategie betreibt, wird die Standardlösung als Einschränkung empfinden. Für die meisten KMU mit ein paar tausend bis ein paar hunderttausend Dokumenten ist sie ausreichend bis komfortabel.

Was ich behalte

Langdock ist die erste Enterprise-KI-Plattform, bei der ich nicht das Gefühl habe, dass sie mit der Bezeichnung lügt. Sie ist ein Enterprise-Werkzeug. Aber sie verschluckt sich nicht an dem Wort.

Ich behalte:

die EU-Hosting-Markierung pro Modell (das beste Stück UI-Design des Jahres)
die Trennung von Anweisungen und Erinnerungen (kleiner Unterschied, große Wirkung)
das saubere Pricing ohne versteckte „Pro nur auf Anfrage”-Sternchen
die Tatsache, dass eine deutsche Plattform alle ernstzunehmenden Modelle aggregiert, statt zu versuchen, ein eigenes mittelmäßiges zu bauen

Ich rate weiter zur Vorsicht bei drei Punkten:

Datenklassifikation muss vor dem Rollout passieren. Auch eine DSGVO-konforme Plattform schützt nicht vor Mitarbeitenden, die Kundendaten in den Chat kippen, ohne nachzudenken.
Workflows sind mächtig, und Mächtigkeit ist immer auch ein Risiko. Wer eine Workflow-Kette baut, die automatisch Antworten an Kunden sendet, sollte das nicht ohne Human-in-the-Loop tun.
Modelle wechseln. Wer einen Agenten heute auf Opus 4.6 abstimmt, sollte testen, was passiert, wenn das Standard-Modell auf Opus 4.7 hochgezogen wird.

Die Plattform ändert meine Welt nicht. Aber sie ändert die Empfehlung, die ich an Geschäftsführungen gebe.

Vorher: „KI ja, aber nicht ChatGPT für die Firma.”

Jetzt: „KI ja. Langdock. Datenklassifikation vorher. Rollout in Etappen. Anrufen, wenn es klemmt.”

Das ist eine konkretere Antwort. Das mag ich.

— der Nighthog, kurz vor Sonnenaufgang, vierte Tasse Kaffee, EU-Hosting aktiviert