AI-Agent-Lifecycle-Management

Multi-Agent-Systeme: Wie durch das Zusammenspiel von AI Agents ein nahtloses Kundenerlebnis entsteht

Matthäus Deutsch
Senior Applied Scientist

Home > blog > Article

7 October 2025 • 6 mins

Multi-Agent-Systeme: Wie durch das Zusammenspiel von AI Agents ein nahtloses Kundenerlebnis entsteht

Ameisen befolgen keine Befehle – sie orientieren sich an Signalen.

Statt zentral gesteuert zu werden, organisieren sie sich über einfache Regeln und unmittelbare Rückmeldungen aus ihrer Umgebung. So bauen sie Tunnel, verteidigen ihr Territorium und finden Nahrung. Ihr Verhalten scheint ungeordnet, ist aber effizient und erstaunlich anpassungsfähig. Übertragen auf künstliche Intelligenz, nennt sich das Schwarmintelligenz.

Contact Center sind zwar keine Ameisenkolonien, stehen jedoch vor einer ähnlichen Herausforderung: Sie müssen komplexe Aufgaben bewältigen, verteilt auf verschiedene Mitarbeitende, die zudem häufig unter Zeitdruck stehen. Das Arbeitspensum ist zu hoch, als dass dies ein AI Agent alleine bewältigen kann. Ein einzelner AI Agent beherrscht zwar Small Talk und bearbeitet Anliegen. Aber er kann nicht gleichzeitig Identitäten prüfen, mehrstufige Probleme lösen oder Up-Selling-Maßnahmen ergreifen.

Die Zukunft der CX-Automatisierung liegt daher nicht im Einsatz eines einzigen AI Agents, sondern in einem smarten System, das aus mehreren AI Agents besteht.

Diese Multi-Agent-Systeme (MAS) teilen Aufgaben auf: Sie übergeben Teilprozesse an spezialisierte AI Agents, die jeweils für bestimmte Funktionen trainiert sind. Ein Agent übernimmt die Authentifizierung, ein anderer die Preislogik, ein dritter eskaliert besonders komplexe Anliegen.

Die Agents interagieren miteinander. Dadurch handeln sie schneller und passen sich besser an.

Monolithische AI Agents sind nicht für kollaborative Prozesse konzipiert

Die meisten Enterprise-CX-Systeme basieren auf einer monolithischen Struktur, bei der ein einzelner AI Agent die Aufgaben alleine übernimmt. Mit steigenden Kundenerwartungen und komplexeren Workflows zeigt dieses Modell jedoch Schwächen.

Grenzen einzelner AI Agents	Aktuelle Erkenntnisse
Bearbeitung mehrstufiger Aufgaben	Monolithische AI Agents können in der Regel nur eine einzige Aufgabe ausführen. Im CX-Alltag ist das problematisch, da oftmals Multitasking gefragt ist – beispielsweise, wenn der AI Agent gleichzeitig ein Anliegen lösen, die Kundenabsicht erkennen und sich im Gespräch flexibel anpassen muss. In solchen Situationen zeigen Multi-Hop-Agents durchweg bessere Performance als statische Modelle.
Gedächtnis über mehrere Sessions hinweg	Die Mehrheit der monolithischen AI Agents speichert Konversationsdaten nicht über den jeweiligen Dialog hinaus. Das führt dazu, dass Kund:innen Anliegen wiederholen müssen, der AI Agent den Kontext verliert und sein Angebot nicht personalisieren kann. Große Sprachmodelle (LLMs) verfügen nicht standardmäßig über ein Langzeitgedächtnis. Um Informationen über einzelne Interaktionen hinaus nachzuverfolgen, sind externe Speichersysteme notwendig.
Abwägen unterschiedlicher Ziele	Monolithische Agents sind meist darauf ausgelegt, eine spezifische Funktion besonders gut zu erfüllen – beispielsweise schnell zu antworten. Im anspruchsvollen CX-Umfeld sind jedoch differenzierte Fähigkeiten gefragt: AI Agents müssen in der Lage sein, im Gespräch abzuwägen, ob beispielsweise Geschwindigkeit oder Compliance höchste Priorität hat. In diesem Kontext bieten Utility-basierte oder Multi-Agent-Systeme entscheidende Vorteile.

Monolithische AI Agents weisen folgende Limitationen auf:

1. Sie sind mit mehrstufigem Reasoning und dynamischen Aufgaben überfordert

Selbst mit LLMs agieren die meisten Single-Agent-Systeme noch immer linear. Sie vollziehen einen Schritt nach dem anderen – das funktioniert bei einfachen Anfragen sehr gut. Komplexe Aufgaben jedoch, die es erfordern, Kontext zu behalten, zwischen Zielen zu wechseln oder Rückfragen zu stellen, bringen diese Systeme an ihre Grenzen.

Ihre Architektur ist nicht flexibel genug: Ohne die Fähigkeit, über mehrere Schritte hinweg zu schlussfolgern oder intern Aufgaben zu delegieren, geraten sie ins Stocken oder eskalieren das Gespräch. Nicht, weil die Aufgabe zu anspruchsvoll ist, sondern weil sie nicht in der Lage sind, diese in Echtzeit zu entpacken – also in Teilschritte zu zerlegen und dynamisch neu zusammenzusetzen.

2. Ihr fehlendes Langzeitgedächtnis schränkt Konsistenz und Personalisierung ein

Die meisten monolithischen Agents haben nur während einer laufenden Unterhaltung Zugang zu Informationen aus dem Gespräch. Sobald ein Anruf oder Chat beendet wird, geht auch der Kontext verloren. Es gibt kein langfristiges Gedächtnis für vergangene Interaktionen, Präferenzen oder Ergebnisse. Wie zu erwarten, führt dies zu inkonsistenten Kundenerlebnissen, redundanten Schritten und verpassten Gelegenheiten für personalisierten Support.

3. Sie eignen sich nicht dazu, zwischen konkurrierenden Zielen abzuwägen

Single-Agent-Systeme sind typischerweise auf ein Ziel optimiert, beispielsweise auf die Reduzierung der Bearbeitungszeit. Aber in der CX gibt es selten nur ein Ziel. AI Agents müssen häufig mehrere Zielsetzungen abwägen und situationsabhängig entscheiden, was Vorrang hat: Geschwindigkeit vs. Compliance, Kundenzufriedenheit vs. Kosten oder Upselling-Möglichkeiten vs. Problemlösung.

Generalistische Agents evaluieren diese Konflikte nicht von selbst. Ohne eine nutzenbasierte Architektur oder ein Framework zur Bewertung mehrerer Ziele sind die AI Agents in komplexen Situationen limitiert und eskalieren unnötig.

Spezialisierte AI Agents erzielen bessere Ergebnisse, wenn sie zusammenarbeiten

Ein einzelner AI Agent kann – und sollte – nicht alles allein übernehmen.

Multi-Agent-Systeme (MAS) basieren auf dem Prinzip des Delegierens. Statt einen Single-AI-Agent in jedem Use Case einzusetzen, werden verschiedenen Agents jeweils spezifische Aufgaben zugewiesen. Das verbessert die Performance der AI in den Bereichen, die für die Zielerreichung entscheidend sind.

Angenommen, es muss eine Identität verifiziert, gleichzeitig ein Problem behoben und eine Rechnungsfrage beantwortet werden. Ein MAS ermöglicht es, diese Anfragen parallel zu bearbeiten, wobei sich jeder Agent auf das konzentriert, was er am besten kann. Diese Spezialisierung optimiert die Genauigkeit und erhöht die Fehlertoleranz: Kommt ein Agent nicht weiter, übergibt er die Aufgabe einem anderen Agent. So wird ein Single Point of Failure vermieden und nicht der gesamte Workflow blockiert.

Zudem fördern MAS die Personalisierung, indem Interaktionen gemäß der Kundenpräferenzen oder individuellen Profile geroutet und dem Agent zugewiesen werden, der dafür am besten geeignet ist.

Die Herausforderung liegt in der Koordination der AI Agents

Richtig umgesetzt, kann ein Multi-Agent-System ein hohes Maß an Flexibilität und Skalierbarkeit bieten. Gleichzeitig stellt die Koordination der AI Agents eine Herausforderung dar. Werden viele Agents eingesetzt, besteht das Risiko, dass beim Wechsel vom einen zum nächsten der Gesprächsfluss gestört wird – etwa, weil der falsche Agent zur falschen Zeit übernimmt oder der Agent eine Aufgabe erhält, auf die er nicht ausgelegt ist. Dann entsteht eine fragmentierte Nutzererfahrung anstelle eines nahtlosen Dialogs. Um fehlerhafte Übergaben zu verhindern und hohe Servicequalität während der Interaktion zu gewährleisten, ist ein leistungsfähiges Conversation Management unverzichtbar.

Die Grundlage dafür ist die Orchestrierung der AI Agents. Diese koordiniert die spezialisierten Agents und steuert, welcher Agent wann kommuniziert, wie Handoffs erfolgen und wie der Kontext im Hintergrund erhalten bleibt.

Was ein leistungsfähiges MAS ausmacht

Hinter jedem MAS steht eine Architektur, die festlegt, wie die AI Agents miteinander kommunizieren, zusammenarbeiten oder auch konkurrieren. Dieses Design bestimmt maßgeblich, wie gut das System skaliert, sich anpasst und auch unter hoher Belastung stabil bleibt.

Zentralisierte, dezentralisierte und hybride Strukturen

MAS-Architekturen können auf strategischer Ebene verschieden organisiert sein – jede Struktur bringt Vorteile, aber auch Trade-offs mit sich:

Zentralisiert: Ein Agent (oder Controller) steuert das gesamte System. Dies vereinfacht die Koordination und gewährleistet konsistente Ergebnisse, schafft aber potenziell Engpässe, die zu verzögerten Antworten oder eingeschränkter Leistungsfähigkeit führen können.
Hierarchisch (eine strukturierte Form der Zentralisierung): Agents sind in Ebenen organisiert – zum Beispiel strategische Agents auf der oberen, taktische auf der unteren Ebene. Die Arbeitsverteilung folgt dem „Divide and Conquer“ Prinzip: Jeder Agent ist auf eine bestimmte Aufgabe spezialisiert und übernimmt einen Teilprozess, der seinen Fähigkeiten entspricht. Aber es entsteht das Risiko von Latenzen und fehlender Flexibilität, da die Koordination komplexer wird – zumindest solange, bis sich die Technologie weiterentwickelt und diese Herausforderung adressiert hat.
Dezentralisiert: Agents treffen eigenständige Entscheidungen, basierend auf lokalem Kontext und direkter Kommunikation untereinander. Dies bietet hohe Skalierbarkeit und Resilienz, geht jedoch zulasten einer weltweit einheitlichen Steuerung der AI.

Wie sieht das in der Praxis aus?

Ein typisches Anwendungsszenario ist die Orchestrierung in Contact Centern: In einem hierarchischen MAS steuert ein übergeordneter Routing-Agent eine Gruppe spezialisierter Agents, an die er Anfragen verteilt – beispielsweise zur Bearbeitung von Schadensfällen, Abrechnungsfragen oder Stornierungen. Dieses Modell orientiert sich an realen Arbeitsabläufen. Allerdings nimmt die Komplexität der Kommunikation beim Skalieren der Systeme schnell zu, wie eine aktuelle Studie zeigt – ein Faktor, der die Effizienz solcher Systeme beeinträchtigen kann. Im Vergleich dazu lässt sich ein dezentralisiertes Peer-to-Peer-Setup schneller anpassen und einfacher skalieren, auch wenn beide Modelle vergleichbare Service-Level-Benchmarks erreichen.

Ein weiteres Beispiel: In der Multi-Robot-Koordination haben Forschende kürzlich gezeigt, dass dezentrale Systeme die Leistungsfähigkeit zentralisierter Ansätze erreichen können – vorausgesetzt, die Agents werden mit spieltheoretischen Strategien trainiert, die es ihnen ermöglichen, eigenständige, intelligente Entscheidungen zu treffen. Dies verdeutlicht, dass die Architektur nicht nur die Struktur bestimmt, sondern auch Lernprozesse, Geschwindigkeit und die Widerstandsfähigkeit des Systems beeinflusst.

Was unterscheidet kollaborative, kompetitive und gemischte Multi-Agent-Systeme?

AI Agents können auf unterschiedliche Weise miteinander agieren:

In kooperativen Systemen arbeiten sie auf ein gemeinsames Ziel hin (zum Beispiel höherer CSAT).
Bei kompetitiven Systemen verfolgen die AI Agents entgegengesetzte Ziele (wie in Testumgebungen mit simulierten Gegenspielern).
Gemischte Set-ups bestehen aus kooperativen und kompetitiven AI Agents.

Bei der Automatisierung von Contact Centern dominiert meist der kooperative Ansatz: Agents teilen Kontext und arbeiten zusammen, um eine Aufgabe zu lösen (ähnlich dem Konzept von „Theory of Mind“). Zugleich wächst das Interesse an kompetitiven Modellen, bei denen Agents gegnerische Eingaben oder Nutzerverhalten simulieren, um ihre eigene Performance zu verbessern. Diese Simulation Agents übernehmen die Rolle interner Herausforderer und unterstützen dabei, das Verhalten der Agents vor dem Live-Einsatz zu optimieren.

Zukunft der CX: Vernetzte Multi-Agent-Systeme lösen isolierte AI-Lösungen ab

Fortschrittliche CX-Systeme entwickeln sich weg von der traditionellen Automatisierung hin zu kognitiven Architekturen: Auf der oberen Ebene steuern leistungsfähige AI-Modelle wie GPT-4.1 das Gespräch und ermöglichen schnelle, flüssige Interaktionen. Im Hintergrund – auf der unteren Ebene – übernehmen spezialisierte Agents, wie etwa o3, die Logik, greifen auf Datenbanken zu und führen die Aufgaben aus.

Dieses Zusammenspiel aus schnellen, intuitiven („System 1“) und analytischen Prozessen („System 2“) ist schon heute effektiv. OpenAI Benchmarks zeigen, dass Systeme dann am leistungsfähigsten sind, wenn leistungsstarke Sprachmodelle durch strukturierte Tool-Nutzung ergänzt werden. Entscheidend ist nicht, ob ein Agent oder viele Agents im Einsatz sind – sondern ob sie im richtigen Moment das Richtige tun.

Die nächste Generation von CX-Systemen wird nicht länger aus Einzellösungen und separaten Agents (Single Purpose Agents) bestehen, sondern aus intelligenten, vernetzten AI Agents, die koordiniert handeln, sich anpassen und kontextbezogen über die gesamte Customer Journey hinweg zusammenarbeiten.

Dies wird zum neuen CX-Standard bei Enterprise-Unternehmen: Kund:innen erleben exzellente Service-Erfahrungen und Unternehmen profitieren von Skalierbarkeit.

Mehr über Parloas AI Agent Management Plattform erfahren!

Jetzt Kontakt aufnehmen

Wie W&W operative Exzellenz steigert

Wie W&W operative Exzellenz steigert

Wie W&W operative Exzellenz steigert

Wie W&W operative Exzellenz steigert

Multi-Agent-Systeme: Wie durch das Zusammenspiel von AI Agents ein nahtloses Kundenerlebnis entsteht

Multi-Agent-Systeme: Wie durch das Zusammenspiel von AI Agents ein nahtloses Kundenerlebnis entsteht

Monolithische AI Agents sind nicht für kollaborative Prozesse konzipiert

Grenzen einzelner AI Agents

Aktuelle Erkenntnisse

Monolithische AI Agents weisen folgende Limitationen auf:

1. Sie sind mit mehrstufigem Reasoning und dynamischen Aufgaben überfordert

2. Ihr fehlendes Langzeitgedächtnis schränkt Konsistenz und Personalisierung ein

3. Sie eignen sich nicht dazu, zwischen konkurrierenden Zielen abzuwägen

Spezialisierte AI Agents erzielen bessere Ergebnisse, wenn sie zusammenarbeiten

Die Herausforderung liegt in der Koordination der AI Agents

Was ein leistungsfähiges MAS ausmacht

Zentralisierte, dezentralisierte und hybride Strukturen

Wie sieht das in der Praxis aus?

Was unterscheidet kollaborative, kompetitive und gemischte Multi-Agent-Systeme?

Zukunft der CX: Vernetzte Multi-Agent-Systeme lösen isolierte AI-Lösungen ab