Parloa integriert und optimiert die neuesten AI-Modelle und -Services, sodass unsere AI Agents die präziseste und natürlichste Kundenerfahrungen bieten, die heute - und in Zukunft - möglich sind.
Wenn Kund:innen anrufen, gibt es nur eine Chance auf einen guten Eindruck und ein tolles Serviceerlebnis. Lange Wartezeiten, fehlgeleitete Anrufe und die Notwendigkeit sich mehrfach wiederholen zu müssen, wirken sich negativ auf den NPS und CSAT aus – und frustrieren alle.
Mit unserer eigenen Telefoninfrastruktur kann Parloa auf den gesamten Audio-Stream zugreifen – von Anfang bis Ende. Unsere Kund:innen sind dabei nie auf eine bestimmte Audio-AI-Technologie festgelegt, da wir fortlaufend die neuen Möglichkeiten auf dem Markt testen. Parloa stellt sicher, dass unsere Kunbd:innen Zugang zu den besten verfügbaren AI-Technologien und -Diensten haben. Darum können unsere Kund:innen auch immer die neuesten Stimmen und die besten Modelle für Anwendungsfälle im Kundenservice nutzen.
Aber wie genau schaffen wir das?
Wie wir jeden Schritt des Anrufs optimieren
Die AI-Agent-Management-Plattform (AMP) von Parloa wurde entwickelt, um einen Anruf beim Kundenservice so einfach zu machen wie ein Gespräch mit einem guten Freund. Das bedeutet, dass Kund:innen ganz natürlich sprechen können – genauso wie sie es in einer alltäglichen Konversation tun würden. Je mehr Kontext bekannt ist, desto einfacher ist es, das Gespräch in die gewünschte Richtung zu lenken.
Optimieren für den Kontext
Wenn Parloa in euer System integriert wird, nehmen wir eine Reihe von Optimierungen vor, um eine hohe Abhörgenauigkeit zu gewährleisten. Wir können unter anderem für jedes Unternehmen individuelle STT-Hinweise einbinden, etwa bestimmte Produktnamen, nach denen der AI Agent sucht. Mit diesen kontextbezogenen Hinweisen können wir die AI Agents optimal vorbereiten, indem wir Kontext geben, bevor Kund:innen anrufen. Parloa weiß, welche Wörter zu erwarten sind, so dass es die Speech-to-Text (STT) Transkription von beispielsweise Firmen- oder Produktnamen richtig ausführen kann. Wenn ihr Parloa mit eurem CRM verbindet, kann sogar der Name einer Kundin:in erkannt werden.
Wir können das System auch auf den Kontext aufmerksam machen, z. B. die erwartete Anzahl von Ziffern in einer Kundennummer und dem AI Agent dementsprechend eine Anweisung geben: „Unterbreche den Kunden nicht, bevor dieser seine 9-stellige Kundennummer genannt hat“. So wird sichergestellt, dass Kund:innen, die überlegen, etwas wiederholen oder die Nummer erst suchen müssen, nicht unterbrochen werden. So kann der AI Agent von Parloa genau die Informationen sammeln, die das LLM braucht, um die Anfrage korrekt weiterzubearbeiten.
Die beste Sprachqualität basiert auf fortschrittliches Hören und Sprechen
Auf der anderen Seite des Gesprächs bietet Parloa eine Reihe von Optimierungen, um den AI Agent natürlich und menschlich klingen zu lassen. Wenn der AI Agent mehr Zeit für die Bearbeitung einer komplexen Anfrage benötigt, wird er überbrückenden Antworten wie „Warten Sie kurz“ oder „Geben Sie mir einen Moment“ einfügen, anstatt unangenehm lange Pausen zu machen. Wir integrieren die neuesten Modelle, um sicherzustellen, dass alle Geräusche und verbalen Hinweise das Gespräch lebensecht klingen lassen.
Ein weiterer Grund dafür, warum unsere Sprachqualität so authentisch ist, sind die ständigen Optimierungen um die Latenzzeit zu reduzieren. So sind wir zum Beispiel auf „GPT-4o auf Azure„ umgestiegen, sobald es verfügbar war, was in einer Reduzierung der Latenzzeit um 23% resultierte.
Wir können zudem mehrere Speech-to-Text-Modelle (STT) im gleichen Ablauf nutzen und so die alphanumerische Erkennung optimieren – etwa für Erkennung von Seriennummern und Namen. Unsere Modelle sind in der Lage die besten Ergebnisse von potenziellen STT-Kandidaten zu priorisieren und auszuwählen.
Eine menschliche Note hinzufügen
Parloa kann auf den gesamten Audio-Stream zugreifen, was bedeutet, dass wir problemlos Zwischenantworten wie z.B. „Lassen Sie mich das für Sie nachschauen“ einfügen können, um Zeit für die Verarbeitung zu gewinnen und die sonst wahrgenommenen Verzögerungen zu reduzieren. Zusammen mit verbalen Hinweise wie „äh“ und „ähm“ sowie Tipp- und anderen Hintergrundgeräuschen, ermöglicht das ein Erlebnis, welches natürlich klingt und sich auch genauso anfühlt.
Wir geben Unternehmen die volle Kontrolle darüber, wie ihre Kund:innen einen Anruf erleben
Parloa bietet geringere Latenzzeiten, bessere Audioqualität und kontextbezogenes Feedback für eine intelligentere Spracherkennung. Für uns ist das möglich, weil wir auf die Telefoninfrastruktur und den End-to-End Audio-Stream zugreifen können. Das bedeutet eine einfachere Integration in euer bestehendes Telefonsystem – und natürlichere Gespräche mit euren Kund:innen.
Was bedeutet das konkret für euch? Geringere oder gar keine Wartezeiten, bessere NPS- und CSAT-Werte sowie höhere Conversion- und und Cross-Selling-Raten wie HSE sie erzielen konnte.
Lukas Brückner ist Staff Product Manager bei Parloa, wo er für das Call Experience Team mit Schwerpunkt auf Spracherkennungstechnologie und deren Verbesserung verantwortlich ist. Er hat auch die Entwicklung unseres Real-Time Translation (RTT) Produkts angestoßen und den Grundstein für das Solutions Engineering Team gelegt, das den Erfolg unserer ersten Kund:innen sicherstellt.