Spracherkennung

Can you read me?

Möchte man sich über Spracherkennung genauer informieren, so findet man schnell heraus, dass die Technologie der Spracherkennung Computern die gesprochene Sprache zur automatischen Datenerfassung zugänglich machen soll. Das bedeutet, wir haben eine Schnittstelle, die unser gesprochenes Wort in maschinenlesbare Daten – Nullen und Einsen – umwandelt. Vor 30 Jahren waren für diese Leistung ein Großrechner und mehrere Minuten Rechenzeit pro Erkennungsvorgang notwendig. Zudem konnte das erste ernstzunehmende Spracherkennungssystem nur ca. 5.000 Wörter einer Sprache erkennen. Zum Vergleich: Allein der Anteil der Alltagssprache im deutschen Wortschatz beträgt ca. 500.000 Wörter.

Je nach Verwendung steht heute, 30 Jahre später, eine passende Software zur Verfügung, die Sprache erkennen und aus den Nullen und Einsen die richtigen Informationen ableiten kann – über nahezu den gesamten Wortschatz einer Sprache. Dies erfordert eine gigantische Datenbank, welche die Grundlagen liefert, die aufgezeichnete Sprache beispielsweise in Text umzuwandeln.

Was ist ein Wort? Was ist kein Wort? Welche Wörter gehören zu welcher Sprache? Was sind Zahlen? Wie werden Räuspern, Niesen, Lachen dargestellt? Hört man einem Telefonat einmal aufmerksam zu, wird schnell klar, welche Besonderheiten zu beachten sind.

Schon an dieser aufwändigen Basis kann man die Spreu vom Weizen – sprich gute Spracherkennungs-Software von schlechter trennen.

Wir alle arbeiten mit der Spracherkennungs-Software SIRI von Apple oder einer vergleichbaren Android- oder Windows-Software, um unser Smartphone zu steuern.

Doch Spracherkennung kann so viel mehr.

Wer seine Call Recordings effektiv nutzen will, der kann mit Spracherkennung tolle Ergebnisse erzielen, wenn diese in einen Dienst eingebunden ist, der die ermittelten Daten nach individuellen Vorgaben auswertet. Mit voiXen wandeln Sie Ihre aufgezeichneten Gespräche zunächst in Text um, der nun nach allen bekannten Regeln durchsuchbar, kategorisierbar und wiederauffindbar gemacht werden kann:

  • Wie häufig ist in letzter Zeit das Wort „Beschwerde“ gefallen?

  • Nach welchem Mitarbeiter wird besonders oft verlangt?

  • Welche meiner Agenten sagen immer „bitte“, „danke“ und „gerne“?

  • Finde alle Aufzeichnungen mit dem Gesprächsthema „Rechnung“.

  • Wie häufig hatten wir Anrufe, in denen beleidigende Worte gefallen sind?

Von Wem?

Eine gute Spracherkennung ermöglicht übrigens nicht nur das Finden einzelner Keywords. Oft ist es sinnvoll, Wortgruppen oder ganze Sätze zu finden und auszuwerten: Werden im Projekt vorgegebene Phrasen verwendet? Wie oft nicht? Wird das Wort „Rechtsanwalt“ im Kontext zu „Ich bin …“ oder zu „Sie hören von meinem …“ verwendet?

Versuchen Sie erst gar nicht, alle diese Informationen manuell aus einigen wenigen Stichproben Ihrer Gesprächsaufzeichnungen herauszufiltern. Es ist entweder nicht repräsentativ oder kostet Sie tausende Stunden Ihrer Zeit und der Ihrer Mitarbeiter und Qualitätsverantwortlichen. Sprache erkennen funktioniert in unserem Gehirn zwar immer noch am besten, dies ist aber leider auch an langwieriges und geduldiges Zuhören gebunden.

Versuchen Sie es mit voiXen. Wir bieten zahlreichen Features für Sie.

← Alle Features
Newsletter