Alexa – mehr als ein Hype? Ein Erfahrungsbericht

Alexa – mehr als ein Hype? Ein Erfahrungsbericht

Anfangs unterschätzt – Siri und Cortana waren weit bekannter –, beherrscht Alexa den US-Markt für Smart Speaker heute mit 70 Prozent Marktanteil. Wir werfen einen Blick auf die Praxistauglichkeit von Amazons sprachgesteuerter Assistentin. 

Auf der diesjährigen Consumer Electronics Show in Las Vegas prognostizierte der Veranstalter Consumer Technology Association (CTA) eine düstere Zukunft für heutige Benutzeroberflächen: Die Zukunft gehöre der Sprachsteuerung, auch wenn diese noch am Anfang stehe. Insbesondere die Sprachassistentin Alexa von Amazon ist nicht zuletzt durch die intensive Werbung im Fokus des öffentlichen Interesses. Für unseren R&D-Bereich Anlass, die Praxistauglichkeit von Alexa zu untersuchen.

Im Fokus unserer Untersuchung standen insbesondere vier Fragen:

  1. Entspricht die Kommunikations- und Sprachqualität immer noch mechanisch anmutenden Sprachrobotern oder ist ein Trend zu natürlich-sprachlicher Kommunikation festzustellen?
  2. Wie hoch ist die Weiterentwicklungsgeschwindigkeit der Alexa-Basistechnologie?
  3. Wie stark nimmt die Verbreitung Alexa-kompatibler Nutzungs- und Einsatzszenarien zu?
  4. Wie einfach ist es, eigene Alexa-kompatible Benutzerschnittstellen zu realisieren?

Wie ist die Usability von Alexa zu bewerten?

Generell entwickelt sich Alexa fortlaufend weiter, so dass es sich bei der Erstbewertung um eine Momentaufnahme handelt:

  • Kommunikations- und Sprachqualität
    Die Spracherkennungsfähigkeit bewerte ich positiv mit Potenzial nach oben. Aktuell führt die Spracherkennung bei akzentuierter, aber noch natürlicher Aussprache zu guten Ergebnissen. Die Sprachmelodie wirkt noch punktuell mechanisch, ist aber im Vergleich zu früheren Sprachassistenzsystemen deutlich verbessert.
  • Weiterentwicklungsgeschwindigkeit der Alexa-Basistechnologie
    Die Weiterentwicklungsrate ist derzeit sehr hoch: Im Mai 2017 wurde Alexa bspw. um die Möglichkeit des Flüsterns, der Anpassung der Betonung und Sprechgeschwindigkeit von Wörtern und Wortgruppen sowie um die Unterstützung von Lautschrift erweitert.
  • Nutzungs- und Einsatzszenarien
    Sehr positiv schätze ich die große Zahl von Skills ein, die in kurzer Zeit bereits entstanden sind. An dieser Stelle nur zwei Beispiele: So haben Anwender die Möglichkeit, sich eine tägliche Zusammenfassung aus unterschiedlichsten Informationsquellen zusammenzustellen. Im Interaktionsbereich gibt es neben Smart-Home-Unterstützung auch erste Prototypen – bspw. von BMW –, um dedizierte Funktionen des eigenen Autos über Alexa steuern zu können (dazu gehört die Abfrage, ob die Autotüren und der Kofferraum geschlossen sind und die Möglichkeit, diese andernfalls über Alexa zu schließen).

So funktioniert die Realisierung einer Alexa-Anwendung

Während die ersten drei Fragen weitgehend durch anwenderbezogene Tests bzw. durch eine Marktrecherche beantwortet werden konnten, ließ sich die vierte Frage nur durch eine eigene Pilotierung verifizieren. Als Beispiel diente eine Telefonnummernauskunft, die für einen Namen die zugehörigen Telefonnummern zurückliefert.

Wie fällt das Fazit aus? Kurzum, die Entwicklung eines Alexa-kompatiblen Frontends ist vergleichsweise einfach. Die Anwendung kann entweder mit node.js oder mit Java entwickelt und entweder direkt bei Amazon (über Amazon Lambda) oder auf einer eigenen Domäne betrieben werden. Eine so gebaute Anwendung wird im nächsten Schritt um die Sprachkommunikationsfähigkeit ergänzt – dies umfasst:

  • Definition von Sprachmustern (sogenannter Utterances) – dies sind Sprachfragmente, welche Alexa eine Zuordnung der gesprochenen Sprache zu der jeweiligen Funktion ermöglicht. Hierbei empfiehlt es sich, mehrere Varianten für den Nutzer anzubieten, um der Vielfalt der natürlichen Sprache gerecht zu werden. Mögliche Utterances sind in unserem Beispiel:
    • „Rufnummer für Person“
    • „Telefonnummer für Person“
    • „Rufnummer“
    • „Telefonnummer“
  • Definition der Begriffe, die verarbeitet werden sollen (sogenannte Slots). In unserem Beispiel könnten dies sein:
    • Vorname
    • Nachname
    • Anrede
    • Akademischer Titel
  • Aus der Kombination von Sprachmustern (Utterances) und Begriffen (Slots) wird die für Alexa relevante Sprachlogik generiert und wird Teil der eigenen Applikation (Skill).
  • Abschließend wird der Skill mit dem Amazon Alexa Wizard registriert – für eigene Tests steht der Skill nun auf den mit dem eigenen Namen registrierten Alexa-Endgeräten zur Verfügung. Darüber hinaus kann der Skill nach einem Amazon-Prüfungsprozess generell freigeschaltet werden.

Hype oder Disruption?

Als kritischer Erfolgsfaktor für einen Marktdurchbruch könnte sich die Verfügbarkeit von Alexa für den Endanwender herausstellen. Alexa ist kein Smartphone-Assistent wie Siri oder Cortana, das System ist speziell für Heimgeräte wie die Echo-Lautsprecher und die Fire-Fernbedienung konzipiert und spielt seine Stärken vor allem in der Unterstützung von Smart-Home-Geräten aus. Stand heute benötigt der Nutzer eine separate Hardware (am günstigsten ist der Echo Dot für ca. 60 Euro), um die Alexa-Dienste nutzen zu können. Die entscheidende Frage ist, ob es Amazon gelingt, eine vollständige Verfügbarkeit auf mobilen Endgeräten zu erreichen oder ob Alexa an die eigene Hardware bzw. die von Partnerunternehmen gebunden bleibt. Eine erste Option, Alexa außerhalb der eigenen vier Wände zu nutzen und zu steuern, bietet die Smartphone-App Reverb von Rain. Diese kann innerhalb kürzester Zeit erfolgreich mit Alexa verbunden werden.

Kann Alexa einen nachhaltigen Markterfolg verbuchen? Diese Entscheidung ist noch nicht gefallen. Für die Sprachkommunikation selbst gilt dieser Vorbehalt nicht: Sie wird in immer weitere Bereiche – sowohl im B2C als nachgelagert auch im B2B – vordringen. Ohne jedoch grafische Benutzeroberflächen vollständig verdrängen zu können. Alexa, Siri, Cortana? Welches der Sprachassistenzsysteme sich schlussendlich durchsetzen wird, bleibt eine spannende Frage, die wir hier im IT Management Blog in den nächsten Wochen noch weiter diskutieren werden.

 

Bildquelle: Shutterstock

Hinterlassen Sie eine Antwort

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.