15. August 2017

Das Wettrennen um das nächste Informationsmonopol

­


Ein Gastbeitrag von Frank2000

Fast unbemerkt von der Öffentlichkeit hat das Wettrennen um den neusten digitalen Markt begonnen: das Wettrennen um ein Produkt, das so neu ist, dass nicht mal ein Gattungsbegriff dafür existiert.
Oder wie heißen die Dinger, die aus einem Chip, einem Mikrofon, einem Lautsprecher und einer Internetverbindung bestehen? Irgendwas mit "Assistent" vermutlich. Abgeleitet von den "Sprachassistenten", die auf den Handys angeboten werden.
Welt online spricht von einem "Heimassistenten" [1] - technisch exakter würde man vielleicht von einem Assistenz-Computer sprechen. Letztlich muss man die Sprachassistenten auf den Handys und die Assistenz-Computer in einen Phänotyp zusammenfassen. Warum das so ist, begründe ich gleich - zunächst mal kurz aufgezählt, wer alles mitspielt:

  • Samsung: Bixby (nativ ab Galaxy S8) -> ersetzt irgendwann S Voice
  • Microsoft: Cortana (alle Geräte ab Windows 10)
  • Google: OK Google / Google Now (Google home / Google Assistant)
  • Amazon: Alexa (Echo / Dot)
  • Apple: Siri (alle Geräte ab iOS 9 / Siri Box / Siri HomePod)
  • Huawei: Name noch nicht bekannt
  • LG: QuickVoice

...um nur mal die größten Mitspieler zu nennen. Warum prügeln sich die mächtigsten Unternehmen der Welt um dieses Produkt? Dazu muss man zunächst verstehen, was dieser Produkttyp überhaupt tut.
Sprachasssistenten und Assistenz-Computer haben drei Anwendungsgebiete:

  1. Informationsrecherche = Interaktion mit frei verfügbaren digitalen Produkten
  2. Interaktion mit digitalen kostenpflichtigen Produkten
  3. Interaktion mit kostenpflichtiger Hardware



1. Informationsrecherche

Eine assistenzgestützte Informationsrecherche besteht aus drei Schritten:
1.1 Verstehen des Informationswunsches
1.2 Ermitteln einer Trefferliste
1.3 Auswahl eines Treffers und Übergabe nur noch dieses einzelnen Treffers an den Anwender

Schritt 1.1 kann nicht auf dem Assistenz-Computer selbst erfolgen. Damit sind die Assistenz-Computer etwas grundlegend anderes als die Sprachsteuerungen, die vor 20 Jahren schon zum Beispiel auf den Nokia-Handys existierten.
Die Sprachsteuerungen ermittelten nur eine Korrelation mit einem eingebauten Befehlssatz. Die Assistenz-Computer sollen dagegen jeden denkbaren Informationswunsch beantworten - das geht nur mit einer Interaktion mit dem Internet.
Wer also ein Problem damit hat, dass seine Informationsbedürfnisse im Internet landen, der ist bei einem Sprachassistenten bzw. Assistenz-Computer falsch. Denn der Informationswunsch wird zunächst an einen Server geschickt, der den Wunsch entschlüsselt.

Schritt 1.2 greift in irgendeiner Form auf Suchmaschinen zurück, die es auch wieder in verschiedensten Varianten gibt. Damit ist klar, dass OK google auch die google-Suchmaschine bemüht, während Cortana auf Bing setzt.

Dramatisch ist dann Schritt 1.3. Denn welcher Treffer wird letztlich als EINZIGES ERGEBNIS zurückgeliefert? Dazu eine Fangfrage: Welche Wetter-App ist die beste? Sehen das alle Smartphone-Nutzer gleich?
Man kann den gesellschaftlichen Effekt gar nicht hoch genug bewerten, wenn man darüber nachdenkt einen Informationsmechanismus zu installieren, der Konkurrenz per Definition ausschaltet, da bei jeder nur denkbaren Anfrage immer nur ein Ergebnis geliefert wird.
Schon hat die Welt vergessen, welchen Streit es um die Google Trefferliste gab [2] - und da wurden alle nur denkbaren Treffer auf 20 Ergebnisse reduziert (die Treffermenge der ersten Seite in der Voreinstellung). Jetzt soll die Ergebnismenge auf 1 reduziert werden... und niemanden scheint es zu stören.

Ein Vergleich einiger wichtiger Sprachassistenten 2015 [3] und 2017 [4] zeigt, dass die Reaktionsmöglichkeiten insgesamt noch eher schlecht sind. Um passende und effiziente Ergebnisse zu erhalten, muss der Anwender sich noch sehr stark auf den Assistenten einstellen und die Fragen bzw. Befehle entsprechend formulieren.
Es ist zu erwarten, dass die Gewinner dieses Wettbewerbs kontinuierlich besser werden - aber aus meiner Sicht ändert das nichts daran, dass auch die Anwender sich an dieses neue Produkt anpassen werden. Ob das immer wünschenswert ist, kann jeder für sich selbst beantworten.

2. Interaktion mit digitalen kostenpflichtigen Produkten

Die zur Zeit wichtigste Umsetzung dieses Anwendungsgebiets ist die Interaktion mit Musik-Abo-Diensten, zum Beispiel Spotify oder Deezer. Auch hier gibt es wieder "natürliche Allianzen", wie zum Beispiel Apple Music, das bei Siri bevorzugt wird. Hörbücher fallen auch in dieses Anwendungsgebiet sowie kostenpflichtige Radio- und Nachrichtensender.
Der wichtigste Punkt bei diesem Anwendungsgebiet ist, dass Zusatzkosten anfallen. Und zwar nicht zu knapp. Allein schon ein Musik-Abo kostet um die 10 Euro im Monat, also 120 Euro im Jahr. Damit bewegt sich die Werbung zum Beispiel für Amazon Echo hart an der Grenze zur Verbrauchertäuschung; da die Reaktion des Assistenz-Computers zum Beispiel auf den Sprachbefehl "Alexa, spiel was Neues von xy..." ein zusätzliches kostenpflichtiges Produkt voraussetzt. (Zur Zeit liefert Amazon ein Probe-Abo für Amazon Music mit.)
Zusätzlich schlägt auch hier (ähnlich wie bei Anwendungsgebiet 1) wieder das Problem zu, dass nur ein Produkt aktiviert wird - ein fliegender Wechsel (oder überhaupt ein Wechsel) zwischen zum Beispiel verschiedenen Musik-Abos oder die Nutzung sonst wie erworbener Musik kann einen spürbaren Aufwand bedeuten [5].
Nur der Vollständigkeit halber sei erwähnt, dass auch dieses Anwendungsgebiet nur mit einer Internetverbindung funktioniert - mit allen Konsequenzen für den Datenschutz.

3. Interaktion mit Hardware

Dieses Anwendungsgebiet ist interessant, weil es einen Verdrängungswettbewerb der besonderen Art einläutet. Die Gebäudeautomatisierung ist als Produktgruppe nämlich schon älter - allerdings vollständig OHNE Nutzung des Internet. Die Sprachassistenten und Assistenz-Computer werden, so meine Einschätzung, die lokale Gebäudeautomatisierung verdrängen.
Grundsätzlich benötigt man für dieses Anwendungsgebiet natürlich komplett neue Hardware: soll zum Beispiel die Beleuchtung automatisiert werden bzw. fernsteuerbar sein, dann muss die Lampe einen Funkempfänger haben (WLAN oder Internet). Und das kostet! Da liegt das Basispaket mit zwei Birnchen bei über 100 Euro und jedes Zusatzbirnchen bei mindestens 15 Euro. Soll es etwas auch nur minimal Ausgefallenes sein, dann werden nur für die Leuchtmittel im Haus über 1000 Euro fällig.

Bei diesem Anwendungsgebiet werden existierende Standards zum Datenschutz und zur persönlichen Verfügungsgewalt verloren gehen. Denn der ursprüngliche Ansatz zur privaten Gebäudeautomatisierung war eine lokale Kontrolle über das Gebäude: nur der Anwender vor Ort sollte die Verfügungsgewalt haben. Der Wechsel auf die Internet-basierten Sprachassistenten und Assistenz-Computer wird dazu führen, dass zumindest theoretisch andere Teilnehmer an der Verfügungsgewalt beteiligt sind.
So sind durchaus im Internet Beiträge zu Hue-Produkten finden, dass die eigenen Produkte nur noch eingeschränkt oder gar nicht mehr steuerbar waren, wenn ein Hue-Server ausgefallen war [6]. Darüber hinaus ist das auch eine ganz grundsätzliche Frage, ob ich -wenn auch zunächst nur theoretisch- anderen Teilnehmern die Möglichkeit einräumen will, absichtlich oder unabsichtlich auf meinen persönlichen Lebensbereich zuzugreifen.
Ich persönlich glaube allerdings, dass liberale Positionen dabei vollständig auf der Strecke bleiben werden. Bereits beim Produktwechsel von gedruckten Büchern zu digitalen Büchern hat es nur eine verschwindende Minderheit interessiert, dass damit die Verfügungsgewalt auf Dritte übergeht [7].




Jetzt beantworte ich die These, dass Sprachassistenten und Assistenz-Computer ein gemeinsamer Produktbereich sind: Ein Assistenz-Computer benötigt zwingend immer einen Sprachassistenten zur Funktionsfähigkeit und ersetzt letztlich nur das Handy als Hardware des Sprachassistenten.
Allerdings unterscheiden sich Sprachassistenten und Assistenz-Computer in einem wesentlichen Punkt: Assistenz-Computer sind letztlich dazu bestimmt, immer auf Empfang zu sein. Allein das sollte schon Bedenken gegen unerwünschte Mitschnitte auslösen (Hacking)? In den USA gab es bereits erste Anfragen der Polizei, die an den Server übertragene Audiospur als Beweismittel auszuwerten. Bisher wurden solche Anfragen wohl noch abgewehrt. [8]

Sprachassistenten haben in Deutschland eine durchaus beachtenswerte (zumindest gelegentliche) Nutzergruppe: [9]

  • Google now: 17 Millionen
  • Siri: 11 Millionen
  • Cortana: 7 Millionen

Und dabei ist Deutschland noch eher moderat. In Indien und China nutzen wohl schon über 50% der Smartphone-Nutzer zumindest gelegentlich einen Sprachassistenten. [10]

Auf solche Verkaufszahlen kommen die Assistenz-Computer wohl noch nicht. Für die USA habe ich eine Schätzung von 10 Millionen verkauften Amazon Echo gelesen. Wie glaubwürdig dieses Gerücht ist, kann ich nicht beurteilen.

Nachdem jetzt etwas klarer ist, um was für ein Produkt es geht, sollte auch das Interesse der Firmen an diesem Produkt klar sein.

A. Sprachassistenten und Assistenz-Computer werden die Wahrnehmung der Anwender wesentlich prägen. Wer kontrolliert, was die Anwender als einziges Ergebnis einer Suchanfrage geliefert bekommen, der kontrolliert das Wissen der Anwender.
B. Sprachassistenten und Assistenz-Computer bilden das Monopol für Koppelprodukte. So wie Microsoft Windows ein wesentlicher Erfolgsfaktor für Microsoft Office war (und dann auch umgekehrt), wird die Kontrolle über die Sprachassistenten und Assistenz-Computer auch die Kontrolle über viele gekoppelte digitale Produkte bedeuten.
C. Sprachassistenten und Assistenz-Computer sind ein Generalangriff auf das lukrative Zukunftsfeld der Gebäudeautomatisierung.

Etwas schwieriger ist die Frage zu beantworten, warum es zur Zeit überhaupt Kunden für dieses Produkt gibt. Immerhin 40% gaben 2016 in einer Umfrage an, sich den Erwerb eines Assistenz-Computers vorstellen zu können [11]. Dabei ist aus Sicht dieses Autors jeder nur denkbare Anwendungsfall mehr Spielerei als ernsthafte Anwendung:

Assistenz-Computer sind raumgebunden: was nützt mir ein solches Gerät im Schlafzimmer, wenn es im Wohnzimmer steht? Genau: gar nichts. Man müsste also alle hauptsächlich genutzten Räume mit solchen Geräten ausstatten - und jedesmal wieder Geld ausgeben. So ganz nebenbei gelten kostenpflichtige digitale Produkte teilweise auch nur für ein Gerät und nicht etwa für einen Account... so dass ebenfalls wieder die Kosten steigen [12].
Wenn man einen Sprachassistent bzw. Assistenz-Computer zur Informationsrecherche nutzt, dann besteht speziell in Deutschland noch das Problem der Lokalisierung im Raum: deutsche Informationsanforderungen werden signifikant schlechter beantwortet als englische. [13]
Dazu kommt, dass ein Assistenz-Computer für sich allein fast nutzlos ist. Ohne erhebliche weitere Investitionen kann so ein Produkt nicht mehr als ein Sprachassistent auf dem Handy. [14]
Und zu guter Letzt sind Sprachassistenten und Assistenz-Computer eine Lärmbelästigung. Spätestens dann, wenn die Nutzung noch weiter steigt.

Aber schon Dilbert hat die Frage beantwortet, wie technischer Fortschritt eigentlich zustande kommt... [15].

Wie auch immer man zu dieser technischen Revolution steht, die da sichtbar wird. Egal, ob man persönlich begeistert ist oder das ablehnt. Eins ist sicher: dieses Thema wird ohne Europa ausgehandelt. Wieder mal.


Frank2000




© Frank2000. Für Kommentare bitte hier klicken.