Stellen Sie sich vor, Sie fahren Auto und können Ihr Smartphone nicht benutzen. Doch Sie müssen unbedingt wissen, wann der nächste Marvel-Film herauskommt. Was tun Sie – genau wie 52 % der Menschen? Sie nutzen die Sprachsuche! Die Sprachsuche, auch bekannt als Voice-to-text-Suche, gilt als das nächste big Thing. Aber ist das wirklich so? Und ist das eine gute oder schlechte Nachricht?

Was ist Voice-to-text-Suche?

Der Name sagt es schon: Anstatt eine Tastatur für die Online-Suche zu verwenden, nutzen Sie Ihre Stimme. Doch dies ist nicht möglich ohne ein Programm oder einen praktischen Suchassistenten wie Google oder Alexa. Sie wandeln Ihre Stimme in Text um und verwenden diesen, um Ihre Anfrage zu bearbeiten. Eine Sprachsuche könnte folgendermaßen klingen: „Hey Google, was ist die Hauptstadt von Madagaskar?“

Nehmen die Nutzerzahlen der Voice-to-text-Suche zu?

Schauen wir uns einige Zahlen an. Eine Studie von Uberall ergab, dass 21 % der Menschen wöchentlich Sprachsuche nutzen. Eine Umfrage von HubSpot fand heraus, dass 74 % der Menschen innerhalb des letzten Monats Sprachsuche verwendet haben. Fast 50 % der Menschen recherchieren Produkte vor dem Kauf mittlerweile über Sprachsuche.

Angesichts dieser Zahlen lässt sich nicht leugnen, dass die Sprachsuche immer beliebter wird. Aber warum?

Warum nutzen Menschen zunehmend die Sprachsuche?

Offensichtlich ist viel dieser Zunahme auf Smart Devices wie Apples Siri, Amazons Alexa und Google zurückzuführen. Denn sie sind überall. Sie können mit Ihrem Smartphone, Laptop, Tablet, Auto, Lautsprecher, Thermostat und wahrscheinlich noch vielem mehr sprechen. Sicher, das konnten Sie auch schon vorher, aber jetzt verstehen diese Geräte tatsächlich, was Sie sagen. Mit der allgegenwärtigen Sprachsuche ist es leicht nachvollziehbar, warum Menschen anfangen, sie zu nutzen.

Ein weiterer Grund ist die Einfachheit. Wie wir festgestellt haben, ist die Sprachsuche fast immer greifbar. Und es ist viel schneller, eine Frage zu stellen, als einen Webbrowser oder eine App zu öffnen, Ihre Anfrage einzutippen, durch die Ergebnisse zu scrollen und dann eines auszuwählen, das gut klingt.

Besser und schlauer

Ja, wir sprechen wieder über KI. Da die Fähigkeiten des maschinellen Lernens besser sind, werden unsere Sprachassistenten im Laufe der Zeit intelligenter. Das bedeutet, je mehr Sie die Sprachsuche nutzen, desto besser wird sie Ihre Präferenzen verstehen und Ihnen die gewünschte Antwort liefern.

Eine zugängliche Option

Bessere Voice-to-text-Geräte bedeuten auch mehr Unabhängigkeit für Menschen mit Behinderungen, die keine Tastatur oder einen Touchscreen verwenden können. Aufgaben, die vielleicht schwierig oder unmöglich waren, sind jetzt plötzlich mit Hilfe von Google, Siri oder Alexa möglich. Das ist großartige Neuigkeiten.

Doch damit nicht genug. Voice-to-text-Geräte können auch Menschen mit Sehbehinderungen helfen, da ein Sprachassistent eine Webseite, einen Blogpost oder eine E-Mail laut vorlesen kann. Und sie sind auch nützlich für Menschen mit Hörbehinderungen. Bei einem Meeting kann ein Sprachassistent das Gesagte in Text umwandeln.

Die Probleme mit der Sprachsuche

Alles gut also? Nun, nicht ganz. Probleme treten auf, wenn wir die Sprache betrachten. Die meisten Sprachassistenten sind in Englisch hervorragend ausgebildet, was kein Problem sein sollte, da ja jeder Englisch spricht, oder? Falsch. 75 % der Menschen in der Welt sprechen überhaupt kein Englisch. Wie nützlich sind diese Sprachassistenten also?

Davon abgesehen, dass von diesen 25 %, die Englisch sprechen, nur 6 % Muttersprachler sind. Das bedeutet, dass 19 % der Menschen wahrscheinlich einen englischen Akzent haben oder mit bestimmten englischen Phrasen, Redewendungen oder Metaphern nicht vertraut sind. Und da Sprachassistenten stark auf natürliche Sprachverarbeitung und maschinelles Lernen angewiesen sind, bedeutet dies, dass diese 19 % der Menschen Schwierigkeiten haben werden, Voice-to-text-Geräte zu nutzen.

*Während Google mit mehr als 40 verfügbaren Sprachen für ihre Sprachsuche voranschreitet, spricht Siri nur 21 Sprachen und Alexa nur acht.

Unabhängig oder abhängig?

Während Sprachassistenten Menschen mit Behinderungen zu mehr Unabhängigkeit verhelfen können, könnte es bei anderen Menschen den gegenteiligen Effekt haben. Denn die ausschließliche Nutzung der Sprachsuche hat ihre Grenzen. Sprachsuche liefert Ihnen eine Antwort. In der Regel die, die ganz oben in den Suchergebnissen steht. Nun wissen wir, dass Googles „Helpful Content“-Update dafür sorgt, dass die obersten Ergebnisse hilfreich sind, aber es ist nicht 100 % zuverlässig. Und wenn wir uns die heutigen Top-Ergebnisse anschauen, sehen wir … Werbung.

Wenn Menschen nur und unhinterfragt Sprachsuche nutzen (weil es so einfach ist), lernen sie nur eine Antwort und eine Erzählung kennen. Und dieses Szenario ist nicht weit hergeholt. Bereits jetzt nutzen Menschen ChatGPT, um ihre Fragen zu beantworten, ohne zu überprüfen, ob die Antworten tatsächlich korrekt sind.

Hey Google, bist du voreingenommen?

Erinnern Sie sich an diese 6 % der Menschen, die englische Muttersprachler sind? Es stellt sich heraus, dass Sie der richtige englische Sprecher sein müssen, damit bestimmte Smart-Geräte Sie verstehen. Wenn Sie aus dem Vereinigten Königreich oder Irland kommen, stehen die Chancen gut, dass Ihr Gerät Sie nicht versteht.

Darüber hinaus haben Smart-Geräte Probleme, Eingaben von Menschen zu verstehen, die keine weißen Männer sind. Wie bei der Gesichtserkennung funktioniert auch die Spracherkennung schlechter bei Frauen und BIPOC-Personen. Und obwohl dies vielleicht nicht beabsichtigt ist, ist es dennoch problematisch.

Was haben die Sprachassistenten gemeinsam?

Um weiter in die Vorurteile der Sprachassistenten einzutauchen, können wir nicht ignorieren, dass die Mehrheit von ihnen standardmäßig Frauen sind. Und das, wie die UNESCO in ihrem Bericht so treffend sagt: „sendet das Signal, dass Frauen gefügige, duldsame und eifrige Helferinnen sind, die auf Knopfdruck oder mit einem groben Sprachbefehl wie ‚hey‘ oder ‚OK‘ zur Verfügung stehen. Die Assistentin hat keine Handlungsmacht über das hinaus, was der Befehlende von ihr verlangt… In vielen Gemeinschaften verstärkt dies die allgemein verbreiteten Geschlechtervorurteile, dass Frauen unterwürfig und tolerant gegenüber schlechter Behandlung sind.“

Viel Potenzial und viel Arbeit

Zusammenfassend lässt sich sagen: Voice-to-text-Suche klingt in der Theorie großartig, ist in der Praxis aber noch nicht ganz ausgereift. Geräte, die Sprachsuche unterstützen, müssen andere Sprachen hinzufügen und verbessern sowie ihre Vorurteile ablegen. Denn wenn ich online suche (wenn es überhaupt für meine Stimme funktioniert), möchte ich die Wahrheit wissen; nicht nur das, was für eine Gruppe von Menschen wahr ist.